简介:目前大多数自动标引方法不能有效利用文本中包含的多个特征。而支持向量机、条件随机场模型等统计机器学习模型能够有效利用文本包含的多种特征进行关键词提取。同时,由于各种自动标引模型性能各异,综合利用各种模型进行集成学习方式的自动标引,能够提高自动标引的质量。为了进一步提高自动标引的质量,本文试图整合统计机器学习模型与集成学习方法的优势,对文档进行基于多分类模型综合投票方式的自动标引。实验结果表明,基于集成学习方法的自动标引能提高标引结果的查准率和召回率。另外,集成学习标引模型中,基分类器加权的标引结果,优于基分类器未加权的标引结果。
简介:从1984年起,广西大学古籍整理研究室(后改为研究所)开始编制《古今图书集成索引》。经过二十多年的努力,取得了油印本、印刷本、电子版、网络版等阶段性成果。
简介:一、研究成果的主要内容本项目的成果是电子版《古今图书集成索引》2.0版,刻在一张CD—ROM上。
简介:阐述清初谭吉璁与《肃松录》、《丛书集成三编》与《肃松录》和《嘉兴谭氏遗书》与《肃松录》的内在联系,对难见《肃松录》原本的原因进行推断。
简介:文章分析了数据库备份的重要性,介绍了两种自动备份SQLServer数据库的方法,并提供了两种异机存放备份文件的具体方案。
简介:网络谣言具有传播速度快、影响范围广、扩散方式多、隐蔽性强、危害性大等特点,给个人、企业乃至社会造成诸多不良后果。政府应当加强网络技术监测,推行网络实名制,将谣言控制在萌芽之中;加大信息公开力度,建立网上辟谣机制,使谣言暴露在阳光之下;注重教育与引导,强化规范与监管,让谣言无立足之地。
简介:在分析图书馆运行机制及其业务过程的基础上,运用管理学理论和方法,提出图书馆关系管理的概念,建立相应的结构模型,介绍其主要功能,论述了实施图书馆关系管理及其过程控制的作用和意义,认为这有助于提高图书馆工作绩效,增强其在网络环境下的适应能力。
简介:图书馆的馆藏书目数据库建设的好坏在于数据的质量,文章提出几点控制书目数据著录及录入质量的对策,即书目数据著录标准化控制;书目数据录入质量控制;注意反馈收集信息,做好数据校对工作.
简介:针对当前不少高等学校内部文献信息资源书目控制系统不完善的现状,提出强化局部书目控制的措施,对高校内部实现文献信息资源共享具有现实意义.
简介:文章对"书目控制(BC)"和"书目控制论(BCT)"两个概念进行了辨析,并进一步阐述了书目控制概念的内涵与外延将随着社会的发展、科技的进步不断扩展.
简介:通过对《中国近代疾病社会史》(1912-1937)人名索引中出现的差错分析,谈及书后索引的质量控制问题。建议开展我国学术著作书后索引普查、评价和评奖工作,促进我国学术著作书后索引的普及和发展。
基于集成学习的自动标引方法研究
《古今图书集成索引》网络版推出
电子版《古今图书集成索引》2.0版简介
《丛书集成三编》之《肃松录》版本举正
图书馆集成系统数据库的自动备份与异机备份
网络谣言的传播特性与控制策略
图书馆关系管理及其业务过程控制
谈谈书目数据著录标准化及录入质量控制
强化局部书目控制,实现高校内部文献信息资源共享
关于书目控制的概念、定义与功能——与曹文娟女士商榷
学术著作书后索引质量控制刍议——兼评《中国近代疾病社会史(1912-1937)〈人名索引〉》