学科分类
/ 25
500 个结果
  • 简介:目前大多数自动标引方法不能有效利用文本中包含的多个特征。而支持向量机、条件随机场模型等统计机器学习模型能够有效利用文本包含的多种特征进行关键词提取。同时,由于各种自动标引模型性能各异,综合利用各种模型进行集成学习方式的自动标引,能够提高自动标引的质量。为了进一步提高自动标引的质量,本文试图整合统计机器学习模型与集成学习方法的优势,对文档进行基于多分类模型综合投票方式的自动标引。实验结果表明,基于集成学习方法的自动标引能提高标引结果的查准率和召回率。另外,集成学习标引模型中,基分类器加权的标引结果,优于基分类器未加权的标引结果。

  • 标签: 自动标引 关键词提取 集成学习
  • 简介:黄页分类工作是电话号码簿编辑的主要工作之一。黄页公司一直致力于探索运用计算机技术对黄页数据分类进行自动标引。1998年开始进行人机对话的计算机自动切分工作,现切分结果的正确率达到了60%以上,标引速度达到了每小时1200条。

  • 标签: 黄页分类 电话号码簿 自动标引 计算机
  • 简介:本文叙述了目前人们可以通过网络数据库实现全文检索的情况下,自动标引的重要性,它可以针对海量信息进行检索和挖掘,可以把人类的思维同计算机技术相结合,使检索信息更完整、全面。

  • 标签: 中文数据库 索引 自动标引
  • 简介:上位词标行与靠词标行是主题标行中的两种标行方法,要研究这两种标行方法,得先从主题标行中的选词规则谈起。把文献主题中的概念因素转换成主题词,必须要恰当、准确地反映出文献主题。然而并不是每一个文献主题的概念因素都可从主题词表中找到确切的表达形式的,于是,就产生了主题标行中应遵循的选词规则:

  • 标签: 靠词标引 上位词 概念因素 文献主题 上位主题词 主题词表
  • 简介:当前,自然科学和社会科学的彼此交叉渗透,边缘学科、横断学科、综合性学科的不断涌现,赋予图书文献以极其复杂的内容,加深了文献标引的难度。传统的分类法(体系分类法)和传统的主题法(标题法)已难以适应这种变化发展的需要。

  • 标签: 主题标引 分类标引 分面分类法 横断学科 单元词 分类体系
  • 简介:由于《中国图书馆分类法》的类目数目庞大和文献在各类目上分布的不均衡,导致基于机器统计学习的自动分类技术在此类多层分类上的力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过两种分类技术相结合的方法对信息资源进行分类,提出了用相关度度量来测定关键词和类目概念之间的关联,构建关键词、分类号、归属度三元组矩阵的方法进行分类匹配,并在小规模的测试集上得到了较好的效果。本文详细讨论此种分类器的构建原理、构建方法以及分类流程,并对该方法存在的不足进行了分析。

  • 标签: 《中国图书馆分类法》 分类矩阵 自动分类
  • 简介:关键词是科技论文的文献检索标识,是表达文献主题概念的自然语言词汇。科技论文的关键词是从其题名、层次标题和正文中选出来的,能反映论文主题概念的词或词组。

  • 标签: 关键词 标引 科技论文 文献检索 主题概念 自然语言
  • 简介:档案标引是档案管理和开发利用的重要手段,对档案的收集、整理、鉴定、开发利用尤其是现代化管理具有直接的影响。但是在实际工作中,常常会因为档案数量大、内容复杂而引起标引误差,如错标、漏标、标引深度不当等等,这都会影响检索的效率。本文就影响档案标引质量的重要指标——档案标引深度的影响因素和控制方法进行探讨。

  • 标签: 标引深度 现代化管理 档案管理 档案标引 实际工作 档案数量
  • 简介:“关键词”是科技论文的文献检索标识,是表达文献主题概念的自然语言词汇。科技论文的关键词是从其题名、层次标题和正文中选出来的,能反映论文主题概念的词或词组。

  • 标签: 关键词 标引 科技论文 文献检索 主题概念 自然语言
  • 简介:关键词是科技论文的文献检索标识,是表达文献主题概念的自然语言词汇。科技论文的关键词是从其题名、层次标题和正文中选出来的,能反映论文主题概念的词或词组。

  • 标签: 关键词 标引 科技论文 文献检索 主题概念 自然语言
  • 简介:关键词是科技论文的文献检索标识,是表达文献主题概念的自然语言词汇。科技论文的关键词是从其题名、层次标题和正文中选出来的,能反映论文主题概念的词或词组。

  • 标签: 关键词 标引 科技论文 文献检索 主题概念 自然语言
  • 简介:

  • 标签:
  • 简介:

  • 标签:
  • 简介:本文分析了丛书的特点与分编中存在的问题,以及读者检索利用丛书造成的不便,并提出了科学合理的丛书分编方法。

  • 标签: 丛书 分编方法 特点 分类标引 著录
  • 简介:在文献信息工作中,文献标引是实现文献存贮和文献检索的重要手段。而文献标引学则是研究文献标引语言及其发展规律的一门新学科。它是信息时代的产物,是分类法语言与主题法语言相互渗透的必然结果,是分类标引工作与主题标引工作理论与实践相结合的总结和概括。

  • 标签: 文献标引 标引语言 文献检索 分类法 标引工作 新学科
  • 简介:目标的作用是引领,确立教学目标是教学的首要和中心工作,但这一过程常被忽略和简化。如何从当前教学目标虚空的现象中走出来,让精细目标、精当目标、精确目标引领课堂教学,促进课堂实效的提升应成为教学新的关注点。

  • 标签: 教学目标 策略调整
  • 简介:随着计算机技术被引进到民国档案工作中,以期实现快速、准确的机检,对民国档案进行著录标引就成了民国档案工作者的共识和一致行动。早在八十年代,全国各级档案馆便先后开展了这项工作,并取得了可喜的成绩,但和我们的目标———真正建立健全我国统一的民国档案检索系统仍有相当的距离。而要实现这一目标,仍有许多问题值得我们深入研究,进一步总结经验教训,以调整、改进原有的工作方法。关于民国档案著录项目的认识就是其中问题之一,笔者拟就民国档案著录项目相互间关系及其对民国档案著录标引的影响作如下探讨。所谓著录项目是揭示档案内容和形式特征的记录事项,它构成检索条目的内容,是为满足计算机检索系统一次输入,多种输出的要求,

  • 标签: 民国档案 著录项目 著录单元 著录标引 著录细则 主题标引