简介:中文姓名的辨识是自动分词、自动文摘的基础.独立于自动分词,我们运用姓名用字概率和规则,设计并实现了一个中文姓名辨识系统.对207757字语料进行了测试,召回率达到92.57%,精确率达到80.35%,且速度较快.
简介:空语类的分布和解读受制于各种不同的规则,但规则的交互作用导致某些空位置不能接受语言理论允许的任何空语类,因此我们得承认某些空位置是连空语类都不存在的。这种空位置(真空位)的分布和解读的研究能使我们对文献中汉语空语类的几个主要分析法所遗留的问题提出比较妥帖的解决办法,从而对语法和语用如何影响空成分的解读能有进一步的了解。
简介:中国现代文学研究中的史料热已经热了不少年,至今热力不减。韩晗的这本书也是着意在此用力。他从现代文学目前最为多见的三种研究方式——“通史研究法”、“作家作品研究法”和“理论前置研究法”存在的弊病人手,紧跟“重新回到历史现场”的以史料学为核心的现代文学史研究新范式的热潮,通过建构“群像式”现代文学史料研究,开垦出一块块学术的“处女地”。
基于统计和规则的中文姓名自动辨识
空语类理论和汉语空语类的辨识与指称研究
也是一种叙述——评韩晗《可叙述的现代性——期刊史料、大众传播与中国现代文学体质(1919--1949)》