学科分类
/ 1
2 个结果
  • 简介:清光绪年间佚名所著《声均》分古韵十九部,并证以谐声及群经押韵。其古韵分部虽未达到同代学者应有水平,但其对冬部、月物部、文部、元部、阳部声符的处理都值得称道,如文部声符已非常接近王力。此外作者亦将质部独立、东冬部分立、侯部配有入声、从脂微部中独立出月物部。《声均》的发现,丰富了清代古音学的内容。

  • 标签: 《声均表》 古韵分部 光绪年间
  • 简介:汉语分词是中文信息处理的一项基础性工作。为避免人工阅读或机器处理时的分词歧义和未登录词难以识别的问题,有专家建议写作时在汉语词之间添加空格。文章从语言学本体研究、语言使用以及语言工程等不同角度对传统观念下的汉语分词存在的困难进行探讨,指出汉语分词在词的定义、群众语感以及分词规范、词表确定及工程应用等方面都存在不确定及不一致等因素。近年汉语自动分词处理不纠缠于词的确切定义,以字组词,针对标注语料和网络上带有丰富结构信息的海量文本,利用机器学习方法对汉语“切分单位”的标注取得了较好的进展。针对基础性的汉语分词规范,从语言规划的政策性、科学性及引导性角度提出建议,最后指出结合语言学指导和数据驱动的机器学习策略,可望为实现汉语自动分词的准确性和适应性提升服务。

  • 标签: 汉语分词 词间空格 分词标准 中文信息处理 语言规划