简介:数据挖掘技术能够帮助我们从规模庞大、内容纷繁的文本数据中准确、高效地提炼出研究者难以通过遍览有效捕捉的隐含信息或趋势。其中,词频统计帮助我们获取分析对象的词汇总量、高频词汇以及词汇构成等信息,并据此对文体特征进行较为准确的判断。词表比对揭示了对象文本的叙事方式、所含关键人物、场所和物品等。词语共现网络使我们能够直观地观察到文本中的高频人物、组织等,并揭示这些热词之间的潜在联系,从而快速构建热点事件的基本框架。而通过计算共现强度,我们可以轻松、准确地挖掘出与特定关键词关系密切的共现词,从而有效捕捉与之相关的热点话题和媒体动向。
简介:摘要隐喻不仅是一种语言现象,更是人类一种不可或缺的概念系统和思维认知方式。本篇论文以概念隐喻理论为基础,对2016年中国政府工作报告中隐含的概念隐喻进行全面的分析。
简介:摘要本文以泰国政法大学中文专业四年级学生的写作课作业为语料,通过对泰国学生习得汉语情态补语的常见问题进行描述,进行偏误分析,并探讨产生偏误的原因,发现泰国学生习得情态补语时常见的偏误类型有四种,造成偏误的原因有两方面,一是泰语母语的干扰;二是来自于汉语内部结构的干扰。