基于马尔可夫模型的语言发展趋势预测

(整期优先)网络出版时间:2019-06-16
/ 1

基于马尔可夫模型的语言发展趋势预测

张浩1姜晓丽1朱英豪2

(1.华北理工大学建筑工程学院,河北唐山063210;2.华北理工大学以升教育创新基地,河北唐山063210)

摘要:为了预测世界语言发展趋势,将语言使用者分为两个部分来分别预测其数量。对于母语使用者,根据语言区域的自然增长率和净移民率计算出随时间变化的母语使用者的人数。对于第二或第三语言使用者,将影响使用者人数的三种因子归一化处理,利用层次分析法赋予相应的权重后得到各种语言的发展强度数值。建立马尔可夫预测模型模拟若干年后的第二或第三语言使用者数量,并模拟50年内排名前十四的语言的母语使用者数量的变化趋势。

关键词:层次分析法;马尔可夫模型;聚类分析;语言使用者

人类不仅仅只掌握母语这一种语言,越来越多的人开始说第二语言甚至第三语言。在考虑某种语言的总使用人数时,需要在母语使用者人数的基础上加上第二或者第三语言使用者人数。根据可能影响语言的使用的因素,模拟各种语言的使用者随时间变化的分布。建立模型预测在未来50年里,英语的母语使用者的数量和语言的总使用者的数量的变化,并考虑它们是否会被另一种语言替代。

1.模型假设

●忽略小概率灭绝事件,比如重大自然灾害的影响导致某一语言的灭绝等。

●在几十年的时间里,各个语言区域都是稳定的发展,不会出现特别大的起伏的情况。

●假设每个国家的移民一旦定居,他们的子孙都以此国家的官方语言为母语。

2.数量预测模型

对于语言使用者数量的预测,我们需要将其分为母语使用者和其它的语言使用者(包括第二和第三语言使用者)两个方向来调查。

2.1母语使用者

针对国家而言,母语使用者人数与该国家的居民人数直接相关。根据该国家的移民率,我们可以得到母语使用者人数随时间的变化为:

2.2总使用者

对于一种语言的总使用者人数,我们需要全面考虑它的变化,不仅仅考虑语言区域居民人数的增加或者减少,还需要考虑其它的语言使用者的变化。上文我们已经得知母语使用者的数量随时间的变化,下面我们将解决其它的语言使用者的预测问题。

2.2.1三种影响因子

根据上文可得,我们将影响语言发展的因素分为区域的综合实力、商业往来和旅游业的发展状况三个部分。针对这三个部分,我们选取三个指标作为影响因子,分别是区域人均GDP、区域贸易对GDP的贡献度、区域国际游客数量。[1~2]

为进行统一,我们将十种语言的三种影响因子均除以该影响因子中的最大值。将得到的新结果运用层次分析法构造判断矩阵,得出三种影响因子的权重向量分别为0.545、0.272、0.183。我们可以得到关于语言发展强度的方程:

2.2.2马尔科夫模型

以其亲代的第二语言作为他的初始状态,余下的九种语言是另外的九种状态,建立马尔科夫预测模型[3]。然后基于语言的发展强度,根据两种语言之间的强度比值来确定一个人的语言从一种状态转移到另一种状态的概率值。定义世界十大母语依次用数字0-9表示其语言状态,由此计算状态转移矩阵。

2.3模型的应用

2.3.1英语的语言使用者

我们搜集到英语语言区域的平均自然增长率和平均净移民率[4]分别为1.04和0.0039,根据公式1我们可以求解得出英语的母语使用者在五十年以后的数量为:

(4)

参考文献

[1]AgataLeszczuk,ArkadiuszKozioł,EwaSzczuka,ArturZdunek.AnalysisofAGPcontributiontothedynamicassemblyandmechanicalpropertiesofcellwallduringpollentubegrowth[J].PlantScience,2019.

[2]钟华丽,古晓彤,唐斌.集团财务公司客户贡献度分析模型研究[J].环渤海经济瞭望,2018(12):170.

[3]贾哲,郭庆军,郝倩雯.基于Elman-马尔科夫模型的深基坑变形预测[J].人民长江,2019,50(01):202-206+219.

[4]王德劲.人才外流促进人力资本积累[J].科研管理,2011,32(11):107-114.

作者简介:张浩(1999-),女,本科生,主要从事物流工程研究;姜晓丽(1997-),女,本科生,主要从事给排水科学与工程研究;朱英豪(1998-),男,本科生,主要从事电子信息工程研究。