基于聚类和主成分分析我国部分地区1987年的经济状况

(整期优先)网络出版时间:2018-06-16
/ 2

基于聚类和主成分分析我国部分地区1987年的经济状况

韩娜

韩娜

西北师范大学经济学院甘肃兰州730070

摘要:随着社会的发展,中国经济发展水平的快速提升,各地区经济发展水平仍存在差异,这对当今社会全面小康的目标造成阻碍,为分析具体情况,现通过聚类分析、判别分析、主成分分析和因子分析对安徽、贵州、海南、河南、吉林、江苏、辽宁、内蒙古、山西、陕西省份的影响经济水平的11个指标进行聚类、判别以及分析,得出产生差异的原因,为经济平稳快速发展提供建议

关键词:经济状况分析;聚类分析;主成分分析

一、引言

在日常生活学习中,经常会遇到一些计算量庞大,分析工作复杂度高的数据分析工作,为了能够更加简便地进行数据分析,在此介绍聚类分析、判别分析、因子分析和主成分分析四种多元统计分析的方法。本文将通过这四种方法对中国31个省份部分地区的经济指标进行分析。首先,根据聚类的结果建立判别函数,同时运用判别分析将各个省份归类。应用主成分分析的方法对众多指标做降维处理,并赋予各主成分以实际意义以获取综合性指标;进而,基于主成分分析结果通过聚类分析法把10个地区分类。

二、指标的选取

选取指标时,主要考虑了这些指标足够从不同侧面反映经济综合能力的特征,且统计数据可靠,计算口径一致,这样每个指标都可横向比较。因此,本次研究共选择了十一项指标,它们分别是:

gdp:地区生产总值ttpop:年底总人口(万人)

gdpper:人均地区生产总值expendit:最终消费支出

var108:铁路营业里程(公里)var110:公路里程(公里)

var136:进出口总额(美元)var139:实际利用外商投资额

var153:各项存款合计var156:各项贷款合计

var168:每万人在校大学生数(人)

三、聚类分析

聚类分析是将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更强。其目的在于是类内对象的同质性最大化和类间对象的异质性最大化。

系统聚类是聚类分析的一种,其基本思想是:先将个样品各看成一类,然后规定类与类之间的距离,选择距离最小的一对合并成新的一类,计算新类与其他类之间的距离,再将距离最近的两类合并,这样每次减少一类,直至所有的样品合为一类为止。

上图是树状聚类图,也叫谱系图,从图中可以由分类个数得到分类情况。选择分类数为3,从距离大概为10的地方往下切,得到分类的结果如下{1:贵州、山西、安徽、吉林、陕西、内蒙古、河南};{2:海南};{3:江苏、辽宁}。我们可以从经济发展水平及对外发展情况来理解所做的分类。

四、主成分分析

主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,I个变量就有I个主成分。在用主成分分析法进行因子求解时,最多可以得到与测度项个数一样多的因子,如果保留所有的因子,就起不到降维的目的了,但是知道因子的大小排列,可以对它们进行舍取。在一般的行为研究中,常常用到的判断方法有两个:特征根大于1法与碎石坡法。

主要选取所给数据中的全部11个变量,并通过主成分分析来进行降维,达到简化目的。

主成分的经济意义由各线性组合中权数较大的几个指标的综合意义来确定,综合因子y1中gdp,var136,var153,var156的系数远大于其它变量的系数,所以y1主要是由地区生产总值、进出口总额(美元)、各项存款合计、各项贷款合计四个指标综合反映,因此y1来评价地区经济水平已有58.174%的把握,较y2,y3的方差百分比更高,所以这4项指标是主要指标。

五、总结

通过以上聚类分析和主成分分析方法,对1987年影响我国11个省、市、自治区经济发展水平的11项指标进行了深入分析,由此我们可以得出以下结论:

第一,我国自建国以来便出现了南北分化,东西部经济发展不均匀现象,地区经济发展存在严重的区域不平衡现象。我国南方地理位置优越、资源丰富、交通便利、出于经济发展中心,尤其是东南沿海地区,不仅具有得天独厚的地理环境优势,最主要的是位于我国与外界发达地区交通要塞,最大限度的阻断了先进技术和高精尖人才进入内地及西北大部分地区。这些条件使得东南沿海地区经济发展加快,工业和第三产业高速发展,进而使得地区生产总值快速增长,始终处在我国经济发展前列。因此,在今后的经济发展中,国家应该将更多的目光投入到我国欠发达的西北部和少数中部地区,加强对欠发达地区的财政支持和政策扶持力度,尽快通过提高西北地区经济发展水平,缩小国内地区差异,同时也能减少地区经济发展水平冲突,最终加快中国社会主义和谐社会的构建进程和全民小康这一目标的实现。

参考文献:

[1]中国国家统计局.中国统计年鉴.2010.

[2]应用多元统计分析.傅德印主编.高等教育出版社.

[3]何晓群.多元统计分析.北京:中国人民大学出版社.2015年04月01日第四版

[4]郭晓霞.几种多元统计分析方法的研究及其简单应用[D].杭州电子科技大学.2015.

[5]欧玲.中国地区经济差异的动态变化及影响因素分析[D].湖南大学.2011