基于多元分析的高等教育系统评价

(整期优先)网络出版时间:2021-04-15
/ 2


基于多元分析的高等教育系统评价

杨华

陕西理工大学物理与电信工程学院 陕西省汉中市 723001


摘要:本文为不同国家的高等教育体系评估提供了一个完整可行的方案.我们的模型有能力评估任何国家高等教育系统的健康状况和相应的综合得分。我们首先筛选出12个用于评价不同国家高等教育体系的指标,然后对指标数据进行量化处理.接下来,我们设计了一个包含两个子模型的评估系统来评估任何国家的高等教育系统的健康状况,结合未纳入范围的其他不确定因素,得出该模型在具体实践过程中面临的挑战和障碍。

关键词:聚类分析;PCA


  1. 引言

高等教育是培养高级专门人才和专业人才的主要社会活动。放眼世界,从德国到美国,从日本到澳大利亚,我们看到各个国家的高等教育方式,不仅教育自己的学生,而且每年都吸引大量的国际学生。在当前的世界形势下,各国应该深刻认识到自己教育体系的优缺点,然后相互学习,建立一个更加健康和可持续的体系,以推动自己的发展走向更高的水平。本文开发和验证一个模型或一套模型,使你能够评估任何国家的高等教育系统的健康状况。

  1. 聚类分析模型

聚类分析(Cluster Analysis),又称为分组分析,是对多个样本(或指标)进行定量分类的多元统计分析方法。从定量的角度来看,它有助于给事物一个更准确的分类标准.根据分类对象的不同,可以分为Q型聚类和R型聚类两种。

    1. q型集群

  • 样本相似性测量:

ω为样本点集,距离dω×ω→R+满足条件的函数:

6077f03957320_html_603e2bfae7b2fc06.png (1)

当q = 2时,我们得到欧氏距离公式:

6077f03957320_html_3c1d21176dda516.png (2)

  • 类别之间的相似性度量:

如果有两个样本类G1和G2,可以使用以下方法测量它们之间的距离:

  1. 最近邻法或单一连锁法:

D (G1,G2) = xmin {d(xi,yj)} (3)

  1. 分组平均法:

D (G1,G6077f03957320_html_72e387f3e54878e7.png (xi,xj) (4)

它的直观含义是两个类中最近的两点之间的距离.事实上,如果G1的内点和G2的点之间的距离很小,那么它们可以很好地组合在一起。

      1. 样本聚类

  • 首先,我们对来自27个国家的12个不同指标进行了Q型聚类分析,选择欧氏距离作为距离参数,如公式(2)所示.分析步骤可以表示为如下流程,如图1所示:

6077f03957320_html_68bce61fae5619b1.gif

图1: Q型集群算法流程及其结果

  • 然后,根据多重聚类分析的结果并结合具体问题.我们最终确定将这些国家分为四级教育,聚类后导出树形图。该过程由MATLAB实现.如图2所示

  • 结果显示,这四个群组代表以下国家:

    1. :美国(18)和英国(26);

    2. :马来西亚(9)和以色列(14);

    3. :日本(10)、比利时(15)和新加坡(21);四:其他国家。

这样就可以对这些国家的高等教育水平有一个整体的控制,通过初步的聚类可以将教育水平相近的样本从混沌变量中分离出来,为我们进一步的深入分析和评价打下良好的基础。

    1. r型集群

从上面的Q型聚类可以看出,前三类样本的区分度很好,但是第四类样本太大,对我们的评价极为不利.对上述12个指标的定性检查表明,一些指标之间可能有很强的相关性.在查看看到这个思路,可以计算这些指标之间的相关系数,然后选择几个有代表性的指标进行聚类分析。

在确定变量之间的相似性时,我们通常使用“相关系数法”来衡量,其定义如下:

6077f03957320_html_1ce7bc4bc86324e8.png (5)

在求解rjk之前,变量矩阵X必须标准化。加工方法如下:

6077f03957320_html_50841ec9694d435a.png (6)

上式中,xj、sj为矩阵x各列的均值和标准差。因此,R型聚类分析可以通过以下步骤实现:

  • 首先,对每个变量(指标)的数据进行标准化。

  • 然后用相关系数来度量变量之间的相似度,用类平均(4)来计算类之间的相似度。

  • 给出了指标聚类的结果,筛选出相关性强的指标,简化了模型。

    1. 模型结果

可以看出,一些指标之间确实有很强的相关性。

基于聚类结果,可以看出x1、x2、x4、x5和x6之间存在显著的相关性.x3和x8有很强的相关性,x10和x11也有很强的相关性.这样,从12个指标中选出6个指标作为下面分析的基础.这六个新的指标可以形成一个向量空间,如下所示:

X 6077f03957320_html_964e33c7467cf15f.png (7)

    1. 优点和缺点

优点:聚类分析模型的优点是直观,结论形式简洁.从大量的信息中很容易快速得到关键点。

缺陷:当样本量较大时,很难得到聚类结论.因为相似系数是根据参与者的反应来反映参与者之间的内在联系而建立的指标,而实践中,虽然有时从参与者反映获得的数据中发现它们之间有密切的关系,但事物之间没有任何内在联系,在这一点上,如果根据距离或相似系数来得出聚类分析的结果,显然是不合适的,但是,聚类分析模型本身是无法识别这种错误的。要评估的模型

    1. 问题的解决方案

每个国家的两个主成分值可以通过将原始六个指标的标准化数据代入公式(14)中的两个主成分表达式来获得.然后,将两个主成分的贡献率分别作为权重,结合公式(11)构建主成分综合评价模型。通过将各国的两个主成分值代入上述公式,可以得到各国高等教育发展水平的综合评价值和排名结果.这个过程很容易通过计算机软件MATLAB实现,结果见下图:

6077f03957320_html_a9e6b4d536dfee99.jpg

图2排名和综合评价结果

从评价结果可以看出,各国高等教育发展水平差异很大,各国高等教育资源分布很不均衡.英国和美国的高等教育评估得分都在2.0以上,这主要体现在科研成果转化率高、教育经费投入巨大、留学生人数众多等重要方面.0-2分的国家大多是发达国家和长期发展潜力大的国家,比如德国、俄罗斯.这些国家的指标主要表现在高校数量多、师生比例、高级教师等二级指标上.其他分数为负数的国家的高等教育系统不太发达,有很大的改进空间.值得一提的是,影响各国高等教育体系发展的因素不仅仅包含在以上几个方面,还可能与一个国家的政治、经济、文化积累有着密切的联系,这里不再赘述。

参考文献

[1] Yang Haochang, Ge Hui, Zhang Faming. Discussion on the construction of high quality

development evaluation index system of higher education [J]. Education Guide,2020(10):83-

90.

[2] Zhang Yuhong. Analysis of the Present Situation of Higher Education in Contemporary China

[J]. Western Leather,2017,39(10):289.

[3] Qi Yong, Ou Lingyan. Research on the evaluation index system of higher education developmentquality in China [J]. Education Modernization,2020,7(46):107-113.