基于主成分分析法对塞罕坝生态保护模式的研究

(整期优先)网络出版时间:2022-05-12
/ 2

基于主成分分析法对塞罕坝生态保护模式的研究

倪文博 1,郭培宏  2,毛文昊 3

  1. 华北理工大学冶金与能源学院,河北 唐山 063200

  2. 2.华北理工大学冶金与能源学院,河北 唐山  063200

  3. 3.华北理工大学建筑工程学院,河北 唐山 063200

摘要

半个多世纪以来,塞罕坝人艰苦奋斗,使塞罕坝的生态环境得到了极大的改善。本文从近些年来塞罕坝生态环境恢复前后的生态状况出发,收集塞罕坝生态环境恢复前后森林覆盖率、森林面积、树木数量等相关数据,建立数学模型,对塞罕坝生态环境恢复前后的生态状况进行了定量评估。

关键词: 主成分分析;时间序列分析

1 问题重述

    1. 问题背景

1962年以来,369名平均年龄在24岁以下的年轻人来此植树固沙,涵养水源。建设者们在北京以北400公里的高原荒地上,造林112万亩,植树4亿多棵,将其营造为世界上最大的人工林。但光荣使命的背后也迎来了新的问题,持续发展更高的目标便是恢复生态。

    1. 问题要求

基于上述背景,我们需要建立数学模型解决以下问题:

收集相关数据并选择合适指标,通过建立赛罕坝对生态环境影响的评价模型,定量评价塞罕坝恢复后对环境的影响;进而对塞罕坝恢复前后的环境状况进行对比分析。

2 模型假设

  • 假设生态环境变化不受疫情的影响

原因:疫情对生态环境恢复的影响只是暂时的,因此模型的建立仍然具有应用价值。

  • 假设各地区生态保护区的建立不受当地经济发展状况的影响

原因:生态保护区的建立受国家政策支持,受当地经济状况的限制情况可以忽略不计。

3符号说明

符号

含义

符号

含义

符号

含义

M

指标贡献率

627c7e86363ce_html_ac5af58ac8e72354.gif

白噪声序列

627c7e86363ce_html_650843335df3020c.gif

标准化测度值

627c7e86363ce_html_c4a5969aef591d9e.gif

模型参数

627c7e86363ce_html_fb3a3f4d689f1de6.gif

公因子

627c7e86363ce_html_d2b148dae581db72.gif

极小型指标数据

627c7e86363ce_html_241e3c42de876e7c.gif

相关性系数

627c7e86363ce_html_d47ddb75e55a40ed.gif

协方差

627c7e86363ce_html_b8386af441cbbe7d.gif

627c7e86363ce_html_d35db0220a820215.gif

协方差函数

627c7e86363ce_html_71e099d225fb8a7b.gif

指标

627c7e86363ce_html_e3426b4b2e5c603d.gif

熵权

627c7e86363ce_html_8c21de1f390d2894.gif

TOPSIS得分

q

特殊因子向量

627c7e86363ce_html_b92d4be3b0be213e.gif

主成分

4 问题一的模型建立与求解

4.1 指标的选取与数据预处理

4.1.1指标的选取

经分析,共选取了八个指标在对塞罕坝生态环境恢复前后的对比分析中会产生较大影响,分别是森林覆盖率、树林面积、树木数量、水资源影响、动物影响、植被影响、气候影响、植物丰度。

4.1.2主成分分析法选取主要指标

为了避免8项指标之间信息重复,造成数据冗余,本文利用主成分分析法提取综合指标,便于后期分析处理。

Step1 一致性检验

本文运用一致性检验对原始数据检验,以验证数据能否运用因子分析模型,检验结果表明,在95%的置信区间内能够运用原始数据进行主成分分析。

Step2 主成分分析模型的建立

将原始数据标准化,以消除量纲的影响,可知进行主成分分析的指标变量共有8个。建立变量之间的相关系数矩阵R,相关系数矩阵R=627c7e86363ce_html_b6eb24f366ff87be.gif

627c7e86363ce_html_538fa9cc0e5d391e.gif (1)

式中627c7e86363ce_html_27138256022464af.gif ,627c7e86363ce_html_566ecc745ff93742.gif ,627c7e86363ce_html_650843335df3020c.gif 是第i个指标与第j个指标的相关系数。

Step3 计算相关系数矩阵R的特征值和特征向量

Shape1 算相关系数矩阵627c7e86363ce_html_9dcab181f5fd021e.gif 的特征值627c7e86363ce_html_919bdca6d6df68b2.gif ,及对应的特征向量,627c7e86363ce_html_983ead0bd2ec04b6.gif 。其中627c7e86363ce_html_f3910eff3719ffa.gif ,是由特征向量组成的627c7e86363ce_html_4d187224ad27976d.gif 个新的指标变量。

627c7e86363ce_html_eafe4679b9e0466b.gif

627c7e86363ce_html_b7bf495b8dcf60dd.gif

627c7e86363ce_html_8d41cdd3e82528b1.gif (2)

627c7e86363ce_html_1e9ae754fe6b10d1.gif

式中627c7e86363ce_html_1fdc912b1288391d.gif 是第1主成分,627c7e86363ce_html_646f31ce227f6f7.gif 是第2主成分,……,627c7e86363ce_html_861c123d41662621.gif 是第627c7e86363ce_html_4d187224ad27976d.gif 主成分。

Step4 写出主成分并计算综合得分

计算特征值的信息贡献率和累计贡献率。称627c7e86363ce_html_511d78da39e1d1cb.gif 为主成分627c7e86363ce_html_b92d4be3b0be213e.gif 的方差贡献率:

627c7e86363ce_html_f395d17df0809fa1.gif (3)

627c7e86363ce_html_6309a22e953a7e2b.gif 为主成分627c7e86363ce_html_69369ea74ac8179a.gif 的累积贡献率:

627c7e86363ce_html_e35430bfd8ba1077.gif (4)

当特征值小于1或累积贡献率大于85%时,则选择前627c7e86363ce_html_b9389f3e7c18a1c5.gif 个指标变量627c7e86363ce_html_69369ea74ac8179a.gif 作为627c7e86363ce_html_b9389f3e7c18a1c5.gif 个主成分,代替原来627c7e86363ce_html_4d187224ad27976d.gif 个指标变量,从而可对627c7e86363ce_html_b9389f3e7c18a1c5.gif 个主成分进行综合分析。

综合公式如下:

627c7e86363ce_html_d08f5730ff137f72.gif (5)

其中627c7e86363ce_html_511d78da39e1d1cb.gif 为第627c7e86363ce_html_abaa86e09b725679.gif 个主成分的方差贡献率,根据综合得分值就可进行评价,得到结果如下图所示:

Step5 确定因子数目

本文通过碎石图的转折点以及方差解释表的累积贡献率提取出了三个公共因子,提取出的三个公共因子的方差贡献率分别为:87.41%、7.883%、3.358%,前三个公共因子的累计方差贡献率已达到 98.651%,即前三个公共因子可以包含原始指标98.651%的信息,因此选用前三个公共因子来反映整体指标数据。

4.1.3 层次结构模型建立

将决策问题分解为三个层次,最上层为目标层M,即以塞罕坝恢复前后生态状况分析评分为目标;最下层为方案层,即为塞罕坝恢复前与恢复后生态状况;中间层为准则层,即为通过主成分分析法(PCA)选取的三个主要指标。

4.1.4 构造判断矩阵

对三个主要指标构造判断矩阵,即通过每两个指标两两比较,得到一个成对比较矩阵。

表1 指标成对比较矩阵

1

7

7

0.143

1

1

0.143

1

1

4.1.5一致性检验

  • 计算一致性指标CI

CI=627c7e86363ce_html_118801d298cdf8b5.gif (11)

  • 查找对应的平均随机一致性指标RI

根据指标的数量n直接在表中查找其对应的平均随机一致性指标RI。本题中,n为3,其对应的RI为0.52。

  • 计算一致性比例

CR=627c7e86363ce_html_21c677bf64cf8a66.gif (12)

如果CR<0.1,则认为判断矩阵的一致性可以接受;否则需要对判断矩阵进行修正。

4.1.6特征值法求相对权重

(1)求出矩阵的最大特征值 λmax=627c7e86363ce_html_4770d7309dd960c1.gif 以及对应的特征向量;

(2)对求出的特征向量进行归一化得到我们的权重。

R=627c7e86363ce_html_b919b679ba205584.gif =627c7e86363ce_html_a3617a95967f6230.gif , A=627c7e86363ce_html_4e0b16ef4df1e323.gif

A=627c7e86363ce_html_d863045ba43fe91c.gif

4.1.7得出最终结果x

由计算可得到塞罕坝生态状况恢复前与恢复后的两个得分:

表2 恢复前后得分情况

1962-2010

627c7e86363ce_html_54c75dc120c2cf77.gif=56.8

2010-2021

627c7e86363ce_html_6d293c14f32b0d9f.gif =965.6

参考文献

  1. 黄裕萌,朱云华,胡尧,周欣璐.基于小波分析的时间序列预测[J].智能城市,2021,7(18):128-130.DOI:10.19301/j.cnki.zncs.2021.18.061.

  2. 中共甘肃省委 甘肃省人民政府. 甘肃省公开中央生态环境保护督察反馈问题整改工作进展情况[N]. 甘肃日报,2021-11-19(006).

  3. 张明发,戴云飞.政府监管促进消费金融审慎健康发展策略研究——基于T市样本时间序列分析[J].现代商业,2021(27):162-164.DOI:10.14097/j.cnki.5392/2021.27.051.