主成分分析法在农村饮用水水质评价中的应用

(整期优先)网络出版时间:2012-12-22
/ 2

主成分分析法在农村饮用水水质评价中的应用

王慧姜永根陆火英马家萍王丽英

王慧姜永根陆火英马家萍王丽英(上海市松江区疾病预防控制中心上海松江201620)

【中图分类号】R123【文献标识码】A【文章编号】1672-5085(2012)38-0116-02

【摘要】目的对农村饮用水出厂水水质状况进行综合评价。方法使用主成分分析法,按原水来源、制水工艺、采样时间不同对松江区2011年农村饮用水出厂水监测结果进行综合分析。结果斜塘江等黄浦江上游河道为原水的监测点水质得分较底,水质较好;使用深度水处理工艺的监测点水质综合得分明显低于采用常规水处理工艺的监测点;丰水期水质得分低于枯水期。结论主成分分析法能够用于饮用水水质综合评价(排序)。

【关键词】主成分分析法饮用水评价

为掌握松江区农村集中式供水单位水质卫生现状,按照卫生部《2011年农村饮用水水质卫生监测技术方案》的要求,设立10个出厂水监测点,分别在枯水期(2月)与丰水期(8月)开展20项水质指标的监测。农村饮用水监测中监测指标较多,且不同水质指标相互之间存在一定的相关性,难以直接对各监测点水质情况进行比较,而主成分分析法采用降维的思路,能够对多个指标进行综合分析[1]。因此本文采用主成分分析法,对松江区2011年农村饮用水水质状况进行综合分析。

1数据来源与分析方法

1.1数据来源

2011年松江区农村饮用水水质监测报表:监测点集中式供水单位的水源类型、水处理工艺、规模大小,监测点枯水期与丰水期20项水质监测项目的结果,监测项目包括色度、浑浊度、臭和味、肉眼可见物、pH、铁、锰、氯化物、硫酸盐、溶解性总固体、总硬度、耗氧量、氨氮、砷、氟化物、硝酸盐、菌落总数、总大肠菌群、耐热大肠菌群、游离余氯。

1.2主成分分析法

1.2.1基本原理[2][3]采用数理统计方法,将原始数据标准化后,把n维变量的总方差分解成n个互不相关成分的方差,根据各成分的方差在总方差中的比率或特征值(比率或特征值越大表示对原始变量差异的解释能力越强),从大到小选择作为主成分,一般选择特征值大于1或使累计方差比率达到85%的成分。

1.2.2统计方法使用Excel建立数据库,使用SPSS19.0进行统计分析,主成分分析法在SPSS软件中的具体操作参考文献[4],水质合格率计算按《生活饮用水卫生标准》(GB5749-2006)进行。

1.2.2.1变量正向化,保证各变量在最终结果解释上方向一致,数据越大水质越差。对于有双向限值的pH、游离氯采用公式Xi’=|Xi-(Xlow+Xup)/2|进行,其中Xi—变量X第i个原始数据,Xi’—变量正向化后数据,Xlow—变量X的下限标准值,Xup—变量X的上限标准值。

1.2.2.2去量纲化,在SPSS软件中对变量进行标准化,消除量纲和数量级的影响,舍去方差为0的变量。

1.2.2.3使用SPSS软件计算变量间的相关系数矩阵R;计算矩阵R的特征值、方差贡献率、确定主成分;计算主成分载荷矩阵;确定主成分表达式。

1.2.2.4根据主成分表达式,使用EXCEL软件,按不同原水来源、制水工艺、采样时间进行各主成分得分及水质综合得分的计算与排序。

2结果

2.1主成分表达式

使用SPSS软件计算主成分的系数矩阵,列出主成分表达式,结果见表1及式(1)~(5)。

表1主成分系数矩阵

主成分表达式为:

F1=-0.106Z1+0.250Z2+0.349Z3+……+0.008Z15(1)

F2=0.428Z1+0.214Z2-0.107Z3+……+0.315Z15(2)

F3=-0.074Z1+0.246Z2+0.011Z3+……+0.167Z15(3)

F4=-0.359Z1-0.266Z2+0.039Z3-……+0.636Z15(4)

以成分在总方差中的方差贡献率作为权重,主成分综合得分(Fz)表达式为:

Fz=0.44621F1+0.16980F2+0.11827F3+0.09929F4(5)

2.2各监测点水质综合得分

根据监测点原水来源、制水工艺、监测时间的不同,按主成分表达式(1)~(5)来计算监测点主成分综合得分(如分类涉及多个监测点取平均值),得分越低,水质越好。

在使用相同制水工艺(常规水处理工艺)的监测点均为镇级水厂,制水量为1-2万吨/日,根据原水来源不同计算水质综合得分,结果见表2,以斜塘江等黄浦江上游河道为原水的监测点水质得分较低。

在均以斜塘江为水源且制水工艺不同的监测点中(表3),使用深度水处理工艺(臭氧-活性炭)的监测点水质综合得分明显低于采用常规水处理工艺的监测点,水质较好。

由表4可见,2011年松江区丰水期的综合水质好于枯水期,但其中F2锰、色度反而是丰水期较差。

表2不同原水来源监测点水质综合得分与排名

表3不同制水工艺监测点水质综合得分与排名

表4不同时间监测点水质综合得分与排名

3讨论

通过主成分分析对不同原水来源、不同时间农村出厂水监测点的水质情况进行了综合评价,结果表明斜塘江等黄浦江上游河道为原水的监测点水质得分较低,水质较好;使用深度水处理工艺(臭氧-活性炭)的监测点水质综合得分明显低于采用常规水处理工艺的监测点;丰水期水质得分低于枯水期。

主成分分析法可以利用降维的思路,比较不同监测点的数据并进行排序。由表2、表3中可见,在合格率一致的情况下,主成分分析法仍能进行排序比较,但在表2中也能发现,综合排名结果和合格率并不一致,提示2者间不能互相替代。

从主成分分析法的计算结果看,制水工艺相同,上游地区的监测点水质得分低于下游地区(表2),上游地区的水质较好,这与日常工作经验一致;深度水处理工艺的监测点水质得分较低(表3),表面深度水处理工艺的过滤能力较强,也符合事实;丰水期监测点水质得分较低(表4),与赵艳玲等[5]的研究结果一致,以上均表明主成分分析法的分析结果符合事实。可见对水质进行综合评价排序,主成分分析法是一种简便易行的方法。

参考文献

[1]王群妹,梁雪春.基于主成分分析的水质评价研究[J].水资源与水工程学报.2010,21(6):140-142.

[2]邹海明,蒋良富,李粉茹.基于主成分分析的水质评价方法[J].数学的实践与认识.2008,38(8):85-90.

[3]孙中兴,姜永根,盛峰松,等.主成分分析法在水源水质评价中的应用[J].上海预防医学.2011,23(10):485-486.

[4]李哲强,候美英,白云鹏.基于SPSS的主成分分析在水环境质量评价中的应用[J].海河水利.2008,(3):49-52.

[5]赵艳玲,陶勇,付彦芬.主成分分析在农村饮用水水质评价中的应用[J].现代预防医学.2008,35(1):50-52.