主成分分析法在海河流域多条河流水质评价分析中的应用

2017-04-20 11:01廉铁辉王洪翠
海河水利 2017年2期
关键词:高锰酸盐水质评价需氧量

廉铁辉,王 钊,王洪翠,罗 阳

主成分分析法在海河流域多条河流水质评价分析中的应用

廉铁辉1,王 钊2,王洪翠2,罗 阳3

(1.天津市引滦工程于桥水库管理处,天津301900;2.海河流域水环境监测中心,天津300170;3.海河流域水资源保护局,天津300170)

水质评价是获得水环境现状及其水质分布状况、对河流水质质量进行定性或定量的评定,是水质保障的重要措施之一。利用SPSS软件,采用主成分分析法,对11个不同河流站点的高锰酸盐指数、化学需氧量、氨氮、总磷、铜、氟化物、铁、锰8个水质指标进行了分析计算,从原始数据中提取总方差72.88%的2个因子来反映水体的污染程度。结果表明,主成分分析方法在指标权重选取方面可以减少主观误差,操作简单,并且具有一定的优越性。

主成分分析法;水质评价;SPSS软件;海河流域

1 前言

海河流域包含8个省、自治区、直辖市的全部或部分地区,流域面积32.6万km2,人口1.5亿。河流是一个由多种环境因素和生态因子组成的一个复杂的动态系统[1],河流水质状况直接影响人们的生活环境和居住适宜度。对河流水质的质量评价主要通过水的物理化学性质,按照相关水质标准和评价方法,对河流水环境的现状及水质的分布状况进行评定。水质评价在20世纪60年代,较为代表性的是霍顿水质指数法[2]。20世纪70年代,经过多个学者的研究,内梅罗水污染指数法[3]被广泛应用。我国的水质评价起步略晚,工作开始于20世纪70年代,至今已经有很多学者提出了不同的水质评价模型[4-8],但在具体的水质评价工作中,单因素评价法[9]使用的频率较多。针对这一情况,笔者提到的主成分分析方法(Principal Components Analysis)是一种将多维因子纳入同一系统进行定性、定量化研究的理论比较完善的多元统计分析方法。

笔者采用主成分分析法,借助SPSS软件,对海河流域11条河流进行水污染程度排序,以期为该流域的河流污染程度提供一个排名参考指数。

2 基于SPSS的主成分分析

2.1 样本点及监测指标确定

选取11条河流(A、B、C、D、E、F、G、H、I、J、K)采样点的水质监测数据,取8个指标为高锰酸盐指数(X1)、化学需氧量(X2)、氨氮(X3)、总磷(X4)、铜(X5)、氟化物(X6)、铁(X7)、锰(X8)。

2.2 计算过程

在SPSS软件中,使用主成分分析法对水质进行排名,首先将监测到的水质原始数据进行标准化处理,求出相关系数矩阵,然后分别对8个指标高锰酸盐指数、化学需氧量、氨氮、总磷、铜、氟化物、铁、锰的相关系数矩阵和特征值方差累计贡献率进行计算,确定选取主成分的个数。

对原始数据进行标准化消除量纲的影响,得到标准化数据,见表1。

表1 标准化的水质原始数据

根据SPSS软件的计算步骤,利用标准化后的数据求得相关系数矩阵、特征值和主成分贡献率及累计贡献率、初始因子载荷矩阵,分别见表2—4。

表2 相关系数矩阵

表3 特征值和主成分贡献率及累计贡献率

表4 初始因子载荷矩阵

从表2可以看出所选择的8个水质指标之间的相关性,两指标之间联系系数的绝对值越大则这两指标之间的联系越紧密。如,高锰酸盐指数(X1)与化学需氧量(X2)相关系数绝对值为0.906,在8个水质指标中相关系数的绝对值最大,表明高锰酸盐指数与化学需氧量之间有着较大的相关性,互相影响的能力最大;而氟化物(X6)与铁(X7)相关系数的绝对值只有0.004,在所分析的8个水质指标中相关系数的绝对值最小,表明氟化物与铁之间相关性最差,互相影响的能力最小。由此方法,可以分析各个指标之间的相关性。

从表3可以看出,第1、2主成分的特征值分别为3.74、2.091,均大于1,方差贡献率分别为46.747%、26.14%,其累计方差率达到72.88%,依据主成分的方差贡献率来选择评价指标[9,10],选取2个主成分就能解释所选取的大部分数据,第1个主成分的方差贡献率为46.747%,则说明第1主成分为最重要的成分,是影响河流水质的重要水质指标,其包含的信息最多,对水质变化影响最大。

图1显示了各指标特征值,更加直观地显示了不同成分的特征值大小,成分1、2的特征值远大于1,成分3—5略小于1,成分6—8小于1、接近0。

图1 碎石图

图2各水质指标在主成分空间上的投影

图2 显示各水质指标在主成分空间上的投影,各个水质指标在图中的投影离中心越远,就说明此指标与主成分之间的相关系数越大。各个指标在主成分空间投影点的位置越接近,则说明这些指标之间的联系越紧密。

从8个指标在主成分分析空间上的投影可以看出,氨氮、总磷2个指标投影点的位置最接近,则说明它们之间联系紧密;铁指标与其它指标的投影点位置最远,则说明铁指标与其它指标之间没有联系。通过对各个指标在主成分空间的投影图,可以比较直观地显示指标之间的亲疏关系。

表4显示的是各指标与另一个主成分之间的关系,指标与某一主成分载荷值绝对值越大,则该主成分就越多地反映指标的信息。从表4可以看出,高锰酸盐指数、化学需氧量、铜、铁这些指标在第1主成分上的荷载较高,说明第1主成分反映了这些指标的信息;而氨氮、总磷、氟化物、锰在第2主成分的荷载较高,则第2主成分反映的是这4个指标的信息。因此,用2个主成分就可以全面解释原来的指标。

2.3 水质综合评判结果

根据综合评价函数,计算由2个主成分反映的各河流监测断面的得分(见表5),得分越大表明该站点水质相对其它站点水质越差,从而对样点水质情况进行分级。

表5 海河流域各监测断面水质综合评判结果

表5显示各个河流站点的得分情况,综合得分由主成分得分与方差贡献率之积得出。从表5可以看出,站点F的水质情况最好,而站点A水质情况最差,11条河流的水质情况一目了然。

3 结论

综上所述,用主成分分析法对水质指标进行分析,可从样本多指标中发现主要指标,选取主成分,使得在不损失太多信息的基础上对复杂问题进行分析。通过分析,可以确定影响该11条河流的主要指标有高锰酸盐指数、化学需氧量、铜、铁,其次是氨氮、总磷、氟化物、锰,并对11条河流进行排名,可直观地显示各河流的水污染程度。该方法应用于水环境质量评价中,对客观、准确、全面地评价水环境质量有很好的实用性。

[1]卢文喜,李迪.基于层次分析法的模糊综合评价在水质评价中的应用[J].节水灌溉,2011(3):43-46.

[2]Jacobs H L.Water quality criteria[J].Journal of Water Pollution Control Federation,1965,37(5):292-300.

[3]Nemerow N L.Scientific stream pollution analysis[M].New York:Mc Graw Hill,1974:127-150.

[4]Sasikumar K,Mujumdar P P.Fuzzy optimization model for water quality management of a river system[J].Journal of WaterResourcesPlanningandManagement,1998,124(2):79-88.

[5]龚艳冰,张继国.基于全排列多边形综合图示法的水质评价[J].中国人口·资源与环境,2011,21(9):26-31.

[6]邹国平,彭梅香.数据挖掘技术在水质评价中应用研究[J].计算机仿真,2012,29(1):148-151.

[7]牛红惠,尚艳玲.模糊神经网络在水质评价中的研究[J].计算机仿真,2012,29(4):173-176.

[8]关全成,赵双喜.模糊贴近度法在水质评价中的应用[J].节水灌溉,2012(7):43-46.

[9]余勋,粱婕.基于三角模糊数的贝叶斯水质评价模型[J].环境科学学报,2013,33(3):904-909.

[10]冯利华.环境质量的主成分分析[J].数学实践与认识,2003,33(8):32-35.

Application of Principal Component Analysis in Water Quality Evaluation of Several Rivers in Haihe River Basin

LIAN Tie-hui1,WANG Zhao2,WANG Hong-cui2,LUO Yang3
(1.Yinluan Project of Yuqiao Reservoir Management Office of Tianjin Municipality,Tianjin 301900,China;2.Haihe River Basin Water Environment Monitoring Center,Tianjin 300170,China;3.Haihe River Basin Water Resources Protection Bureau,Tianjin 300170,China)

Water quality assessment is one of the important measures for drinking water safety.With the help of SPSS software,CODMn,COD,NH3-N,TP,Cu,F-,Fe,Mn of water samples in 11 different rivers were analyzed and calculated using the principal component analysis.The pollution degree of rivers was reflected by the two factors that account for 72.88%of the total variance were extracted from the original data.The results show that principal component analysis which should minimize the subjective error in the aspect of index weight selected is simple in operation and has certain advantages.

principal component analysis;water quality assessment;SPSS software;Haihe River Basin

X824

A

1004-7328(2017)02-0029-04

10.3969/j.issn.1004-7328.2017.02.010

2017—01—12

廉铁辉(1976—),男,高级工程师,主要从事水库调度运用及水环境管理工作。

猜你喜欢
高锰酸盐水质评价需氧量
浞河浮游藻类的调查研究与水质评价
黄河口附近海域化学需氧量和石油烃分布及其关键控制环境因子分析
地表水中总磷、氨氮、化学需氧量的相关性研究
高锰酸钾和高锰酸盐对原水预氧化效果的比较
《水质化学需氧量的测定》新旧标准区别探讨
滻灞河水质评价方法研究
地表水中浊度与高锰酸盐指数的相关性分析
取样方法对高锰酸盐指数测定结果的影响
基于概率统计和模糊综合评价法的水质评价模型及其应用——以拉萨河水质评价为例
不同水质地表水中COD和高锰酸盐指数的相关性分析