基于多元统计和水质标识指数的丹金溧漕河溧阳段水质评价研究

2017-11-25 08:20唐国平陈德超黄振旭徐小峰
关键词:溧阳水质评价断面

唐国平,陈德超,黄振旭,徐小峰

(苏州科技大学 环境科学与工程学院 江苏 苏州215009)

基于多元统计和水质标识指数的丹金溧漕河溧阳段水质评价研究

唐国平,陈德超*,黄振旭,徐小峰

(苏州科技大学 环境科学与工程学院 江苏 苏州215009)

以丹金溧漕河溧阳段为例,在利用因子分析从11个水质评价指标中筛选出6个作为水质评价重要指标的基础上,通过分层聚类分析将4个监测断面2011—2014年的180个样本点分成7组,并用非参数假设检验验证了结果的可靠性。最后以各组的样本均值为基础,采用水质标识指数方法对各组的水质样本进行评价,并将评价结果分配到各组对应的水质样本点。结果表明,丹金溧漕河溧阳段2011—2014年的水质大部分劣于III类,枯水期内水质较差。

多元统计分析;水质标识指数;水质评价;丹金溧漕河;溧阳

丹金溧漕河是太湖西部地区主要水运干线,北起丹阳连接大运河和长江,南至溧阳与安徽连通,全长约66.9 km。丹金溧漕河溧阳段位于丹金溧漕河下游,经金坛市进入溧阳市境内,境内流程约17.3 km,承担着洪水调蓄、航运、纳污等职能。近年来在当地环保部门及各乡镇政府通力合作推进各项治污措施的基础上,该河流水质有所改善,但由于区域水网纵横交错,航运发达,制约水质达标的因素复杂,污染问题仍较为严峻。因此,选用适当的水质评价方法对该河流水质状况做出合理的评价显得尤为重要。目前常用的水质评价方法有指数评价法[1-2]、模糊数学综合评价法[3-4]、灰色系统评价法[5-6]、人工智能模型[7]和多元统计方法[4,8-11]等。 上述水质评价方法在水环境综合评价过程中各有优点,其中多元统计分析法应用广泛,既考虑了污染物在时空上的关联性,又避免了大量重复计算造成的过程繁杂,具有较好的推广应用价值。

文中以丹金溧漕河溧阳段为例,将多元统计分析与水质标识指数法相结合,首先在利用因子分析(Factor Analysis,FA)筛选出水质评价重要指标的基础上,通过分层聚类(Hierarchical Cluster Analysis,HCA)按样本相似程度进行聚类分组,然后以各组的水质均值为基础,采用综合水质标识指数法对各组样本水质进行评价,最后将得到的水质评价结果分配到各组对应的水质样本点,以期实现对多断面、长时段的大量样本的水质评价。

1 数据及方法

1.1 数据来源

丹金溧漕河溧阳段沿线共设有4个例行水质监测断面,自上而下依次为别桥(S1)、凤凰东桥(S2)、夏桥(S3)和新村里(S4),如图1所示。其中,新村里断面为国控断面,代表了丹金溧漕河溧阳段出境前水质。文中采用溧阳市环境监测站提供的4个监测断面2011—2014年的水质数据,每个监测断面选取生化需氧量(BOD5)、化学需氧量(COD)、高锰酸盐指数(CODMn)、氨氮(NH3-N)、总磷(TP)、溶解氧(DO)、石油类、挥发酚、总氮(TN)、氟化物和硫化物等11个指标作为丹金溧漕河水质评价的基础指标,水质样本共180个(2011年凤凰东桥和夏桥采样频次为每两月1次,其余均为每月1次)。数据分析采用的软件为Excel 2010和SPSS20.0。

图1 研究区域及监测断面示意图

1.2 研究方法

1.2.1 因子分析

因子分析(FA)有很多方法,常用的有R型因子分析和Q型因子分析,前者使用的是变量的相关矩阵,后者使用的是样品的相似系数矩阵[12]。文中利用因子分析主要进行评价指标的筛选,故选择R型因子分析。 因子分析法的基本原理[13]:设对每个样本观测p个相互间有相关性的指标(变量)X1,X2,…,Xp,共观测n 个样本,则 p 个指标组成的向量 X=(X1,X2,…,Xp)T。在对原始数据作标准化处理的基础上,将每个原有变量用 k(k<p)个因子 f1,f2,…,fk的线性组合来表示,即有

上式就是因子分析的数学模型,也可以用矩阵的形式表示为X=AF+ε,其中X是可实测的随机向量;F称为因子,由于它们出现在每个原有变量的线性表达式中,因此,又称为公共因子;A称为因子载荷矩阵,aij(i=1,2,…,p;j=1,2,…,k)称为因子载荷;ε称为特殊因子,表示原有变量不能被因子解释的部分,其均值为 0。

1.2.2 分层聚类分析

分层聚类分析(HCA)的目的是把相似或相近的对象归并成类,研究的主要内容是如何度量相似性和构造聚类的具体方法[12],包括“指标聚类”和“样品聚类”,考虑到水质样本之间的差异性与相似性,文中采用样品聚类的方法对样本点进行分组。

相似程度的计算包括样本间距离和组间距离两类,前者包括欧氏距离、Chebychev距离和Minkowski距离等;后者包括最短距离法、最长距离法和离差平方和法(Ward法)等。在实际应用中,离差平方和法分类效果较好,应用也比较广泛[14]。因此,文中采用Ward法,样本间的距离采用欧氏距离。

1.2.3 非参数检验

在总体分布未知或知之甚少的情况下,利用样本数据对总体分布形态等进行推断的一类统计方法称为非参数假设检验(Nonparametric Test),具有对样本数据要求较低、检验条件宽松、计算相对简单等优点。SPSS中的非参数检验方法包括单样本K-S检验、两独立样本检验、两配对样本检验、多独立样本检验和多配对样本检验等。文中采用多配对样本检验对分层聚类结果进行差异性检验。

1.2.4 水质标识指数法

水质标识指数法分为单因子水质标识指数法和综合水质标识指数法,具体如下:

(1)单因子水质标识指数法

单因子水质标识指数Pi由一位整数及小数点后两位有效数字组成,其公式表示如下

式中,X1代表第i项水质指标的水质类别,可以通过《地表水环境质量标准》(GB3838-2002)来确定,取值为1,2,…,6;X2代表该监测数据在X1类水质变化区间中所处的位置,按四舍五入的原则计算确定;X3代表水质类别与功能区划设定类别的比较结果,反映评价指标的污染程度,为1-2位有效数字。

(2)综合水质标识指数法

为了避免单因子评价法以偏概全的缺点,综合水质标识指数既突出了污染最严重的指标的影响,又综合考虑了各项水质评价指标,以全面反映水质样本的总体特征。综合水质标识指数P由单因子水质标识指数的平均值和最大值两部分构成,用公式表示如下

式中,P为n项单因子水质标识指数的算术平均值;Pmax为n项单因子水质标识指数中的最大值;n为水质指标数。

通过综合水质标识指数P,可以判断水体的水质级别和污染程度,具体评判标准见表1。

表1 基于综合水质标识指数的综合水质级别判定

2 结果与分析

2.1 水质评价指标的筛选

为了筛选出用于综合评价水质级别的重要指标,对4个断面2011—2014年每月11个指标数据共180个样本进行因子分析。从表2因子分析结果可见,KMO检验值为0.714,Bartlett球形检验的显著性水平为0.000,说明这些变量各自不全独立,它们之间有简单线性相关关系,表3显示上下游同一种污染指标的相关性,且相关系数r均在0.70以上,因此,可做因子分析;前3个公因子的特征值大于1,这3个公因子在旋转成分矩阵表中对应有较高因子载荷的变量为氟化物、CODMn、BOD5、石油类、COD和DO,同时根据该河段入河水质(即S1断面水质)调查发现,这6个指标浓度均较高,所以选其作为水质评价的重要指标是较合理的。

表2 KMO统计量和球型检验

表3 上下游同一种污染指标的相关性

2.2 水质样本分组及检验

2.2.1 样本分组

利用SPSS20.0对180个水质样本进行分层聚类分析,从聚类树状图可以看出,180个样本点从分成7组变化到分成4组时,横轴的距离出现了一个大幅度的增加,意味着应将这180个样本分成7组(分别编号G1-G7,见表4)。

2.2.2 差异性检验

为了进一步检验聚类分析的效果,对各分组内的多个配对样本进行了非参数假设检验,见表5。结果表明,所检验的7个分组的渐近显著性水平都大于0.05,故认为这7个分组内各水质样本间不存在显著差异,证明聚类分析是有效的。因此,可用组内样本的均值(见表6)代表各组样本的总体特征进行水质评价,从而减轻水质评价的工作量。

表4 7组样本各自对应的水质样本点

表5 7组样本非参数假设检验结果

2.3 水质评价结果

2.3.1 水质标识指数评价

把通过分层聚类得到的7个组的组内样本均值代入水质标识指数公式(2)-(4)中,得到各组水质样本的单因子水质标识指数及综合水质标识指数,见表6。从表6可以看出,7组样本的水质状况分布在III类~IV类之间,其中有3组是III类水质,分别为G1、G3、G4;有4组是IV类水质,分别为G2、G5、G6、G7。 此外,还可比较水质状况相近样本的水质优劣,如G1、G3和G4都是III类水质,其污染程度为G4>G3>G1;G2、G5、G6和G7都是IV类水质,其污染程度为G7>G5>G6>G2。

表6 7组样本单因子和综合水质标识指数评价结果

2.3.2 多断面、长时段的水质评价

把上述各组样本的水质评价结果根据表4分配到各自对应的样本点,以实现对多断面、长时段的大量样本的水质评价。图2为丹金溧漕河溧阳段4个断面2011—2014年的综合水质标识指数评价结果。

从横向来看,丹金溧漕河溧阳段的4个断面水质都较差,大部分劣于III类。联系该河段沿线的污染源分布情况,可以发现S1断面水质主要受上游来水影响;S2断面水质主要受工业污染(昆仑工业园)影响;S3断面水质主要受城镇生活和工业污染(城北工业园)影响;S4断面作为出境断面,主要受上游汇水水质影响。

从纵向来看,丹金溧漕河溧阳段2011—2014年水质状况逐年改善,这表明近年来溧阳市水污染治理工作取得了一定成效。此外,在工业废水和生活污水排放量变化不大的情况下,丹金溧漕河水质状况主要受降水量的影响,枯水期与丰水期差异明显:枯水期内水质较差;丰水期(5-8月)降水量充沛,河流流量相对较大,对河流中的污染物起到一定的稀释作用,水质好转,可达到III类水标准。

图2 丹金溧漕河溧阳段4个断面2011—2014年水质评价结果

3 结语

(1)将多元统计分析与水质标识指数法相结合,用于多断面、长时段的大量样本的水质评价,结果符合实际情况,证明了此方法的科学性和实用性。此外,在水质评价过程中,该方法既突出了最大超标因子的影响,又综合考虑了各项水质评价指标,能够全面反映水质样本的总体特征。

(2)丹金溧漕河溧阳段沿线的4个监测断面2011—2014年的水质大部分劣于III类,因此,为了确保出境水质稳定达标,应将S2-S3段作为丹金溧漕河溧阳段水污染重点控制区,并重点关注枯水期的水污染问题,进一步加强控源截污工作。

[1]ŠTAMBUK-GILJANOVIC N.Water quality evaluation by index in Dalmatia[J].Water Research,1999,33(16):3423-3440.

[2]杨大杰.综合水质标识指数法及单因子水质标识指数法在2013年官厅水库水质评价中的应用[J].水利水电技术,2014,45(10):28-30,41.

[3]邹志红,孙靖南,任广平.模糊评价因子的熵权法赋权及其在水质评价中的应用[J].环境科学学报,2005,25(4):552-556.

[4]卢文喜,李迪,张蕾,等.基于层次分析法的模糊综合评价在水质评价中的应用[J].节水灌溉,2011(3):43-46.

[5]于皓,刘志斌,王昭君.基于灰色聚类分析法的矿井水质评价[J].辽宁工程技术大学学报,2003,22(S1):74-76.

[6]李国良,付强,孙勇,等.基于熵权的灰色关联分析模型及其应用[J].水资源与水工程学报,2006(6):15-18.

[7]周丰,郭怀成,刘永,等.基于多元统计分析和RBFNNs的水质评价方法[J].环境科学学报,2007,27(5):846-853.

[8]SOLIDORO C,PASTRES R,COSSARINI G,et al.Seasonal and spatial variability of water quality parameters in the lagoon of venice[J].Journal of Marine Systems,2004,51(1-4):7-18.

[9]李连香,许迪,程先军,等.基于分层构权主成分分析的皖北地下水水质评价研究[J].资源科学,2015,37(1):61-67.

[10]田玉柱,何万生,夏鸿鸣,等.基于多元统计和时序方法的渭河水质评价及预测[J].数理统计与管理,2014,33(5):780-789.

[11]SHRESTHA S,KAZAMA F.Assessment of surface water quality using multivariate statistical techniques:A case study of the Fuji river basin,Japan[J].Environmental Modellingamp;Software,2007,22(4):464-475.

[12]朱红兵.应用统计与SPSS应用[M].北京:电子工业出版社,2011.

[13]王璐,王沁.统计软件SPSS完全学习手册与实战精粹[M].北京:化学工业出版社,2013.

[14]何晓群.多元统计分析[M].北京:中国人民大学出版社,2004.

责任编辑:谢金春

Water quality assessment for Danjinlicao River in Liyang based on multivariate statistical analysis and water quality identification index

TANG Guoping,CHEN Dechao*, HUANG Zhenxu, XU Xiaofeng
(School of Environmental Science and Engineering,SUST,Suzhou 215009,China)

We studied Danjinlicao River in Liyang.Six indicators were selected out of eleven as water quality evaluation indicators through factor analysis.180 samples generated from four monitoring sections during 2011-2014 were divided into 7 groups according to hierarchical cluster analysis.Nonparametric test was applied to validate the reliability of the results.Finally,using sample mean of each group as input,we calculated the water quality identification index of each group and fed back the evaluation result of each group to their original sample.The results show that the water quality condition of Danjinlicao River in Liyang was mostly worse than Class III from 2011 to 2014,and that the water quality in dry season was poorer.

multivariate statistical analysis;water quality identification index;water quality assessment;Danjinlicao River;Liyang

X824

A

2096-3289(2017)04-0070-06

2016-08-03

溧阳市科技支撑计划项目(LC2014007);江苏省高校优秀中青年教师和校长境外研修计划资助项目

唐国平(1992-),男,江苏兴化人,硕士研究生,研究方向:环境规划与管理。

*通信作者:陈德超(1972-),男,博士,副教授,硕士生导师,E-mail:dcchen2002@163.com。

猜你喜欢
溧阳水质评价断面
파금과 염상섭 문학 비교연구의 한 단면(断面)
海归吴凡:激情追梦的“新溧阳人”
走进溧阳忘记四季
浞河浮游藻类的调查研究与水质评价
滻灞河水质评价方法研究
基于概率统计和模糊综合评价法的水质评价模型及其应用——以拉萨河水质评价为例
溧阳中材重型机器有限公司
溧阳:新四军江南指挥部成立地
基于Dijkstra算法的最优解列断面快速搜索方法
国内首台全断面煤巷高效掘进机诞生并交付