基于回归分析的汉江汉中段水体重金属污染预测模型

2017-06-28 16:35杰,王
关键词:汉江因变量汉中

刘 杰,王 强

(陕西理工大学 数学与计算机科学学院,陕西 汉中 723000)

基于回归分析的汉江汉中段水体重金属污染预测模型

刘 杰,王 强

(陕西理工大学 数学与计算机科学学院,陕西 汉中 723000)

以汉江流域汉中段2006—2015年水体重金属浓度为基础数据,利用MATLAB软件,采用非线性回归分析法,建立了基于时间序列的重金属浓度预测模型并进行模型仿真。实验结果表明各种重金属浓度随时间变化的趋势与实际情况基本吻合,该模型能以较高的预测精度反映汉江汉中段水体重金属浓度随时间变化趋势。

汉江流域汉中段; 重金属污染; 非线性回归分析; 预测模型

水乃生命之源,生产之要,生态之基。随着社会经济的飞速发展,大量的工业废水和生活污水排入河流湖泊,已经严重污染了水体。在排入水体的各种污染物中,重金属因其难以降解而长期积累,具有来源广且残毒时间长的特点,对水体生物及人类的生产和生活造成了严重的危害,成为水污染治理的重点和难点。

汉江是“南水北调”中线工程和“引汉济渭”工程的主要水源地,它发源于汉中,是长江最大的支流,在汉中境内长约270 km,境内流域面积1.97万平方公里,大小支流共346条,年平均径流量约100亿立方米。随着“南水北调”工程的正式通水,水源地的水质保护对调水工程沿线的生态环境和居民生产生活将产生直接且深远的影响。水质的科学预测对水污染预防与治理有着极为重要的指导意义,可以利用采集到的各种水质数据,采用不同的预测方法建立模型来预测水质未来的变化趋势并探索其变化规律。目前,国内外研究学者主要采用GM(1,1)预测模型、人工神经网络预测、数理统计预测以及混沌理论等预测方法。李如忠等[1]将灰色动态模型法引入河流水质预测中;邱淑芳等[2]利用改进的GM(1,1)方法预测地下水环境;何丕文等[3]利用有限差分法对河流水质进行了预测。Stewart和Bates提出了一种洪泛区污染物迁移的分布模型[4],可在河水达到一定范围时对沉积和渗漏污染物进行立体分布预测。

本文采集汉江流域汉中段水体重金属含量数据,通过MATLAB软件采用回归分析法建立水体重金属污染预测模型[5]。

1 数据采集

陕西省汉中市洋县黄金峡采样点地处汉江流域汉中段下游,接近汉江在汉中的出境口,是“引汉济渭”工程的直接取水区。因此本研究选取汉江干流的黄金峡断面2006—2015年连续10年的每年1月份枯水期时水体As、Hg、Cr、Pb、Cd、Cu等6种主要重金属浓度作为研究的基础数据(文中所涉及的黄金峡断面采样点的6种重金属浓度数据由汉中市环境监测中心站的年度监测报告提供),如表1所示。对监测数据进行非线性回归分析,建立该断面随时间推移各种重金属在枯水期时的浓度预测模型。

表1 黄金峡采样点2006—2015年1月份水体重金属含量 (单位:mg/L)

2 基于回归分析的水体重金属预测模型

2.1 回归分析

回归分析预测法是在掌握大量采集数据的基础上,根据因变量(预测对象)和自变量(影响因素)的相关关系,利用数理统计法建立因变量和自变量之间的回归方程,并利用该回归方程来预测因变量未来发展趋势的分析方法。根据自变量和因变量之间相关关系的不同,又可分为线性回归和非线性回归。线性回归的因变量是自变量的一次函数,回归规律呈直线型,方法简单但拟合结果往往与实际值的偏差较大。非线性回归的因变量是自变量的n次方(n>1)以上的函数形式,回归规律在图形上呈现为各种曲线,预测结果更接近实际值[6]。为了保证预测的精确度,本研究利用MATLAB软件进行非线性回归分析预测。

2.2 回归预测模型

通过对采样数据的研究发现,将预测时间与初次采集时间的间隔作为自变量x,某种重金属浓度作为因变量y,建立该种重金属浓度随时间推移而变化的回归模型。模型以初次采集时间2006年作为起始点记为0,相邻的两次采集时间间隔为1年,共有10次采集,最后一次与初次采集时间间隔为9年。

以重金属Cr为例,在MATLAB中写入并运行以下程序:

x=0:1:9;

y=[0.002578 0.004234 0.004499 0.004671 0.004532 0.004379 0.005989 0.006664 0.006498 0.007494];

cftool (x,y)

得到2006—2015年元素Cr的散点分布图,如图1所示。

图1 2006—2015年元素Cr的浓度散点分布图 图2 重金属Cr随时间变化的浓度拟合图

根据得到的散点分布图,利用MATLAB进行多项式拟合。拟合是指根据某函数的若干离散函数值,通过调整该函数的若干待定系数,使得该函数与已知点集的误差最小。通常选取能使相关系数R2越接近1且残差值越小的拟合次数作为最佳的拟合次数,这使模型的预测精度相对也越高[7-9]。经多次实验和计算,发现拟合7次时达到最佳预测效果,R2=0.9908,残差值为0.000 298 3,得到如图2所示的重金属Cr随时间变化的浓度拟合图。

经7次拟合得到重金属Cr浓度预测的回归拟合方程为:

用同样的方法可以得到其余5种重金属As、Hg、Pb、Cd和Cu在该采样点的回归拟合方程,预测出该重金属随时间变化的浓度值:

表2 重金属Cr浓度实测值与预测值 (单位:mg/L)

2.3 模型检验

2.3.1 实际值与预测值对比分析

预测值与实际值的对比分析可以反映出该模型的预测效果。将采集时间与初始采集时间的间隔代入某种重金属浓度的拟合回归方程,即可得到该重金属浓度预测值。重金属Cr浓度实测值与预测值如表2所示,从表中得出,模型预测值与实际值的误差很小,其中8个预测值与其对应的真实值之间误差均小于0.0005,另外两个误差稍高于0.0005,总体上取得了较为满意的预测效果。

2.3.2 模型检验

在数理统计中,通常用以下3个数值来检验回归模型的有效性[8-10]:(1)相关系数R2越接近1,说明回归方程越显著;(2)显著性F值越大,说明回归方程越显著;(3)与F对应的概率P<∂时(∂缺省时默认取值0.05),说明回归方程越显著。

利用MATLAB软件进行回归拟合和计算可得,重金属Cr的预测回归方程的相关系数R2=0.9908(约等于1),F=18.4702,P=0.000 34<0.05。

经过对其余5种重金属浓度预测值与真实值进行对比分析,同时对模型的有效性进行检验,实验结果如表3所示。实验结果证明回归预测模型整体上符合数据变化规律,具有较高的预测精度。

表3 As、Hg、Pb、Cd和Cu回归方程的模型有效性检验结果

3 结 论

研究选取汉江汉中段黄金峡断面为采样点,建立了该断面基于时间序列的重金属浓度预测模型,回归分析和实验仿真结果表明该模型能够较真实地反映重金属浓度随时间的变化趋势。由于水体重金属浓度受多种因素影响,下一步研究将着重考虑将重金属浓度的影响因子引入到模型中,进一步提高模型的预测精度,旨在为汉江水源地水体重金属污染防控提供科学的指导依据。

[1] 李如忠,王超.灰色动态模型群法在河流水质预测中的应用初探[J].中国农村水利水电,2003(1):76-78.

[2] 邱淑芳,周其华,王泽文.改进的GM(1,1)模型及其在地下水环境预测中的应用[J].东华理工学院学报,2006,29(2):176-180.

[3] 何丕文.有限差分法在河流水质预测中的应用[J].长江大学学报(自科版),2006,3(1):38-39.

[4] CAMPOLO M,SOLDATI A,ANDREUSSI P. Forecasting river flow rate during low-flow period using neural network[J].Water resource,1999,35(11):3547-3552.

[5] 彭泽洲,杨天行,梁秀娟,等.基于一种时间序列模型的河流重金属污染浓度预测研究[J].计算技术与自动化,2012,31(3):29-33.

[6] 魏世丽,葛永慧.一元非线性回归两种不同模型的比较[J].统计与决策,2015(4):29-31.

[7] 张利平,于贞杰,张建华,等.六种时间序列组合建模及应用[J].统计与决策,2016(14):71-73.

[8] 宁可.基于MATLAB的湘江水质重金属污染预测模型研究[J].安徽农业科学,2012,40(9):5496-5498.

[9] 颜廷文,孙宝盛,张冉.基于等维新息灰色马尔可夫模型的河流水质预测[J].水土保持通报,2013,33(5):130-134.

[10] 郭晶,李利强,黄代中,等.洞庭湖表层水和底泥中重金属污染状况及其变化趋势[J].环境科学研究,2016,29(1):44-51.

[责任编辑:李 莉]

Prediction model of heavy metal pollution in Hanzhong section of Hanjiang river based on regression analysis

LIU Jie,WANG Qiang

(School of Mathematics and Computer Science,Shaanxi University of Technology,Hanzhong 723000,China)

The Prediction Model of Heavy Metal Pollution based on the time-series had been established for the first time through the nonlinear regression analysis using the software named MATLAB. The data of the concentration of heavy metal in 2006—2015 of Hanzhong section of Hanjiang river was collected as the basic data for this research. At the same time,the model emulation had been done in this paper. The experimental results showed that the variation with time of the predicted heavy metal content was basically consistent with the actual conditions,which indicated that this model could forecast the variation with time of heavy metal content in Hanzhong section of Hanjiang river well,and this model has a high precision.

Hanzhong section of Hanjiang river; heavy metal pollution; nonlinear regression analysis; prediction model

2096-3998(2017)03-0089-04

2016-12-28

2017-02-26

陕西省教育厅科学研究计划项目(15JK1128)

刘杰(1982—),女,陕西省城固县人,陕西理工大学副教授,硕士,主要研究方向为智能优化算法及应用;王强(1977—),男,陕西省勉县人,陕西理工大学讲师,主要研究方向为计算机科学技术及智能优化。

S273.5

A

猜你喜欢
汉江因变量汉中
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
汉江春晓
汉江,为你梳妆
守望汉江
适应性回归分析(Ⅳ)
——与非适应性回归分析的比较
汉中之战(续)
汉中为王(二)
汉中情
汉江之歌
偏最小二乘回归方法