基于Landsat影像的清河水库总悬浮物浓度反演模型研究

2016-03-22 06:54阎孟冬杨国范沈阳农业大学水利学院沈阳0866沈阳工学院能源与水利学院辽宁抚顺322吉林农业科技学院吉林吉林320
中国农村水利水电 2016年12期
关键词:清河悬浮物波段

阎孟冬,杨国范,2,殷 飞,3(.沈阳农业大学水利学院,沈阳 0866;2.沈阳工学院能源与水利学院,辽宁 抚顺 322;3.吉林农业科技学院,吉林 吉林 320)

0 引 言

清河水库作为辽河中游一级支流清河干流上的大II型水库,承担着防洪、灌溉、养鱼和备用水源的重要任务;如果水体处于富营养化状态,则会使水体表面形成“绿色浮渣”造成鱼类死亡,进而严重影响水体的水质和水库的运行。悬浮物是水质富营养化评价的一个重要指标,悬浮物是由无机悬浮物颗粒与有机质共同组成,有机质含量的高低主要由浮游植物与浮游动物的残体所影响[1]。常规的水环境监测是通过对实测站点采集的水样进行室内水质化学分析实现的,这种方法不仅耗时耗力,而且缺乏时间和空间上的连续性[2], 遥感水质悬浮物反演技术由于具有宏观性强、速度快、成本低、监测面积大等优势在水质监测中发挥了重要的作用,目前悬浮物反演技术常用方法有经验法[3,4]、半分析法[5,6]、分析法[7]。在国外,Miller[8]等基于MODIS影像数据建立了适用于墨西哥湾北部的悬浮物浓度的线性模型;Dekker[9]等利用Landsat TM数据的2、3波段的波段组合对弗里斯兰湖区的悬浮物浓度进行了定量反演研究。在国内,温小乐[10]等以Landsant TM 数据的TM2+TM3为自变量建立了闽江下游悬浮物浓度估算模型;管义国[11]等以Landsant TM/ETM+的3、4波段组合为自变量建立模型对巢湖悬浮物浓度进行了估算;张毅博[12]以Landsant OLI数据的2、3、8波段组合作为自变量建立了适用于新安江水库的一维线性模型。近年来遥感反演研究主要国内针对太湖、巢湖、珠江等大型湖泊,河流,针对北方内陆小面积水体的遥感水质研究较少[13-15]。因此,分析卫星数据光谱特性与水质参数的浓度之间的关系并以此建立反演模型对内陆小面积水体进行遥感水质监测方面具有重要的意义。本文以清河水库为研究区,利用Landsat卫星OLI数据对清河水库的悬浮物进行了定量反演研究,分析波段组合与悬浮物的相关性,选取相关性最高的组合与悬浮物建立最合适的反演模型,为清河水库的悬浮物遥感定量反演提供理论基础。

1 材料与方法

1.1 研究区概况

清河水库位于辽宁省铁岭市,东经124°10′~124°26′,北纬42°29′~42°36′,占地面积465.09 km2(水域面积47.6 km2),是辽河中游左侧一级支流清河上的一座大型水库,水库最大容量为9.71 亿m3,具有发电、灌溉、防洪、养殖、旅游等多种功能。2010年辽宁省人民政府正式将清河水库列为备用水源地,因此,对清河水库的水质进行全面及时监测、分析与评价显得尤为重要。

1.2 数据获取与处理

本研究所选用的数据包括成像时间为2015年6月23日的Landsat卫星OLI数据以及当日获取的清河水库水质采样数据。

1.2.1Landsat卫星OLI数据的获取及预处理

Landsat-8卫星是由美国国家航天宇航局(NASA)和美国地质调查局(USGS)联合发射运行的卫星,该卫星主要对资源、水、森林、环境和城市规划等提供可靠数据。利用ENVI软件对OLI数据进行辐射定标、大气校正、几何裁剪等预处理。大气校正的主要输入参数见表1。

表1 大气校正输入参数Tab.1 Parameters of atmospheric correction

1.2.2清河水库采样点数据的获取及预处理

为获取清河水库采样点数据,本研究在清河水库均匀选取25个采样点,如图1所示。采样时间为2015年6月23日上午9∶00-12∶00,天气晴朗,利用水库船只进行实测采样,采样深度为水面以下50 cm,将采集的水样用棕色瓶盛装标号,同时记录采样点的经纬度。利用孔径为0.45 μm的滤膜及真空泵对水样进行抽滤,停止抽滤后取出载有悬浮物的滤膜放入恒重的称量瓶里,移入烘箱中于103~105 ℃下烘干1 h后移入干燥器中,使其冷却至室温,称重,反复烘干、冷却、称重直至两次重量差小于0.4 mg为止,并计算悬浮物浓度。

图1 研究区各采样点地理分布Fig.1 Map show the location of sampling points

2 清河水库悬浮物浓度反演模型的构建与分析

2.1 水体反射率与悬浮物的相关性分析

Landsat卫星OLI数据共有9个波段,在进行清河悬浮物浓度反演时,选取合适的波段构建适合清河水库的模型显得尤为重要。本文利用预处理后的OLI数据的单波段的地表反射率的真实值与清河水库采样点的悬浮物浓度值进行Pearson相关性分析,分析发现对悬浮物浓度比较敏感的波段有蓝色波段(B2)、近红外波段(B5)和绿色波段(B3),其可决系数R2分别为0.51、0.505和0.399。以B2、B3、B5为自变量回归分析与单波段回归模型如图2,从图中可以看出以单波段为自变量的回归预测模型精度不高,不能满足清河水库悬浮物浓度的估算要求。

图2 总悬浮物浓度估算值与实际值回归分析Fig.2 Regression analysis between the estimated and measured TSM concentrations (CTSM)

2.2 比值线性回归模型的建立

由于以单波段为自变量的线性回归模型精度较低,为了提高悬浮物浓度估算精度,通过对以上3个波段进行波段组合,选出与悬浮物浓度更高的波段组合作为自变量建立适合清河水库悬浮物浓度估算的模型。通过S1=Band(a)/Band(b)组合所得结果为B2/B5的波段比值为比值组合中相关性最高的,以其为自变量建立的模型可决系数仅为0.331,通过S2=Band(a)+Band(b)的组合形式得到的结果为B3+B5的波段组合与悬浮物相关性最高,以其为自变量建立的模型可决系数仅为0.686,通过S3=Band(a)+Band(b)+Band(c)的组合形式可以得到以B2+B3+B5组合为自变量建立的模型可决系数为0.646,其3种形式建立的模型如图3。Williams[16]研究认为可决系数的大小可以用来评价模型的好坏,0.5≤R2≤0.65的模型为较差的模型,R2在0.66~0.81之间的模型为一般模型,R2在0.82~0.9的模型为较好模型,R2在0.9~1的模型为精准模型。由图3可以看出以B2、B3、B5为自变量建立的线性回归模型中可决系数最大的为0.686,其模型的标准为一般模型。

图3 总悬浮物浓度估算值与实际值回归分析Fig.3 Regression analysis between the estimated and measured TSM concentrations (CTSM)

2.3 最小二乘支持向量机模型的建立

由图3可知线性回归模型对清河水库悬浮物的预测精度并不能达到精确的要求,本研究为了更加精准的预测清河水库悬浮物的浓度选择了一种非线性的最小二乘支持向量机模型(LS-SVM)支持向量机(Support Vector Machines,SVM)模型的预测在小样本、非线性和高维模式识别问题中有很大的优势[17,18]。最小二乘支持向量机(LS-SVM)是在标准支持向量机的目标函数中增加了误差平方和项,是标准的支持向量机回归方程的一种修饰版本,比标准的SVM有着更快的求解速度,所需的计算资源较少[19]。其基本原理是通过非线性映射将输入向量从原空间映射到高维空间并在高维空间进行线性回归拟合。用于函数估计的最小二乘支持向量机算法过程如下:

设训练样本集:D={(xk,yk)|k=1,2,…,N},xk∈Rn,yk∈R,xk是输入数据,yk是输出数据。在w空间中的函数估计问题可以描述求解下面问题:

式中:误差变量ek∈R;b为偏差量;γ为正则化参数。

约束条件:yk=wTφ(xk)+b=ek,k=1,…,N

定义拉格朗日函数:

其中:拉格朗日乘子αk∈R。

对上式进行优化,根据KTT条件:

对于k=1,…,N,消去w和e,得到如下方程:

其中:1=[1,…,1]T,Y=[y1,…,yN]T,a=[a1,…,aN]T。M为一个方阵,其第i行j列的元素为Mij=φ(xk)Tφ(xj)=M(xi,xj),M(x,y)为核函数。用最小二乘法求出a和b,由此得到预测输出:

本文利用MATLAB对所有的25组数据进行处理,选用Get_Predict函数作为LS-SVM模型的核函数,以B2、B3、B5的波段值为自变量,实测悬浮物浓度为因变量,选取其中17组数据作为建模数据,剩余8组数据作为验证数据。利用LS-SVM模型所得悬浮物浓度预测值及相对误差如表2,将LS-SVM模型所得悬浮物浓度预测值与悬浮物浓度实测值进行相关性分析如图4。

表2 样本悬浮物实测值与预测值的相对误差Tab.2 Relative error between the estimated and measured TSM concentrations (CTSM)

图4 LS-SVM模型总悬浮物预测值与实测值的回归分析Fig.4 Regression analysis between the LS-SVM estimated CTSM and the measured CTSM

3 结果与讨论

宋庆君[6]通过对比几种水体遥感反射比光谱估算总悬浮物浓度的方法,得到相关性较好的波段在750 nm,且这一单波段算法具有较好的估算精度;马驰[4]以ASTER数据的第三波段波段值作为自变量建立模型对松辽平原水体的悬浮物浓度进行了估算,本文对Landsat-8的所有单波段与悬浮物浓度进行相关性分析,得出相关性较高的波段B2、B3、B5并分别建立单波段模型对清河水库悬浮物进行预测,其可决系数分别为R2=0.51、R2=0.399、R2=0.505,如图5所示其平均相对误差分别为5.29% 、6.52%、4.86 %,由此以得出单波段为自变量建立的模型可决系数较低且相对误差较大,并不适用于清河水库的悬浮物浓度预测,其主要原因为以上学者所研究的水体都是浑浊水体,并不适用清河水库的清洁水体。李云梅[20]利用TM2、TM3的波段组合建立Gordan对太湖悬浮物浓度进行了估测并取得了较好的效果,管义国[11]利用TM/ETM+3、4波段对巢湖水体悬浮物进行了估测,大多数估测值的相对误差在10%以内;赵碧云[21]以TM4/TM为自变量建立模型对滇池悬浮物进行了估算,其估算效果远高于单波段模型。通过以上学者的研究发现波段的组合运算能提高水质参数预测的准确性,因此本文以B2、B3、B5波段的波段组合为自变量分别建立线性回归模型与非线性的LS-SVM模型对清河水库进行悬浮物浓度反演,线性回归模型中以B3、B5为自变量建立的模型CTSM=0.06B3+0.087B5+26.77其可决系数最大,R2=0.686,其平均相对误差为3.52%,模型优于以B2、B3、B5为自变量的CTSM=0.1B2-0.081B3+0.025B5+15.948与以B2/B5为自变量的CTSM= -51.137B2/B5+85.94。以B2、B3、B5为自变量,实测悬浮物浓度为因变量建立的LS-SVM模型对清河水库悬浮物预测可决系数R2=0.88,显著性P<0.05,其平均相对误差为3.16%,因此,LS-SVM模型的预测效果远远好于线性回归模型。

图5 平均相对误差与相对误差图Fig.5 The average relative error and relative error

据此,利用LS-SVM模型对2015年6月23日的清河水库悬浮物浓度进行反演,其浓度分布如图6所示。水中悬浮物浓度在25 mg/L以内对淡水鱼无害,25~80 mg/L内可允许鱼类生长。由图6可以看出清河水库的悬浮物浓度均在80 mg/L范围内,悬浮物浓度在27.1~37.6 mg/L的绿色与黄色部分占清河水库库区的大半部分,红色部分代表藻类、鱼类活动比较旺盛的区域,主要分布在库区中央部分。由于反演时间为2015年6月23日,6月为铁岭较为干燥的季节,降水较少,藻类生长、鱼类活动较为旺盛,因此反演清河水库的悬浮物浓度相对较高。

图6 2015年6月23日清河水库总悬浮物浓度分布图Fig.6 TSM distribution map of Qinghe Reservoir on 23 Jun,2015

4 结 语

由于遥感反演水质参数受多种因素影响,简单的线性模型很难适应复杂水体结构,作为非线性的LS-SVM模型的预测结果与清河水库实测的悬浮物浓度较为接近,其可决系数与平均相对误差较线性模型都有不同程度的优化。但本文只选择了夏季的一天作为研究目标,为了实现反演模型的普适性,实验还应增加不同季节的悬浮物浓度的反演用以建立适应各个季节的反演模型。

[1] 张运林,秦伯强,陈伟民,等.太湖水体中悬浮物研究[J].长江流域资源与环境,2004,13(3):266-271.

[2] 查桂红.基于GOCI影像的内陆水体悬浮物浓度遥感估算研究[D]. 南京:南京师范大学,2013.

[3] Ostlund C, Flink P, Strombeck N, et al. Mapping of the water quality of Lake Erken, Sweden, from Imaging Spectrometry and Landsat The-matic Mapper [J]. The Science of the Total Environment, 2001,268:139-154.

[4] 马 驰,姜琦刚,李远华,等.利用ASTER影像反演松辽平原水体悬浮物浓度[J].水资源保护,2009,25(2):72-74.

[5] Binding C E, Bowers D G, Mitchelson-Jacob E G Estimating suspended sediment concentration from ocean colour measurements in moderately turbid waters; the impact of variable particle scattering properties [J]. Remote Sensing of Environment, 2005,94:373-383.

[6] 宋庆君,马荣华,唐军武,等.秋季太湖悬浮物高光谱估算模型[J].湖泊科学,2008,20(2):196-202.

[7] Dekker A G. Analytical algorithms for lake water TSM estimation for retrospective analyses of TM and SPOT sensor data [J]. Journal of Remote Sensing, 2002,23:15-35.

[8] Miller R L, McKee B A. Using MODIS Terra 250 m imagery to map concentration of total suspended matter in coast waters [J]. Remote Sensing of Environment, 2004,93(1-1):259-266.

[9] Dekker A G, Vos R J, Peters S W M. Comparsion of remote sensing data, model results and in situ data for total suspended matter(TSM) in the southern Frisian lakes [J]. Science of the Total Environment,2001,268(1-3):197-214.

[10] 温小乐,徐涵秋.基于多元同步数据的闽江下游悬浮物定量遥感[J].环境科学,2008,29(9):2 441-2 447.

[11] 管义国,王心源,吉文帅.巢湖水体悬浮物的遥感分析[J].遥感信息,2007,(5):39-43.

[12] 张毅博,张运林,査 勇,等.基于Landsat8影像估算新安江水库总悬浮物浓度[J].环境科学,2015,36(1):56-63.

[13] 李 渊,李云梅,施 坤,等. 基于光谱分类的总悬浮物浓度估算[J].光谱学与光谱分析,2013,33(10):2 721-2 726.

[14] 李 颖.基于环境1号卫星多光谱数据的太湖总悬浮物浓度估算模型研究[D]. 南京:南京师范大学,2011.

[15] 刘大召,陈楚群,刘汾汾,等.利用混合光谱分解估测珠江口悬浮泥沙浓度[J].热带海洋学报,2009,28(5):43-48.

[16] Williams P C. Implementation of near-infrared technology: in the agricultural and food industries[C]∥ USA: American Association of Cereal Chemists,Ins,2001.

[17] 徐红敏.基于支持向量机理论的水环境质量预测与评价方法研究[D].长春:吉林大学,2007.

[18] 送召青,崔 和,胡云安.支持向量机理论的研究与进展 [J].海军航空工程学院学报,2008,23(2):143-148,152.

[19] 阎威武,邵惠鹤.支持向量机和最小二乘支持向量机的比较及应用研究[J].控制与决策,2003,18(3):358-360.

[20] 李云梅,黄家柱,陆皖宁,等. 基于分析模型的太湖悬浮物浓度遥感监测[J].海洋与湖沼,2006,37(2):171-177.

[21] 赵碧云,贺 彬,朱云燕,等.滇池水体中总悬浮物含量的遥感定量模型[J].环境科学与技术,2001,94(2):16-18.

猜你喜欢
清河悬浮物波段
悬浮物对水质氨氮测定的影响
清河堡考略——明朝防御建州女真及后金的前沿堡城
承传统振百年清河 重实践育清正少年
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
小精豆爆笑校园
M87的多波段辐射过程及其能谱拟合
废水悬浮物国标检测方法的修改建议
压裂返排液中悬浮物去除的室内研究
雷州湾海域悬浮物浓度遥感监测研究