土壤重金属铬的高光谱估算模型

2019-08-15 10:43贺军亮崔军丽李仁杰
实验室研究与探索 2019年7期
关键词:实测值微分预测值

贺军亮,崔军丽,李仁杰

(1.石家庄学院 资源与环境科学学院,石家庄 050035;2.河北师范大学 资源与环境科学学院,河北省环境演变与生态建设实验室,石家庄 050024)

0 引 言

土壤是人类赖以生存的自然环境,也是有限的重要自然资源之一[1]。铬是生物生长活动所必须的一种微量元素,但超过一定浓度会对土壤及水环境造成污染[2]。土壤中的铬主要以三价和六价的形式存在,三价铬具有富集性、不宜迁移;六价铬毒性大、迁移性强,对自然环境及人类生产生活的危害极大[3-4]。因此,关于土壤重金属铬污染的监测防治十分必要。高光谱遥感可以快速、准确地获取土壤的光谱信息,且不会对地表土壤及植物造成伤害,为土壤环境质量监测研究提供了新的途径[5]。

实验室光谱测量和分析是高光谱遥感传感器波段设置和诊断机理研究的基础。目前,高光谱技术在土壤有机质及土壤养分的研究中较为成熟,对土壤重金属铬的研究较少[6]。龚绍琦等[7]利用高光谱技术获取了如东县洋口镇滨海盐土的反射率光谱,通过光谱特征波段建立多元逐步回归模型,成功预测了重金属Cr、Cu、Ni的含量。徐明星等[8]测定了苏北梁王城考古土壤的光谱信息,发现光谱数据与Cd、Cr、Cu、Ni、Pb含量存在显著相关关系,并且用多元逐步回归模型反演出了历史时期土壤重金属的含量。吴明珠等[9]选取福州亚热带红壤土为研究对象,以土壤Cr含量与光谱数据相关系数最大的敏感波段为自变量建立回归模型,通过对比分析得出土壤铬元素的高光谱最佳反演模型为指数模型。袁中强等[10]以四川若尔盖湿地为研究区,对原始光谱进行了一阶微分及倒数对数的光谱变换,利用偏最小二乘法分别建立了Cr、Cd、Cu、Pb、Zn的3种光谱形式的回归模型,发现一阶微分的偏最小二乘模型对土壤重金属的预测效果最好。不同形式的光谱变换指标所突出反映的光谱特征有所不同。目前关于重金属铬的研究多采用单一光谱变换指标构建模型,且大多集中在南方亚热带地区,对于北方地区的研究还较少。

本文以石家庄市地表水源保护区为研究区域,根据土壤光谱特征波段,运用单光谱变换指标单元回归(Univariate Unit Regression,U-UR)、单光谱变换指标多元逐步回归(Univariate Multiple Linear Stepwise Regression,U-MLSR)、多光谱变换指标多元逐步回归(Multivariate Multiple Linear Stepwise Regression,M-MLSR)、多光谱变换指标偏最小二乘回归(Multivariate Partial Least Square Regression,M-PLSR)4种方法建立土壤重金属铬的估算模型,并通过对比分析找出适合研究区的最佳模型,以期为今后土壤重金属铬的研究提供借鉴。

1 材料与方法

1.1 土壤样品采集

石家庄市地表水源保护区位于河北省石家庄市西部平山县和井陉县境内,为暖温带大陆性半湿润型季风气候。西部背靠太行山,地势西高东低,高差较大。土壤类型主要为褐土。水源地主体一级保护区由滹沱河干流、岗南水库和黄壁庄水库及其支流所组成,一级保护区外设置二级保护区和三级保护区。该区域是石家庄市生活饮用水源的主要供应地,也是北京、天津的备用水源地。但是,该地区开发历史悠久,人地矛盾突出,铁矿、石灰矿等矿产资源开采造成尾矿污染较为严重,对保护区生态安全造成一定影响[11-12]。

本研究考虑到土壤空间分布的不均匀性及区域内地形地貌条件的影响,采样点主要分布在中西部的二级和三级保护区内(见图1)。共采集土壤品68个,样本取土深度为0~20 cm,同时用GPS对采样地点进行定位。所有样品在实验室风干,研磨后过筛变成粉状土,以备土壤基本理化性质和可见光-红外光谱学特性测定试验所用。土壤铬含量的测定方法为电感耦合等离子体质谱仪ICP-MS检测法。

图1 研究区采样点分布图

1.2 土壤光谱测定

土壤反射光谱测定仪器采用美国ASD(Analytical Spectral Device)公司生产的FieldSpec Pro便携式光谱仪,测定的波段范围在0.35~2.5 μm,在0.35~1.00 μm之间采样间隔为1.4 nm,1.0~2.5 μm的采样间隔为2 nm,重采样间隔为1 nm。光谱测量在暗室中进行,利用高光谱专用卤素灯作为照明光源。将土壤样品置于放在黑色绒布上的直径10 cm、深2 cm玻璃培养皿内,用工具将表面刮平。光源入射角度为45°,与土壤样品表面的距离为30 cm。光谱仪探头距离土样表面15 cm,镜头视场角为5°。每次测定前先用白板进行定标,每个土样测10次,求算术平均值后作为该样本的代表性光谱曲线。

1.3 光谱数据预处理

受仪器信噪比、土样残留水分和光谱测量背景环境等影响,所得的光谱曲线数据存在一定误差,因此,将光谱曲线头尾误差较大部分及波动较大的光谱波段删除,最终保留1 640个波段用于土壤重金属铬估算模型的研究。本研究对光谱反射率(R)进行了一阶微分(FD)、二阶微分(SD)、倒数变换(RT)、倒数对数变换(AT)、倒数的一阶微分(RTFD)、倒数的二阶微分(RTSD)、倒数对数的一阶微分(ATFD)、倒数对数的二阶微分(ATSD)、连续统去除(CR)等9种光谱变换,在一定程度上能够提高信噪比,突出光谱特征波段[13]。

1.4 模型建立与验证

将68个土壤样本分成两份,随机挑选46个样本用来建模,剩余22个用作模型检验。采用R2和均方根误差(Root Mean Square Error,RMSE)来衡量模型的预测效果。当R2越大,RMSE越小时,模型的估算效果越好,准确性越高。

2 结果与分析

2.1 土壤重金属铬含量与光谱指标相关性分析

将10种不同的光谱变换指标与土壤重金属铬含量进行相关分析,结果如表1所示。表中各种光谱变换数据与铬元素含量均达到0.01级别的显著相关水平,说明研究区土壤光谱与重金属铬联系密切,可以用来指示土壤重金属铬的含量特征。

表1 土壤重金属铬含量与光谱指标的最大相关系数

注:*表示在0.01(双尾)的基础上相关性显著

土壤重金属铬含量与各种光谱变换数据相关系数最大的特征波段分别为411、421、425、446、634、894、1 254、1 566、1 909 nm。其中411、421、425、446 nm处是土壤氧化铁的微弱吸收峰;634 nm位于Fe2+的吸收区域;894 nm附近是Fe3+的吸收特征区;1 254、1 566 nm是铁锰氧化物及其水化物的吸收峰[14-16]。由此可见,土壤中的铁锰氧化物等与重金属铬存在一定的吸附共生关系。

2.2 U-UR模型

选取每种光谱变换指标中与重金属铬含量相关性最高的敏感波段值为自变量,重金属铬的含量为因变量,分别建立土壤重金属铬的线性、二次、指数、对数、幂函数等U-UR模型。根据R2最大和RMSE最小的原则选取每种光谱变换指标的最佳模型,如表2所示。其中基于RTFD光谱变换指标的二次函数模型对重金属铬的估算效果最好,R2=0.405,RMSE=4.721;基于SD、ATSD光谱变换指标的U-UR模型效果较差,R2均在0.2以下。

将22个检验样本数据代入估算效果最好的RTFD二次函数模型中,得出重金属铬含量的预测值。以土壤重金属铬含量的实测值为横坐标,预测值为纵坐标,绘制散点图(见图2)。模型验证散点图R2=0.300 9,RMSE=5.066,偏离1∶1线的样本较多,偏离程度较大,不能有效地预测土壤重金属铬含量。

表2 单光谱变换指标单元回归(U-UR)模型

注:模型方程中x为对应的光谱变换指标,下标数值为对应的敏感波段

图2 RTFD二次函数模型验证集实测值与预测值散点图

2.3 U-MLSR模型

在U-MLSR模型中,选取每种光谱变换指标与重金属铬相关性较高的前10个波段为自变量,重金属铬含量为因变量,建模结果如表3所示。其中基于ATFD光谱变换指标的U-MLSR模型建模效果最好,R2=0.587,RMSE=3.937。对比表2、3发现,除FD光谱变换指标外,其他光谱变换指标U-MLSR模型R2相比U-UR模型均有提高,RMSE有所下降。其中模型精度提升较为明显的为基于SD和ATSD光谱变换指标的U-MLSR模型,R2分别提高了0.383和0.274,RMSE降低了1.468和1.007。

图3所示为ATFD-U-MLSR模型预测值与实测值的散点图,其R2=0.503 9,RMSE=4.606,相比RTFD-U-UR二次函数模型其R2提高了0.203,RMSE降低了0.46,样点距离1∶1线的偏离程度缩小,模型对土壤重金属铬的预测精度有所提升。

表3 单光谱变换指标多元逐步回归(U-MLSR)模型结果

图3 ATFD-U-MLSR模型验证集实测值与预测值散点图

2.4 M-MLSR模型

同时选取10种光谱变换指标与重金属铬相关性最高的特征波段为自变量,重金属铬含量为因变量,建立土壤重金属铬的M-MLSR模型为

y=-194.549xRTFD634-59 002.341xATFD1 566-

50 437.999xSD894-269.504xR411+63.712

模型R2=0.689,RMSE=3.415,相比U-UR模型和U-MLSR模型其估算效果均有明显提升。

根据M-MLSR模型验证集实测值与预测值的对比散点图(见图4)可以看出,检验样本偏离1∶1线的个数较U-UR模型和U-MLSR模型有所减少,对重金属铬的估算精度有显著提高。

2.5 M-PLSR模型

将重金属铬含量的实测值作为因变量,M-MLSR模型中入选的反射率光谱、二阶微分光谱、倒数对数一阶微分光谱、倒数一阶微分光谱的波段作为自变量,建立M-PLSR模型。模型方程:

图4 M-MLSR模型验证集实测值与预测值散点图

y=-275.521xR411-17 912.8xSD894-

62 785xATFD1 566-221.716xRTFD634+62.954

模型的R2=0.668,RMSE=3.529,对比表2、3可以看出,M-PLSR模型的估算效果与单光谱变换指标模型相比有明显提高,但与M-MLSR模型相比R2略有降低,模型精度稍差。图5所示为重金属铬M-PLSR模型验证集实测值与预测值的对比图。通过验证,各样点基本沿1∶1线分布,预测值与实测值误差为3.728,达到较好的预测效果。

图5 M-PLSR模型验证集实测值与预测值散点图

3 讨 论

10种土壤光谱变换数据与重金属铬含量均达到显著相关水平,可以用来间接的反演土壤重金属铬的含量。土壤光谱敏感波段为411、421、425、446、634、894、1 254、1 566、1 909 nm,基本位于土壤铁锰氧化物的特征吸收带上。说明土壤重金属铬与铁锰氧化物等土壤组分存在一定的赋存共生关系。

前人在利用高光谱技术建立土壤有机质、重金属含量的U-MLSR估算模型时,多把相关系数通过0.01级别显著性检验的光谱波段或光谱全波段作为自变量[17-19],这样引入的自变量数目较多,模型的决定系数R2会相对较高,但模型较为复杂,运算量大,并且模型所受到背景噪声等的影响也会增大,导致模型稳定性和解释能力较低[20-21]。本研究中U-MLSR模型只采用了光谱变量与重金属相关性较高的10个波段作为自变量,在一定程度上降低了光谱噪声的影响,保证了模型的稳定性和简易度。

本研究综合考虑了各种光谱变量的特征,建立了M-MLSR模型和M-PLSR模型,对比单光谱变换指标模型其精度都有明显提高,建模效果更好。并且M-MLSR模型比M-PLSR模型的决定系数R2略高,模型的预测效果及稳定性都更好。本文以石家庄市水源保护区褐土为研究对象,土样经过研磨、风干处理后,虽然基本消除了土壤质地、土壤湿度等对土壤光谱的影响,但是土壤组分较为复杂,不同地区土壤具有其独特性,所建模型对其他地区是否适用还有待进一步研究。

4 结 论

本文通过不同方法对石家庄市水源保护区土壤重金属铬含量进行了估算预测,具体结论如下:

(1)各种土壤光谱变换形式与重金属铬含量均有显著相关性,相关性最大特征波段分别为411、421、425、446、634、894、1 254、1 566、1 909 nm,多位于土壤铁锰氧化物的特征吸收区域。

(2)就单光谱变换指标模型来说,U-MLSR模型对重金属铬的估算效果优于U-UR模型。除FD光谱变换指标外,其他各种光谱变换指标的U-MLSR模型建模效果相比U-UR模型均有提高。

(3)M-MLSR和M-PLSR两个多光谱变换指标模型的R2分别为0.689和0.668,RMSE为3.415和3.529,与单光谱变换指标模型相比,其建模精度明显提高。M-MLSR模型验证散点图的R2为0.640 6,RMSE为3.626,模型精度较高,对研究区土壤重金属铬的估算效果最为理想。

猜你喜欢
实测值微分预测值
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
Ap(φ)权,拟微分算子及其交换子
拟微分算子在Hp(ω)上的有界性
多复变整函数与其关于全导数的微分多项式
AI讲座:ML的分类方法
常用高温轴承钢的高温硬度实测值与计算值的对比分析
上下解反向的脉冲微分包含解的存在性
市售纯牛奶和巴氏杀菌乳营养成分分析
一种基于实测值理论计算的导航台电磁干扰分析方法