保定市三县交接处土壤铅锌元素高光谱反演研究

2023-12-28 04:44张亚龙黄照强朱富晓
中国矿业 2023年12期
关键词:光谱重金属建模

张亚龙,黄照强,倪 斌,江 淼,朱富晓

(中国冶金地质总局矿产资源研究院,北京 101300)

0 引言

铅、锌是普遍存在于土壤中的重金属元素,由于金属冶炼活动会对周边地区造成重金属污染,对于人体健康存在重大风险。中国地质调查局对全国土地质量地球化学调查中发现,我国约230 万hm2的耕地属于重金属中-重度污染[1]。河北省地质调查院在对河北省平原区开展地球化学调查中发现,保定市东南部土壤存在重金属污染[2]。开展该地区铅锌重金属污染情况的分析研究对于了解雄安新区土壤污染情况和土壤污染评价具有重要作用。

传统的土壤重金属研究需要进行大量样品的采样和分析,需要投入巨大的人力和时间,开展大范围土壤重金属研究需要的周期较长[3]。近几年,随着高光谱遥感的快速发展,大尺度重金属污染越来越受到广大国内外学者的重视,其基于高光谱遥感数据和土壤重金属元素化验数据,依据铅元素、锌元素与光谱信息之间的响应关系对土壤中铅、锌两种重金属元素污染进行了大量研究。解宪丽等[4]研究土壤重金属含量与光谱反射率之间的关系,得出Pb、Zn、Co、Ni、Fe 的最高相关系数达到高度相关(|r|>0.80);王璐等[5]基于土壤反射光谱利用偏最小二乘法构建了Cd、Pb、Hg 含量预测模型;陈银莹等[6]通过相关分析研究土壤铜、铬、锰、铅、锌的特征波段,利用元素含量、光谱反射数据变换和特征波段的关系构建土壤重金属高光谱反演模型;谭琨等[7]基于ASD 获取的土壤高光谱数据,建立了As、Pb、Cr、Cu、Zn 五种重金属元素的定量反演模型;AND 等[8]通过重金属污染区的高光谱数据,利用多元线性回归方法和人工神经网络方法对重金属元素光谱数据进行建模分析,得到的模型预测精度较高;单海斌等[9]通过六种光谱变换,研究土壤有机质含量和土壤光谱特征的关系,建立了研究区灰漠土土壤有机质含量高光谱反应模型;马磊等[10]建立了地物光谱和Landsat8 数据的偏最小二乘法土壤铅含量反演模型,通过该模型能够粗略预测土壤中铅含量;阿依努尔·麦提努日等[11]对吐鲁番盆地葡萄园土壤光谱进行15种变换,并研究其与Pb 元素含量的关系,建立偏最小二乘回归模型和地理加权重回归模型,估算土壤中Pb 的含量;黄启厅等[12]利用偏最小二乘法定量分析了土壤中Pb 的含量。

综上所述,利用高光谱数据与土壤重金属实测含量建立的反演模型可以有效预测重金属含量。本研究选取保定市西南部三个县城交界处土壤重金属中Pb 元素、Zn 元素为研究对象,在室内使用SVC(HR-1 024)地物光谱仪获取土壤高光谱数据,与实验室测量的土壤Pb、Zn 含量数据相结合,分析研究区土壤的光谱特征,采用偏最小二乘法(PLS)和反向传播神经网络法(BPNN)建立Pb 元素、Zn 元素预测估算模型,最终确认研究区Pb、Zn 两种金属元素的最优反演方法和估算模型。

1 研究区概况

研究区位于保定市清苑县、安新县和高阳县三县交接处,主要行政区划包含老河头镇、芦庄乡、何桥乡、同口镇等乡镇,面积约447 km2。研究区内有色金属、冶炼、纺织业、纸业、蓄电池等产业发达。该地区在历史上存在大量的多金属冶炼厂,承担着钢铁冶炼功能,工业的粗放式发展和废弃冶炼厂尾矿渣的堆放,随着降雨、大风等原因造成部分耕地土壤环境铅锌重金属元素超标[13-16]。

2 研究方法

2.1 样品采集与化验分析

2.1.1 土壤样品采集

采样时间为2020 年9 月—11 月,样品采集深度为0~20 cm 的耕作层土壤,共采集438 件,采样点位分布如图1 所示。样品采集采用S 形布设,由4 处子采样点样品组合成一个混合样。采样时使用手持GPS 对采样点经纬度进行采集,并且将采样点详细信息录入土壤信息采集系统。

图1 研究区及采样点位置图Fig.1 Location map of study area and sampling points

2.1.2 样品化验

本次采集的土壤样品由中国冶金地质总局物勘院测试中心进行重金属元素的化验,样品经风干(确保无污染)、过筛(孔径0.074 mm 标准筛)、送样(采用四分法混合均匀),每个采样点样品分成两份,一份用于化学分析,采用X 射线荧光光谱仪,利用波长色散型X 射线荧光光谱方法进行检测;另一份用于室内光谱测量。

2.2 样品光谱测定及处理

样品光谱测量仪器为SVC HR-1024 型地物光谱仪,光谱波长范围350~2 500 nm。样品光谱测定在暗室中进行,盛放于黑色器皿中,将表面刮平后,进行光谱测定。以接触式高密度反射探头测定,该种光谱测定受外界杂散光干扰较少,获得的土壤光谱数据更加精确。测量中始终确保土样和探头之间完全接触,在测定下一个样本时,将接触探头上的残留土样清除干净,尽量避免各土样间相互混合、相互干扰。每个样品进行5 次光谱测量,取平均值,以减少误差,提高精度,每测定5 个样本,需要做一次白板校准,确保每个土样同样的测定标准。利用ENVI 软件剔除异常曲线后,取光谱反射率平均值作为该样品原始实测光谱数据。

对土壤样品的原始实测光谱进行平滑处理,再对其分别进行一阶导数(FD)、二阶导数(SD)、连续统去除(CR)、多元线性回归(MSC)、归一化(Normalize)和标准正态变换(SNV)六种光谱变换处理,以减少背景噪声。

2.3 单因子污染指数法

单因子污染指数法[17]是计算土壤中污染物指标i的单项污染指数Pi,计算见式(1)。

式中:Ci为土壤中污染物指标i的实测质量分数,mg/kg;Si为土壤中污染物指标i在《土壤环境质量农用地土壤污染风险管控标准(试行)》(GB 15618—2018)中给出的二级标准值,mg/kg。Pi≤1 时土壤重金属含量在土壤背景值范围内,土壤未受到人类活动污染;Pi>1 时土壤受到人为污染,指数值越大土壤重金属累积污染程度越大,土壤环境地球化学等级划分见表1[17-18]。

表1 土壤环境地球化学等级划分Table 1 Geochemistry classification of soil environment

2.4 反演模型建立与分析

2.4.1 相关性分析

皮尔逊(Pearson)相关系数是评价相关性的常用指标之一,表示两变量间的协方差与标准差的商,取值范围为[-1,1]。rXY越大,变量X与变量Y相关性越高,1 表示正相关,-1 表示负相关,0 表示不相关。

2.4.2 偏最小二乘法

偏最小二乘法[19-20](Partial Least Squares,PLS)是一种多自变量对多因变量的线性回归建模方法,可同时实现提取变量特征、分析变量间相关性和回归建模,适合多元数据的统计分析。本文中PLS 模型运算在The UnscramblerX10.4 软件中完成。

2.4.3 反向传播神经网络法

反向传播神经网络[21](Back Propagation Neural Network,BPNN)是一种有效的多层神经网络学习方法,通过反向传播不断调整网络的权值和阈值,使网络的最终输出尽可能接近预期输出,从而达到训练目的。当网络处于学习过程时,信号从输入层传输到输出层。如果输出结果不符合目标,则将梯度反馈到网络中,以调整每个神经元的权重和偏差,并最小化预测数据和实际数据之间的误差。本文中BPNN 算法是基于软件Matlab 2020 版本编写和实现。

2.5 模型验证

模型的稳定性用决定系数R2的大小来检验,模型的精度用均方根误差(Root Mean Square Error,RMSE)来检验,R2越大、RMSE值越小,模型性能越好。

3 结果与讨论

3.1 土壤样品统计分析

本次对438 件土壤样品进行统计分析,样品中Pb 含量、Zn 含量统计分析见表2。研究区Pb、Zn 两种元素含量平均值均高于冀中平原背景值和中国土壤背景值,分别为3.6 倍、2.3 倍和3.1 倍、2.2 倍,两个元素在研究区存在一定的富集,Pb 元素的富集程度较高于Zn 元素。与土壤污染风险筛选值相比,Pb元素、Zn 元素平均值均低于筛选值,但最大值远高于筛选值,分别为4.3 倍和3.5 倍,两种金属在研究区存在局部超标的情况。从变异系数来看,两种金属的变异系数在0.9 以上,Pb 元素变异程度稍高于Zn元素。

表2 重金属Pb 元素、Zn 元素实测含量统计Table 2 Statistics of measured content of heavy metal Pb and Zn elements

根据土壤重金属污染的单因子指数法测算,样品中Pb 元素有413 个属于清洁,占比94.29%;18 个属于轻微污染,占比4.11%;2 个属于轻度污染,占比0.46%;5 个属于中度污染,占比1.14%。样品中Zn 元素有398 个属于清洁,占比90.87%;25 个属于轻微污染,占比5.71%;10 个属于轻度污染,占比2.28%;5 个属于中度污染,占比1.14%(表1 和表3)。总体来说,研究区土壤中重金属Pb 元素、Zn 元素存在一定污染。

表3 重金属Pb 元素、Zn 元素污染指数Pi 统计分析Table 3 Statistical analysis of pollution index Pi for heavy metal Pb and Zn elements单位:个

3.2 空间分布特征分析

为反映研究区土壤重金属Pb 元素、Zn 元素空间分布特征,利用ArcFIS 软件地统计学模块对Pb 元素、Zn 元素污染指数Pi进行反距离权重插值(IDW),得到Pb 元素、Zn 元素的污染指数分布图,并按照土壤环境地球化学等级划分标准,以不同颜色对应不同土壤环境加以界定划分,结果如图2 所示。

图2 重金属元素污染指数分布图Fig.2 Pollution index distribution of heavy metal elements

由图2 可知,研究区土壤中Pb、Zn 污染主要集中在安新县和清苑县交界处,其中,Pb 污染区分布于工作区中部,主要在安新县老河头镇和清苑县望亭镇、何桥乡周边;Zn 污染区主要分布于工作区西南部,主要在清苑县何桥乡周边。

3.3 Pb、Zn 含量与光谱变换后反射率的相关性分析

将原始光谱进行FD、SD、CR、MSC、Normalize和SNV 六种光谱变换,再分别对Pb 元素、Zn 元素含量和六种光谱变换进行皮尔逊(Pearson)相关性分析,比较不同光谱变换形式对相关程度的影响,得出两种元素与六种光谱变换后最大相关系数及对应的特征波段,见表4。

表4 Pb、Zn 含量与光谱反射率间最大相关系数Table 4 Maximum correlation coefficient between Pb,Zn contents and spectral reflectance

由表4 可知,Pb 元素与六种光谱变换的相关系数中,Normalize 变换相关系数绝对值不足0.400,其余相关系数绝对值均高于0.400,其中,MSC 变换在波段553.2 nm 处相关性最高,为-0.451。Zn 元素与六种光谱变换的相关系数中,Normalize 变换相关系数绝对值不足0.400,其余相关系数绝对值均高于0.450,其中,SD 变换在波段746.5 nm 处相关性最高,为-0.564。

3.4 PLS 分析

将438 个样本按实测重金属元素含量从高到低排序,每3 个样本抽取1 个验证样本,最终选取292个样本作为建模样本,剩余146 个样本用作模型的验证样本。选取六种光谱变换后的反射率作为模型的自变量,土壤重金属含量实测值为因变量,建立PLS模型。

3.4.1 Pb 元素PLS 分析

基于六种光谱变换,通过PLS 建模和验证结果发现,以SD 为自变量的PLS 模型的建模精度R2最高,为0.441,RMSE值为60.848;以FD 变换为自变量的PLS 模型的验证精度R2最 高,为0.529,RMSE值为48.276(表5)。以验证样本Pb 含量的实测值作为横坐标,PLS 模型中Pb 含量预测值作为纵坐标,得出实测值与预测值的散点图(图3)。对比六种光谱变换的模型精度,综合建模精度、验证精度和均方根误差,其中,基于FD 和SD 的PLS 模型预测效果比较相近,效果较好。

表5 Pb 元素PLS 模型结果Table 5 Results of PLS model for Pb element

图3 基于PLS 建立的Pb 元素模型精度评价Fig.3 Accuracy evaluation of Pb element model based on PLS

3.4.2 Zn 元素PLS 分析

基于六种光谱变换通过PLS 建模和验证结果发现,以SD 为自变量的PLS 模型建模集精度和验证集精度最高,分别为0.632 和0.445,RMSE值分别为94.111 和109.289(表6)。以验证样本Zn 含量的实测值作为横坐标,PLS 模型中Zn 含量预测值作为纵坐标,得出实测值与预测值的散点图(图4)。对比六种光谱变换模型精度,综合建模精度、验证精度和均方根误差,其中,基于SD 的PLS 散点图基本分布在1∶1 线附近,模型预测效果相对比较理想。

表6 Zn 元 素PLS 模型结果Table 6 Results of PLS model for Zn element

图4 基于PLS 建立的Zn 元素模型精度评价Fig.4 Accuracy evaluation of Zn element model based on PLS

3.5 BPNN 分析

3.5.1 Pb 元素BPNN 分析

基于六种光谱变换,通过BPNN 建模和验证发现,其中,以SNV 变换为自变量的BPNN 模型建模精度R2较高,为0.949,RMSE值为18.531;以FD 变换为自变量的BPNN 模型验证精度R2较高,为0.991,RMSE值为8.461(表7)。以验证样本Pb 含量的实测值作为横坐标,BPNN 模型中Pb 含量预测值作为纵坐标,得出实测值与预测值的散点图(图5)。对比六种光谱变换模型精度,综合建模精度、验证精度和均方根误差,基于SNV 变换的BPNN 散点图都基本分布在1∶1 线附近,模型预测效果最理想。

表7 Pb 元素BPNN 模型结果Table 7 Results of BPNN model for Pb element

图5 基于BPNN 建立Pb 元素模型精度评价Fig.5 Accuracy evaluation of Pb element model based on BPNN

3.5.2 Zn 元素BPNN 分析

基于六种光谱变换通过BPNN 建模和验证发现,其中,以CR 变换为自变量的BPNN 模型建模精度和验证精度较高,建模精度R2为0.874,RMSE值为53.183,验证精度R2为0.957,RMSE值为35.721(表8)。以验证样本Zn 含量的实测值作为横坐标,BPNN 模型中Zn 含量预测值作为纵坐标,得出实测值与预测值的散点图(图6)。对比六种光谱变换模型精度,综合建模精度、验证精度和均方根误差,基于CR 变换的BPNN 散点图都基本分布在1∶1 线附近,模型预测效果最理想。

表8 Zn 元素BPNN 模型结果Table 8 Results of BPNN model for Zn element

图6 基于BPNN 建立Zn 元素模型精度评价Fig.6 Accuracy evaluation of Zn element model based on BPNN

4 结论

1)研究区土壤中Pb 元素、Zn 元素的平均含量均远高于冀中平原土壤和中国土壤的背景值,Pb 元素属于强变异,Zn 元素属于中等变异,均存在局部重金属超标的情况,Pb、Zn 两种重金属元素已在研究区内造成了一定的重金属污染。

2)通过对研究区土壤Pb 元素、Zn 元素含量统计分析发现,土壤中Pb、Zn 污染占比为分别为5.71%和9.13%,其中大部分为轻微污染和轻度污染,均不存在重度污染。

3)通过PLS 模型和BPNN 模型对研究样品进行建模分析,在PLS 方法中,Pb 元素FD 模型和SD 模型精度较好,Zn 元素SD 模型精度较好;在BPNN 方法中,Pb 元素SNV 模型精度较好,Zn 元素CR 模型精度较好。

4)通过两种建模方法对于Pb、Zn 两种元素的建模精度对比,BPNN 的模型精度要高于PLS。其中,Pb 元素应用BPNN 基于SNV 建立的估算模型中建模精度R2为0.949,验证精度R2为0.980,为最佳估算模型;Zn 元素应用BPNN 基于CR 建立的估算模型中建模精度R2为0.874,验证精度R2为0.957,为最佳估算模型。

猜你喜欢
光谱重金属建模
基于三维Saab变换的高光谱图像压缩方法
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
重金属对膨润土膨胀性的影响
基于PSS/E的风电场建模与动态分析
测定不同产地宽筋藤中5种重金属
不对称半桥变换器的建模与仿真
ICP-AES、ICP-MS测定水中重金属的对比研究
再生水回灌中DOM对重金属迁移与保留问题研究
星载近红外高光谱CO2遥感进展
苦味酸与牛血清蛋白相互作用的光谱研究