基于神经网络和GIS的耕地土壤铊含量分布及其驱动因素

2024-01-29 07:58张云霞郭朝晖肖顺勇谢慧民肖细元李长周中南大学冶金与环境学院湖南长沙40083湖南省生态环境农村工作站湖南长沙4004
中国环境科学 2024年1期
关键词:耕地流域聚类

张云霞,郭朝晖*,肖顺勇,谢慧民,肖细元,李长周(.中南大学冶金与环境学院,湖南 长沙 40083;.湖南省生态环境农村工作站,湖南 长沙 4004)

铊(Tl)是一种剧毒元素,被美国环境保护署列为优先污染物[1].Tl 可以通过吸入、摄入或皮肤接触进入人体,对中枢神经系统、循环系统和消化系统产生严重的影响[1].在环境中,Tl 通常以氧化态Tl(I)和Tl(III)的形式存在[2].一价Tl 具有亲硫性的特点,广泛分布于黄铁矿、闪锌矿、黄铜矿、硫酸盐类矿物等金属硫化矿中[3].由于Tl 离子与钾离子半径相似,Tl 离子容易替代钾长石和云母等矿物中钾离子[4].Tl 易迁移,含Tl 矿石或矿物在次生氧化作用下能够向环境释放大量Tl[5].由于其多样的生物地球化学行为,Tl 在环境中无处不在,但通常浓度非常低,平均地壳丰度约为0.8mg/kg[6].尽管地壳中Tl 含量很低,但近年来由于人为活动,如煤炭燃烧、废气排放、采矿和冶炼等,使得Tl 大量进入地表环境,引起了土壤Tl 污染、人畜慢性Tl 中毒等系列环境问题[7-10].由此带来的环境隐伏危机和对人体健康的潜在威胁也越来越明显.近年来,有关富含Tl 矿区及含Tl 矿石冶炼厂周围居民集体发生Tl 中毒事件及Tl 地方病在国内外已有报道[11-12],因此,开展典型区域土壤Tl 环境质量研究对于保障该区域内农业生产与人体健康具有重要意义.

湖南省是全国最大的水稻生产省份之一,也是有色金属之乡.研究区土壤类型复杂多样,母质母岩丰富,以往研究多集中在As、Cd、Pb 等元素的研究,涉及的研究区域范围小且以矿冶生产活动区周边土壤为主[13-16].因此,本文基于湖南省耕地土壤Tl 含量数据,利用多元统计分析、地理信息技术(GIS)和机器学习相结合的方法,研究了耕地土壤中Tl 的空间分布格局征及其驱动因素,为掌握耕地土壤Tl 环境质量、管控土壤Tl 潜在污染风险提供科学依据.

1 材料与方法

1.1 研究区域概况

研究区位于我国中部、长江中游南部,地理坐标为108°47′~114°15′E、24°38′~30°08′N,以山地、丘陵地貌为主.根据研究区内水系分布,将研究区分为6 个流域,分别为洞庭湖区、湘江流域、资江流域、沅水流域、 澧水流域和武水流域(https://www.hunan.gov.cn).研究区东部和南部海拔主要高于1000m,西部海拔主要在500~1000m之间,中部地区海拔主要在500m 以下,北部地区海拔主要在50m 以下.湖南成矿地质条件优越,矿产资源丰富,优势矿产多且分布相对集中,涉Tl 企业多分布在湘江流域、武水流域和沅水流域西北部.土壤类型主要为红壤、黄壤、黄棕壤、石灰土、水稻土、紫色土和潮土(图1).

图1 研究区采样点位、环境数据和土壤理化性质分布Fig.1 Distribution of sampling locations,environmental data and soil properties in the study area

1.2 样品采集与分析

充分利用研究区遥感影像图等资料,考虑地形地貌和土地利用方式的变化,分析聚集性耕地分布位置,本着代表性的原则,采样点远离污染区域和新近堆土以及田埂,远离公路与铁路以及矿厂周边重污染地段.通过网格布点,在网格内选择有代表性的耕地地块中间的开阔地带进行布点,使样品采集密度基本保持在每4km2布设一个采样点.采样时利用GPS 定位,同时考虑土地利用的变化和地形等因素,对采样点进行适度的调整,并对共布设耕地土壤样点7299 个(图1).以样点为中心,采用双对角线法5点混合采样,混合后四分法保留1.5kg 土壤,装入布袋中,采样深度在0~20cm.本研究的数据来源基于湖南省耕地土壤重金属污染加密调查进行的.

收集的土壤样品经自然风干后,研磨前去除碎石与植物残体等杂物后,过0.125mm 筛.采用电位法测定土壤pH 值,土水比为1:2.5.土壤有机质(SOM)含量采用K2Cr2O7-FeSO4滴定法测定[17].土壤阳离子交换含量(CEC)采用CH3COONH4交换法测定[18].土壤样品经硝酸-氢氟酸消解后,采用电感耦合等离子体质谱仪(ICP-MS)测定Tl 含量.分析过程中加入标准样品和空白样品检测.样品回收率在95%~105%之间,相对偏差控制在10%以内.

1.3 数据收集与预处理

土壤pH 值、有机质和阳离子交换量数据来自实验室分析结果,检测方法如1.2 节所述.涉Tl 企业数量来自 Bigmap 地图服务(http://www.bigemap.com).栅格数据(海拔、土壤类型、人口)和矢量数据(河流、道路)来自数据来源于资源环境科学与数据中心(https://www.resdc.cn).利用ArcGIS 10.7 中“空间分析”工具计算企业密度、路网密度和水网密度,空间插值后利用“值提取至点”工具将环境变量提取至土壤样点进行分析.环境变量和理化性质含量空间分布见图1.

1.4 空间聚类与变异

空间聚集具有统计显著性的高值(HH)聚类、低值(LL)聚类、高值主要由低值围绕的异常值(HL)以及低值主要由高值围绕的异常值(LH)[19-20].给定一组加权要素,使用Anselin Local Moran's I 统计量来识别具有统计显著性的热点、冷点和空间异常值.空间关联的Local Moran's I 的工作原理见公式(1)和(2):

式中,xi为变量x 在i 处的值;为x 的平均值;Wi,j为要素i 和j 之间的空间权重,即采样点i 和j 之间距离的倒数;为变量的方差;n 为样本总量.

1.5 影响因素识别方法

多层感知器(MLP)是一种常用的前馈神经网络模型,它由多个神经元层组成,每一层的神经元与前一层的所有神经元相连接[21-22].MLP 的工作原理如下:主要包括输入层、隐藏层和输出层,其中,输入层接收外部输入数据,并将其传递给下一层,将研究区环境数据(地形、企业密度、路网密度、水网密度、人口密度、土壤类型等)和土壤理化性质(pH 值、阳离子交换量和有机质含量)作为模型的输入层.MLP可以包含一个或多个隐藏层,每个隐藏层由多个神经元组成.隐藏层的神经元接收前一层神经元的输出,并对其进行加权求和激活函数处理,激活函数在神经元中引入非线性,允许MLP 模型学习和表示更复杂的模式,然后将结果传递给下一层,隐藏层的确定较为复杂.最后一个隐藏层的输出被传递到输出层,耕地土壤Tl 含量作为模型的输出值.输出层通常对结果进行最终的加权求和激活函数处理,得到最终的输出结果.使用双向正切和恒等式激活函数进行处理.MLP 通过重复进行前向传播和反向传播的过程来进行训练,并不断更新权重和偏置值,以减小预测误差.训练可以使用标记的训练数据集进行,通过迭代优化模型参数,使模型逐渐收敛到最佳状态.模型得到识别影响耕地土壤Tl 含量的关键因子,影响因素的重要性进行解析.

1.6 数据处理

使用SPSS 26.0对土壤Tl含量进行描述性统计.使用Origin2021 进行相关性和差异分析.使用R 语言进行神经网络模型,空间分布图ArcGIS10.2 平台上完成.

2 结果与分析

2.1 耕地土壤pH 值、有机质、CEC 和Tl 含量分布特征

研究区土壤pH 值均值为6.06±1.09(表1),呈弱酸性,分布面积较大.而弱碱性(7.5~8.5)土壤主要分布研究区的北部洞庭湖区和西南部邵阳等地(图1).土壤有机质均值为(34.16±13.47)g/kg,有机质含量高值(>40g/kg)主要分布研究区西南部.土壤CEC均值为(13.24±4.06)cmol/kg,研究区土壤阳离子交换量主要处于10~20cmol/kg 之间,且分布较为广泛.耕地土壤Tl 含量范围为0.01~7.33mg/kg,耕地土壤Tl 含量算术平均值(0.91±0.40)mg/kg,中位值为0.81mg/kg,耕地土壤Tl 含量变异系数为43.96%.将2017年全国农用地土壤污染状况详查工作中土壤Tl 含量评价参考值(1.0mg/kg)作为评价标准,耕地土壤Tl 含量均值低于标准值,表明耕地土壤中Tl环境质量较好.然而,耕地土壤Tl 含量算术平均值超过于中国土壤背景值(0.62mg/kg)和湖南省土壤Tl 含量背景值(0.61mg/kg)[2,23],也高于我国西南主要流域区浅层土壤 Tl 元素含量均值(0.80±0.39)mg/kg[10].表明研究区耕地土壤Tl 含量存在累积现象.

表1 研究区耕地土壤理化性质和Tl 含量描述性统计(n=7299)Table 1 Descriptive statistics of properties and Tl content of cultivated soil in the study area(n=7299)

2.2 基于流域和土壤类型的耕地Tl 含量分布特征

将湖南省耕地Tl 含量按流域进行分析.如图2所示,流域耕地土壤Tl 含量均值依次为:武水流域(1.10±0.56)mg/kg、湘江流域(0.96±42)mg/kg、沅水流域(0.81±0.36)mg/kg、资水流域(0.81±0.28)mg/kg、洞庭湖区(0.76±0.19)mg/kg 和澧水流域(0.68±0.21)mg/kg.单因素方差分析结果显示,武水流域和湘江流域Tl 含量均显著高于其他四个流域(P<0.05),武水流域Tl 含量显著高于湘江流域(P<0.05),且武水流域Tl 含量的变异系数>50%[24],属于高度变异,表明土壤Tl 含量在不同流域之间存在差异,且可能受到人为因素的干扰.

图2 不同流域和土壤类型耕地土壤Tl 含量分布特征Fig.2 Distribution of Tl content in cultivated soil base on basins and soil types

研究区不同土壤类型耕地Tl 含量分布如图2所示,如图2所示,耕地土壤Tl 含量均值依次为黄棕壤(1.42±0.70)mg/kg、黄壤(1.05±0.49)mg/kg、水稻土(0.91±0.40)mg/kg、红壤(0.91±0.42)mg/kg、石灰土(0.90±0.34)mg/kg、紫色土(0.77±0.26)mg/kg 和潮土(0.75±0.15)mg/kg.经单因素方差分析,黄棕壤的土壤 Tl 含量显著高于其他类型土壤(P<0.05),潮土的Tl 含量显著低于其他类型土壤(P<0.05).结果表明,土壤类型与耕地土壤Tl 含量分布有关.土壤类型是在成土过程中各因素综合作用下形成的.土壤类型的淋溶和有机质累积过程不同而使土壤Tl 含量可能存在差异[25-27].土壤类型可能是影响土壤Tl 含量空间分布的因素.

2.3 耕地土壤Tl 空间聚类与冷热点分析

空间自相关指数(Moran’s I)被使用去判断研究区耕地土壤Tl 是否具有空间上的聚类特征(图3).研究区耕地土壤Tl 在空间上呈聚类趋势,呈现空间正相关关系.耕地土壤Tl 的Moran’s I 值为0.23,表明重金属在空间上呈聚类形式,且空间正相关表现明显,数值倾向于在空间上发生聚类,即高值聚集在其它高值附近;低值聚集在其它低值附近.因此,使用局部空间自相关去绘制聚类分布图(图3).结果显示,研究区耕地土壤Tl 的高-高值聚类(热点,HH)样点集中分布在湘江流域东南部和武水流域中部地区,占比为16.9%;Tl 冷点(LL)即低-低值,主要分布在洞庭湖流域和中部地区,占比为30.8%.结合地形图(图1),发现热点主要分布在海拔800m 以上区域.冷点主要分布在低海拔地区(<100m).Tl 空间异常值多出现在冷点和热点附近,特别是流域地形起伏变化较大的地区,表明土壤Tl 含量可能受地形的影响.Tl 空间异常值以低值异常值(LH)和高值异常值(HL)为主,低值异常值主要分布在武水流域和湘江流域南部地区,高值异常值主要分布在洞庭湖区和资水流域中部地区,表明该区域土壤Tl 含量的分布可能受到人为因素的干扰,且受到多种因素的综合影响.

图3 耕地土壤Tl 含量聚类和空间分布Fig.3 Clustering and spatial distribution of Tl content in cultivated soil

2.4 耕地土壤中Tl 含量空间分布特征

对研究区耕地土壤Tl 含量进行空间插值,依据湖南省土壤Tl 含量背景值(0.61mg/kg)和2017年全国农用地土壤污染状况详查工作中土壤Tl 含量评价参考值(1.0mg/kg),将土壤重金属含量划分为6 级(I 级:小于 0.61mg/kg,Ⅱ级:0.61~1.0mg/kg,Ⅲ级:1.0~2.0mg/kg,Ⅳ级:2.0~3.0mg/kg,Ⅴ级:3.0~5.0mg/kg,Ⅵ级:大于5.0mg/kg),并绘制耕地土壤Tl含量空间分布图.从图3 可以看出,流域耕地土壤Tl 含量主要以1~2 级为主,即低于1.0mg/kg.主要分布在沅水流域的中部地区(辰溪、溆浦、芷江等县市区),资水、沅水、澧水和洞庭湖流域交界的区域(桃源、汉寿、临澧等).高Tl 区域主要分布在湘江流域南部和东南部地区,资水流域西南部和武水流域地区.耕地土壤Tl含量呈现从东南部向西北部降低的趋势,呈现“东高西低,南高北低”的含量特征,表明不同流域之间耕地土壤Tl 具有空间差异.研究区耕地土壤Tl 含量空间分布结果与空间聚类结果一致.有文献报道,含Tl矿石的开采和冶炼等工业活动[12,28-29],Tl 被释放进入周围的环境中,导致土壤中Tl 含量积累.而湘江流域南部和武水流域采选冶矿业活动密集,可能是导致土壤Tl 含量高值密集区出现的主要原因.

2.5 土壤Tl 含量空间分布主控因素

研究区成土母质、土壤类型、涉Tl 企业分布、路网、水网和土壤理化性质均有可能是影响耕地土壤Tl 含量的空间格局的因素[20,26,30-31].相关性结果表明(表2),耕地土壤Tl 含量与海拔、路网和水网密度等环境变量以及理化性质呈显著相关性,表明其可能是影响耕地土壤Tl 含量空间分布格局的因素.另一方面虽然涉Tl 企业密度与耕地土壤Tl 含量没有显著相关,但其会影响耕地土壤Tl点源分布.因此,利用神经网络进一步分析不同因素对耕地土壤Tl含量的空间分布格局的贡献.基于神经网络分析结果表明(R2>0.5),影响研究区耕地土壤Tl 含量空间分布格局的主要因素依次为海拔、水网密度、路网密度和土壤理化性质(图4).而不同流域耕地土壤Tl 的主控因素不一致.武水流域耕地土壤Tl 含量的空间分布格局主要影响因素为企业密度、SOM 和路网密度;湘江流域耕地土壤Tl 含量的空间格局主要影响因素是海拔、水网密度、CEC 和路网密度;资水流域则是路网密度、水网密度、海拔、人口密度企业密度.这与研究区海拔和耕地土壤Tl 含量的空间分布一致.

表2 耕地土壤Tl 含量与各因素的Pearson 相关性分析Table 2 Pearson correlation between Tl content and various factors in cultivated soil

图4 耕地土壤Tl 空间分布格局的影响因素重要性Fig.4 The importance of factors influencing the spatial distribution pattern of Tl in cultivated soil

2.5.1 海拔和水网密度 海拔显著影响土壤Tl 的空间分布,高海拔地区(>800m)土壤Tl 高度富集;中海拔地区(800~100m)存在耕地土壤Tl 累积显著;低海拔地区(<100m)土壤Tl含量较低.较高的海拔地区可能具有较低的气温和较高的降水量[30],较低温度可能降低土壤中的微生物活动和有机物分解速率,高降水量可能会导致Tl 的淋溶,使其从土壤中被冲走或向下迁移从而影响土壤中 Tl 的转化和迁移[33-34].但地形的原因转化和迁移无法到达低海拔地区.另外,不同海拔地区的土壤岩石来源和土壤成分的差异也可能导致Tl 含量的空间变化,金属矿山是土壤Tl 含量的重要来源,一般处于高海拔地区.水网密度指的是研究区水系的分布密度和互相连接的程度,水网密度高的流域通常有更多的河流、溪流和湖泊等水体且具有较复杂的水文过程,水体在流动过程中可以携带溶解性的Tl,而河流的冲刷作用和洪水的淹没等过程也会加剧流动的过程,进而对土壤中的Tl 含量产生影响.水网密度高的流域更容易发生土壤侵蚀,土壤侵蚀可能会导致Tl 从坡面和耕地等区域被剥蚀,并随着水流的输送沉积到其他地点.这可能导致一些地区的土壤Tl 含量升高,而另一些地区的含量降低,最终导致不同的区域土壤Tl含量分布不一.综上,水力驱动是影响区域耕地土壤Tl 的因素.

2.5.2 路网密度和涉Tl 企业密度对耕地土壤Tl 含量的影响 Tl 可存在与造岩矿物、硫化物、含硫酸盐类矿物中,也可存在于沉积成因的锰矿、煤矿、钾盐、白铁矿等矿物内[2,35].而矿产的采矿选矿冶炼过程排放的“三废”通过大气、水或混合污染等途径影响周边耕地土壤质量,是耕地土壤Tl 含量的主要来源之一[36-37].因此,矿产企业密度集聚一定程度上增加土壤中Tl 含量.从涉Tl 企业密度分布(图1)可以看出,企业集中分布在湘江流域南部和武水流域等区域.武水流域和湘江流域南部涉Tl 企业较多,包括含铊金属矿山采矿和选矿,铅锌冶炼、钢铁冶炼、冶炼废渣再生利用企业(主要是生产氧化锌、硫酸锌的企业)等重点行业,这些涉Tl 企业存在循环废水Tl浓度高,部分企业初期雨水和地面冲洗水未有效收集处理,含Tl 污泥处置不到位等问题[9,12,38].此外,虽然一些企业废水达标排放后仍有部分Tl 污染物排入环境中,低浓度含Tl 污水常年灌溉耕地土壤也可能导致土壤Tl 污染.涉Tl 企业密集区与耕地土壤Tl累积区域高度吻合,表明企业聚集程度及空间分布是影响耕地土壤Tl 含量积累和分布的重要因素之一.路网密度指的是流域内道路网络的分布密度和互相连接的程度.高路网密度会导致土壤侵蚀和道路扰动增加,扰动和重新排列过程可能会将原本富含Tl 的土壤颗粒搬运到其他地区,道路建设和人类活动可以破坏土壤结构和植被覆盖,加速土壤侵蚀,从而可能使Tl 从土壤中释放或迁移至其他地区.路网密度高的区域往往有更多的人类活动,如交通运输和工业活动.高路网密度区域附近的土壤可能受到更多污染源输入的影响,从而导致土壤Tl 含量较高.因此,工业活动是影响区域耕地土壤Tl 的因素.

2.5.3 土壤类型和理化性质对耕地土壤Tl 含量的影响 土壤中Tl 不仅来源于人为干扰,也来源于自然因素[39].自然界土壤中Tl 来源于岩石风化,成土母质对土壤Tl 含量具有较大影响[2,40].土壤的形成与成土母质密切联系,所以土壤Tl 含量与土壤类型也同样相关.土壤形成过程中的物理、化学和生物作用也会对土壤Tl 含量的空间格局产生影响.山地草甸土成土过程以有机质累积过程为主,呈弱酸性.黄棕壤是由强淋溶作用形成,呈酸性,常含有适量的矿物质,如石英、长石和云母等,而由于Tl 离子与钾离子半径相似,Tl 离子容易替代钾长石和云母等矿物中钾离子,在黄棕壤中富集[41].酸性土壤通常具有较高的Tl 含量,而高有机质含量的土壤可能增加Tl 的吸附能力[10,42],紫色土容易发生水土流失,土壤结构较差,有机质含量较低,导致土壤铊含量也比较低[26],各土壤类型的淋溶、黏化和有机质累积过程不同而使土壤Tl 含量存在空间差异.

综上所述,研究区耕地土壤Tl 含量的空间格局受水力、工业活动和自然因素的综合影响,大区域分析中会忽略小区域存在的具体特点,因此在具体研究中,需要综合考虑这些因素,并结合实地调查和采样分析,以获得更准确的结论.

3 结论

3.1 研究区耕地土壤 Tl 含量范围为 0.01~7.33mg/kg,耕地土壤Tl 含量算术平均值(0.91±0.40)mg/kg,中位值为0.81mg/kg,明显低于2017年全国农用地土壤污染状况详查工作中土壤Tl 含量评价参考值(1.0mg/kg),耕地土壤Tl 环境质量整体良好.武

水流域、湘江流域、沅水流域、资水流域、洞庭湖区和澧水流域耕地土壤Tl 含量算术平均值依次为1.10,0.96,0.81,0.81,0.76 和0.68mg/kg.

3.2 耕地土壤Tl 含量呈现 “东高西低,南高北低”趋势,流域耕地土壤Tl 含量呈现空间正相关性,数据集中的值倾向于在空间上发生聚类.其中,高值聚类区主要分布湘江流域南部地区和武水流域.

3.3 研究区耕地土壤Tl 含量积累和分布格局受水力、工业活动和自然因素的综合影响.高海拔和水网密度区耕地土壤Tl 累积明显.黄棕壤的土壤Tl 含量显著高于其他类型土壤.

猜你喜欢
耕地流域聚类
自然资源部:加强黑土耕地保护
我国将加快制定耕地保护法
压油沟小流域
保护耕地
新增200亿元列入耕地地力保护补贴支出
堡子沟流域综合治理
罗堰小流域
打造智慧流域的思路及构想——以讨赖河流域为例
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像