基于SSA-BP与SSA的地下水污染源反演识别

2022-12-20 02:00葛渊博卢文喜白玉堃潘紫东
中国环境科学 2022年11期
关键词:污染源反演神经网络

葛渊博,卢文喜,白玉堃,潘紫东

基于SSA-BP与SSA的地下水污染源反演识别

葛渊博,卢文喜*,白玉堃,潘紫东

(吉林大学新能源与环境学院,地下水与资源环境教育部重点实验室,吉林 长春 130012)

应用基于SSA-BP神经网络替代模型的模拟-优化方法和SSA研究了地下水污染源位置及释放历史的反演识别问题.并在建立地下水水流模型时,应用Cholesky分解方法建立含水层渗透系数连续场,该方法相比于普通的参数分区方法更好地描述了水文地质参数的非均质性.结果表明:SSA-BP神经网络替代模型对模拟模型具有较高的逼近精度,其平均相对误差仅有3.21%.应用SSA求解优化模型,能够快速准确地识别出点污染源的位置及释放历史.SSA对污染源位置的反演识别相对误差在10%左右,对污染源源强的反演识别相对误差不超过4%.因此,本文所提出的方法是一种有效的地下水污染源识别方法,可为污染责任认定及污染修复方案的优化提供参考.

污染源反演识别;模拟-优化方法;替代模型;麻雀搜索算法;SSA-BP神经网络替代模型

地下水污染具有存在的隐蔽性和发现的滞后性等特点[1-2],给地下水污染修复方案的合理设计、污染责任的准确认定和污染风险预警等都带来很大困难[3].地下水污染源识别可以根据已有的观测数据(水位和污染质浓度观测数据),以及现场调查和专业经验等辅助信息,对描述地下水污染的数学模拟模型进行反演求解,从而识别地下含水层中污染源位置、污染源源强以及污染源释放历史[4-5].

地下水污染源识别的研究方法主要有解析法、直接法、模拟-优化方法以及随机统计方法.其中基于模拟-优化方法的地下水污染溯源辨识问题应用最早且最为广泛[6-7].目前模拟-优化方法仍旧处于发展阶段,并面临着诸多待解决的科学问题:第一, GMS软件在地下水数值模拟等方面应用十分广泛,并取得了很好的效果[8].在地下水水流模型的建立过程中,建模者限于对实际水文地质条件认识的局限性,大多采取了参数分区的方式来描述水文地质参数的非均质性[9-10].参数分区的方式过于简单,并不能很好地描述水文地质参数的空间变异性,往往也会导致模拟结果的不确定性.第二,在进行模拟优化的过程中需要反复多次地调用地下水数值模拟模型,会产生大量的计算负荷,耗费大量计算时间.建立具有较高精度的替代模型来代替模拟模型进行迭代计算,可以有效解决这个问题[11].替代模型属于一种黑箱模型,并且与模拟模型具有近似相同的输入输出关系[12].国内外学者利用自适应神经网络、支持向量机等浅层学习方法建立了地下水数值模拟模型的替代模型[13-16].浅层学习方法在理论分析和实际应用中展现出了良好的优越性.但面对维数较高、线性程度复杂的问题时,使用浅层学习方法建立的替代模型难以满足精度要求.深度学习方法更适合于解决复杂问题,但是其计算时间相比浅层学习方法会有所增加.试想研究一种替代模型,使之在面对复杂问题时既可以保持较高的精度,计算时间还相对较少.第三,求解优化模型同样也需要一种高效的求解算法.目前为止应用最广泛的优化算法有以梯度为基础的传统优化算法和启发式优化算法两种,传统优化算法包括爬山法、最速下降法、共轭梯度法等,启发式优化算法包括模拟退火算法、贪婪算法、遗传算法、鲸鱼算法、蚁群算法等.有研究人员将遗传算法、单纯形法、模拟退火算法等应用于地下水污染源及水文地质参数识别,并取得了很好的效果[17-19].然而,传统的优化算法在面对复杂困难的优化问题时具有较大的局限性,某些启发式算法在面对具体问题时也会出现局部搜索能力差,收敛速度慢,易陷入局部最优等问题.

针对以上问题,本文以模拟-优化方法为整体框架,提出了基于SSA-BP神经网络替代模型及SSA的污染源溯源辨识方法.根据一假想点源污染案例建立地下水污染数值模拟模型,运用Cholesky分解方法建立含水层渗透系数连续场,其次运用SSA-BP神经网络方法建立替代模型,通过麻雀优化算法(SSA)使BP神经网络的初始权重与阈值达到最优,从而提高替代模型的精度与计算效率,最后使用麻雀搜索算法求解优化模型,以期为点污染源的位置及释放历史的识别提供更快速准确的方法.

1 研究方法

1.1 模拟优化方法

模拟优化方法的基本原理是将模拟模型与优化模型相耦合,再以运筹学中的优化算法为工具对优化模型进行求解,通过反复多次地调用地下水数值模拟模型,对待识别变量进行不断优化,最终求得待识别变量[20].

1.2 含水层渗透系数连续场

地下水含水层中的各水力参数(渗透系数、孔隙度、弥散度等)对于模拟地下水水流流动及溶质运移十分重要,为更好地描述水文地质参数的非均质性,采用以下函数来描述渗透系数的自然对数=ln在空间上的相关性:

再生成场的随机数据集:

1.3 麻雀搜索算法(SSA)

SSA由Xue等[22]在2020年首次提出,该算法受麻雀的觅食行为和反捕食行为的启发而提出,具有较高的收敛性能和局部搜索能力.在整个麻雀的觅食过程中,所有麻雀被分为两类:发现者与加入者.发现者具有较高的能源储备并且负责搜索具有丰富食物的区域,从而为加入者提供觅食的区域和方向.加入者利用发现者提供的信息获取食物或者在该发现者周围觅食,并且一些加入者为了增加自己的捕食率还会不断地监控发现者进而去抢夺食物资源.当发现危险时,发现者会将加入者迅速带到其他安全区域进行觅食.在整个种群中,发现者和加入者的身份是动态变化的,但发现者和加入者所占种群数量的比重是不变的.

由只麻雀组成的种群如下所示:

式中:表示待优化问题变量的维数;为麻雀的数量.麻雀的适应度值为:

式中:表示适应度值.在每次迭代过程中,发现者的位置更新如下所示:

加入者的位置更新公式如下:

此外还有一部分麻雀担任放哨报警的职责,这类麻雀的位置更新公式如下所示:

1.4 遗传算法(GA)

基本思想是模仿自然进化过程,通过对群体中具有某种结构形式的个体进行遗传操作生成新的群体,从而逐渐逼近最优解.在具体求解过程中,GA会设定一个固定规模的初始种群,种群中的每个个体都表示问题的一个可能解,再利用适应度函数来判断个体适应环境的程度,适应度差的个体被淘汰,适应度好的个体继续繁衍,在繁衍过程中经过选择、交叉、变异等操作形成新的种群,如此反复最终求得最优解.

1.5 替代模型

BP神经网络模型中的初始权值和阈值属于随机赋值,即使模型会通过误差反向传播算法不断调整权值从而找到最优权值与阈值,但极其容易陷入局部最优,并且该过程的收敛速度较慢[23].为避免BP神经网络陷入局部最优,提高BP神经网络替代模型的精度和计算效率,本文利用SSA对其进行优化.SSA可以利用自身强大的局部、全局搜索能力及快速收敛能力,对BP神经网络的初始权值和阈值进行优化,得到最优初始权值和阈值,再将最佳结果赋值给BP神经网络,从而使BP神经网络得到优化,形成了SSA-BP神经网络替代模型[24].SSA-BP神经网络替代模型的基本结构如图1所示.

图1 基于SSA-BP神经网络的替代模型

1.6 优化模型

优化模型通常由3个部分组成:目标函数、决策变量以及约束条件,一般形式如下所示:

2 案例应用

2.1 问题概述

图2 研究区示意

本文针对假想算例进行研究,研究区由长250m、宽200m的二维非均质含水层构成.水流方向为西北向东南,西侧1及东侧2均概化为定水头边界,北侧3及南侧4均概化为零通量边界.模拟期为10a,分为10个应力期(每年一个应力期),某点的地下水污染源在3~9期向含水层排放污染物,研究区内设置6口监测井(井1、2、3、4、5、6)监测地下水中污染物浓度,其中1~5号井用于参加地下水污染源反演识别过程,6号井用于检验算法的反演精度.设定背景污染物浓度为0mg/L,且污染物不会发生化学变化和生物降解.研究区示意如图2所示:

2.2 模拟模型的建立

2.2.1 地下水水流模型

2.2.2 地下水溶质运移模型

由于本文为假想例子,没有真正的实测数据,所以首先给定污染源位置、初始释放时间、释放强度及各含水层水文地质参数的参考值(假定该研究区主要岩性为砂砾岩,其渗透系数、给水度、孔隙度等参数根据相关经验值给出),并将其作为模拟模型的输入,再正演模拟模型得到各个应力期观测井中的污染物浓度作为观测数据.含水层参数及污染源相关值的参考值如表1所示,观测数据如表2所示.

2.2.4 模型的预报 利用MODFLOW模块及MT3D模块预测6a后研究区流场分布情况及污染物浓度空间分布情况如图4所示.

图3 含水层渗透系数连续场

表1 污染源相关值及含水层参数

表2 观测数据(g/d)

图4 6a后研究区水位和溶质空间分布

2.3 替代模型的建立

根据研究区情况,本文污染源反演的待识别变量为:污染源的横向坐标、污染源的纵向坐标及污染源释放通量st1~st10,共12个变量.相应的替代模型的输入为上述12个变量,输出为各时段5口监测井监测到的污染物浓度,共50个变量.

在替代模型中,训练数据用于提取模拟模型内在的特征及规律,验证数据用于评价替代模型的泛化能力.为保证数据均匀覆盖采样区间,增加样本的遍历性,本文采用拉丁超立方抽样法对上述12个输入变量进行抽样,共抽样1000组,随机组合后输入到地下水模拟模型中,计算得到相应的1000组污染物浓度输出.再将输入输出数据集随机分为训练数据集(80%)和验证数据集(20%).

采用SSA-BP和普通BP方法建立替代模型,并通过均方根误差(RMSE)、确定性系数2及平均相对误差(MAPE)评价及对比替代模型的性能.

由表3可知,基于SSA-BP方法建立的替代模型的精度明显高于基于BP神经网络方法建立的替代模型.由图5可以看出,在迭代次数达到29次时,适应度函数已然收敛,说明SSA对BP神经网络的初始权值和阈值完成了优化,且收敛速度较快.将污染源相关值与含水层参数的参考值输入到SSA-BP神经网络替代模型中,将其输出与观测值进行比较,对比结果如图6所示.

表3 替代模型精度分析

图5 SSA-BP适应度收敛曲线

结果表明,基于SSA-BP神经网络方法建立的替代模型满足精度要求,可以代替模拟模型与优化模型进行耦合.

2.4 优化模型的建立及求解

表4 SSA及GA识别值与参考值的比较

以各监测井在各时段的替代模型计算值和实际观测值之间的拟合误差极小化作为目标函数,以污染源位置、坐标以及污染源释放通量st1~st10共12个变量作为决策变量,并将已建立的替代模型作为等式约束条件嵌入其中,连同其他约束条件,构建针对污染源位置及源强反演识别的优化模型.构建的优化模型形式如下:

利用麻雀搜索算法和遗传算法分别求解优化模型,计算识别值如表4所示.

再将SSA及GA识别出来的污染源位置及污染源释放通量代入模拟模型中正演求解,并借助6号井分别比较两者的模拟值及观测值(表5).

表5 基于SSA及GA的6号井模拟值与观测值的比较

根据两种比较结果可知,在求解该优化模型时,SSA相较于GA具有更好的收敛性能和更高的识别精度.且由于st1、st2及st10的识别值明显低于其他时段的识别值,因此可推断初始释放时段为st3,终止释放时段为st10.对于污染源位置的反演识别可以为污染责任认定提供可靠证据,而考虑初始释放时间和终止释放时间的污染源源强识别对于进一步的修复任务具有重要参考价值.

2.5 不足及展望

在实际案例中,地下水不同污染物的性质及迁移方式存在很大差异,本文仅定义了一种假想污染物,且污染物不会发生化学变化和生物降解.后期的研究将会具体污染物具体分析,充分考虑污染物本身的物理化学性质及迁移方式,从而在污染物源反演识别中进行更加准确的模拟.

本文所提出的方法不可避免地存在误差,比如观测数据本身具有噪声以及建立模拟模型和替代模型时的误差等,这也就导致了污染源反演识别结果的不确定性.后期研究可根据反演识别结果进行汇的预测,通过与实际收集到的观测数据比较来更新源的信息.

本文将水文地质参数看为已知变量,仅反演了污染源的相关信息,但是地下水污染源反演识别同时伴有水文地质参数的不确定性,后期研究将会同时反演水文地质参数及污染源的相关信息.

3 结论

3.1 SSA-BP神经网络替代模型在平均相对误差、确定性系数及均方根误差等评价指标上的表现都要优于普通BP神经网络替代模型.且SSA优化BP神经网络的初始权值及阈值时表现出了目标函数值下降幅度大、收敛速度快的优点.

3.2 SSA对污染源位置的反演识别相对误差在10%左右,对污染源源强的反演识别相对误差不超过4%,说明SSA的识别精度较高.综上,基于SSA- BP神经网络替代模型及SSA的地下水污染源溯源辨识是可行的.

[1] 王宝燕,肖 巍.地下水污染现状与防治对策研究[J]. 环境与发展, 2020,32(10):38-39.

Wang B Y, Xiao W. Study on the status of groundwater pollution and prevention measures [J]. Environment and Development, 2020,32(10): 38-39.

[2] 杨 贞,张振师.国内外地下水修复技术应用现状及发展趋势[C]//中国环境科学学会.2020中国环境科学学会科学技术年会论文集(第三卷).中国环境科学学会:中国环境科学学会, 2020:4.

Yang Z, Zhang Z S. Current status and development trend of groundwater remediation technology application at home and abroad [C]// Proceedings of the 2020 Annual Scientific and Technical Conference of the Chinese Society for Environmental Sciences (Volume III). Chinese Society of Environmental Science: Chinese Society of Environmental Science, 2020:4.

[3] 李 媛,王国锋,郑 江,等.基于MOLDFLOW的某污染地块地下水重金属污染风险评价[J]. 江西科学, 2021,39(5):810-815,833.

Li Y, Wang G F, Zheng J, et al. Risk assessment of heavy metal contamination in groundwater of a contaminated site based on MOLDFLOW [J]. Jiangxi Science, 2021,39(5):810-815,833.

[4] 徐亚宁,卢文喜,王梓博,等.考虑参数和边界条件不确定性的地下水污染随机模拟[J]. 中国环境科学, 2022,42(7):

Xu Y N, Lu W X, Wang Z B, et al. Stochastic simulation of groundwater pollution considering parameter and boundary condition uncertainties [J]. China Environmental Science, 2022,42(7):

[5] 时延锋.SCEUA算法在地下水污染溯源中的应用研究[D]. 济南:济南大学, 2015.

Shi Y F. Research on the application of SCEUA algorithm in groundwater pollution traceability [D]. Jinan: Jinan University, 2015.

[6] 王景瑞,胡立堂.地下水污染源识别的数学方法研究进展[J]. 水科学进展, 2017,28(6):943-952.

Wang J R, Hu L T. Research progress of mathematical methods for groundwater pollution source identification [J]. Advances in Water Science, 2017,28(6):943-952.

[7] 袁 乾,卢文喜,范 越,等.基于替代模型的煤矸石堆地下水污染随机模拟[J]. 中国环境科学, 2019,39(6):2444-2451.

Yuan Q, Lu W X, Fan Y, et al. Stochastic simulation of coal gangue pile groundwater pollution based on alternative models [J]. China Environmental Science, 2019,39(6):2444-2451.

[8] 仝晓霞,宁立波,董少刚.运用GMS模型对某垃圾场地下水污染的研究[J]. 环境科学与技术, 2012,35(7):197-201.

Tong X X, Ning L B, Dong S G. Study of groundwater pollution in a landfill using GMS model [J]. Environmental Science and Technology, 2012,35(7):197-201.

[9] 杜守营,鹿 帅,杜尚海.基于GMS的地下水流数值模拟及参数敏感性分析[J]. 中国农村水利水电, 2013,(8):77-80.

Du S Y, Lu S, Du S H. Numerical simulation and parameter sensitivity analysis of groundwater flow based on GMS [J]. China Rural Water Conservancy and Hydropower, 2013,(8):77-80.

[10] 颜 萍,邢 芳,徐世光,等.基于GMS软件对保山某尾矿库地下水污染的数值模拟研究[J]. 地质灾害与环境保护, 2019,30(3):102-107.

Yan P, Xing F, Xu S G, et al. Numerical simulation study of groundwater pollution in a tailing pond in Baoshan based on GMS software [J]. Geological Hazards and Environmental Protection, 2019,30(3):102-107.

[11] Queipo N V, Haftka R T, Shyy W, et al. Surrogate-based analysis and optimization [J]. Progress in Aerospace Sciences, 2005,41(1):1-28.

[12] Bhosekar A, Ierapetritou M. Advances in surrogate based modeling, feasibility analysis, and optimization: A review [J]. Computers & Chemical Engineering, 2018,108:250-267.

[13] Yan S Q, Minsker B. Optimal groundwater remediation design using an Adaptive Neural Network Genetic Algorithm [J]. Water Resources Research, 2006,42(5):5407-5420.

[14] 王梓博,卢文喜,王 涵,等.某钼矿尾矿库地下水污染的随机模拟[J]. 中国环境科学, 2020,40(5):2124-2131.

Wang Z B, Lu W X, Wang H, et al. Stochastic simulation of groundwater pollution in a molybdenum mine tailing pond [J]. China Environmental Science, 2020,40(5):2124-2131.

[15] 侯泽宇,王 宇,卢文喜.地下水DNAPLs污染修复多相流模拟的替代模型[J]. 中国环境科学, 2019,39(7):2913-2920.

Hou Z Y, Wang Y, Lu W X. Alternative models for multiphase flow simulation of groundwater DNAPLs pollution remediation [J]. China Environmental Science, 2019,39(7):2913-2920.

[16] 王 宇,卢文喜,卞建民,等.基于小波神经网络的地下水流数值模拟模型的替代模型研究[J]. 中国环境科学, 2015,35(1):139-146.

Wang Y, Lu W X, Bian J M, et al. Alternative modeling of groundwater flow numerical simulation model based on wavelet neural network [J]. China Environmental Science, 2015,35(1):139- 146.

[17] Yoon J H, Shoemaker C A. Comparison of optimization methods for ground-water bioremediation [J]. Journal of Water Resources Planning and Management-Asce, 1999,125(1):54-63.

[18] 江思珉,张亚力,蔡 奕,等.单纯形模拟退火算法反演地下水污染源强度[J]. 同济大学学报(自然科学版), 2013,41(2):253-257.

Jiang S M, Zhang Y L, Cai Y, et al. Inversion of groundwater pollution source intensity by simplex simulated annealing algorithm [J]. Journal of Tongji University (Natural Science Edition), 2013,41(2):253-257.

[19] 王 敬,韩 忠,梁 浩,等.地下水污染强度反演识别的SCE-UA算法[J]. 中国农村水利水电, 2020,(12):106-111.

Wang J, Han Z, Liang H, et al. SCE-UA algorithm for groundwater pollution intensity inversion identification [J]. China Rural Water Conservancy and Hydropower, 2020,(12):106-111.

[20] 肖传宁,卢文喜,赵 莹,等.基于径向基函数模型的优化方法在地下水污染源识别中的应用[J]. 中国环境科学, 2016,36(7):2067-2072.

Xiao C N, Lu W x, Zhao Y, et al. Application of optimization method based on radial basis function model in groundwater pollution source identification [J]. China Environmental Science, 2016,36(7):2067- 2072.

[21] 张江江.地下水污染源解析的贝叶斯监测设计与参数反演方法[D].杭州:浙江大学, 2017.

Zhang J J. Bayesian monitoring design and parameter inversion method for groundwater pollution source analysis [D]. Hangzhou: Zhejiang University, 2017.

[22] Xue J K, Shen B. A novel swarm intelligence optimization approach: sparrow search algorithm [J]. Systems Science & Control Engineering, 2020,8(1):22-34.

[23] 郭名诚,侯 珂,李鑫浩.基于SSA-BPNN模型的Web服务质量评价[J]. 信息技术与信息化, 2021,(10):13-15.

Guo M C, Huo K, Li X H. Web service quality evaluation based on SSA-BPNN model [J]. Information Technology and Informatization, 2021,(10):13-15.

[24] 孙 全,孙 渊.基于麻雀搜索算法的BP神经网络优化技术[J]. 上海电机学院学报, 2022,25(1):12-16.

Sun Q, Sun Y. BP neural network optimization technique based on sparrow search algorithm [J]. Journal of Shanghai Institute of Electrical Engineering, 2022,25(1):12-16.

Inversion and identification of groundwater pollution sources based on SSA-BP and SSA.

GE Yuan-bo, LU Wen-xi*, BAI Yu-kun, PAN Zi-dong

(Key Laboratory of Groundwater Resources and Environmental, Ministry of Education, College of New Energy and Environment, Jilin University, Changchun 130012, China)., 2022,42(11):5179~5187

The simulation-optimization method based on SSA-BP neural network alternative model and SSA were applied to study the inverse identification of groundwater pollution source location and release history. And the Cholesky decomposition method was applied to establish the continuous field of aquifer permeability coefficients in the groundwater flow model, which better describes the non-homogeneity of hydrogeological parameters compared with the common parameter partitioning method. The results showed that the SSA-BP neural network alternative model has a high approximation accuracy for the simulation model, and its average relative error is only 3.21%. The relative error of SSA in the inverse identification of source location is about 10%, and the relative error of SSA in the inverse identification of source intensity does not exceed 4%. Therefore, the proposed method is an effective groundwater pollution source identification method, which can provide reference for pollution responsibility identification and pollution remediation plan optimization.

pollution source inversion identification;simulation-optimization method;alternative model;sparrow search algorithm;SSA-BP neural network alternative model

X523

A

1000-6923(2022)11-5179-09

葛渊博(1999-),男,甘肃定西人,吉林大学硕士研究生,主要从事地下水污染源反演识别研究.发表论文1篇.

2022-04-21

国家自然科学基金资助项目(41972252);国家重点研发计划资助项目(2018YFC1800405)

* 责任作者, 教授, luwenxi@jlu.edu.cn

猜你喜欢
污染源反演神经网络
反演对称变换在解决平面几何问题中的应用
基于ADS-B的风场反演与异常值影响研究
利用锥模型反演CME三维参数
持续推进固定污染源排污许可管理全覆盖
一类麦比乌斯反演问题及其应用
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
十二五”期间佳木斯市污染源排放状况分析
青海省人民政府关于做好第二次全国污染源普查的通知 青政〔2017〕23号
看不见的污染源——臭氧