基于小波神经网络的地下水流数值模拟模型的替代模型研究

2015-11-17 09:25卢文喜卞建民安永凯吉林大学环境与资源学院吉林长春130021
中国环境科学 2015年1期
关键词:蒙特卡罗拉丁开采量

王 宇,卢文喜,卞建民,安永凯 (吉林大学环境与资源学院,吉林 长春 130021)

基于小波神经网络的地下水流数值模拟模型的替代模型研究

王 宇,卢文喜*,卞建民,安永凯 (吉林大学环境与资源学院,吉林 长春 130021)

以吉林西部为研究区,建立地下水流数值模拟模型,分别应用蒙特卡罗方法和拉丁超立方方法在研究区10个县(市)开采量的可行范围内进行采样,经对比选择拉丁超立方抽样结果得到输入(开采量)—输出(水位降深)数据集,建立小波神经网络模型作为地下水流数值模拟模型的替代模型,而后对替代模型有效性作误差分析,并与多元非线性回归替代模型进行对比.结果显示,2种替代模型在功能上都能逼近地下水流数值模拟模型,但小波神经网络模型得到的水位降深均值和水位降深剩余标准差与模拟模型计算结果的相对误差分别低于多元非线性回归模型76%和45%,说明小波神经网络模型更适合作为地下水流数值模拟模型的替代模型,这为减少优化模型求解过程中直接调用模拟模型所造成的计算负荷提供了一种有效的替代方法.

替代模型;地下水流数值模拟模型;拉丁超立方;小波神经网络模型

应用地下水流数值模拟模型可以解决地下水位预报问题,但是无法解决地下水方案优选问题,而模拟-优化耦合模型可以解决地下水修复过程中决策方案的优选问题,因此基于数值模拟的优化模型日益受到人们的重视.传统实现模拟模型与优化模型耦合的方法主要有嵌入法、响应矩阵法和状态转移方程法等,但这些方法多以线性理论为基础,适用于规模较小的地下水流问题,对于多时段的非稳定流问题,会产生较大误差[1].近年来,为了克服以往耦合技术方法的局限性,提出了替代模型法,它在功能上与模拟模型相近,在优化模型迭代求解过程中直接调用替代模型,可大幅减少计算负荷,节省运算时间,是一种连接模拟模型与优化模型的有效方法[2].替代模型精度的准确性取决于采样方法和替代模型种类的选择[3].目前,已有的替代模型包括双响应面模型、BP神经网络模型、径向基函数神经网络模型等,这些模型大都应用于石油、机械设计等领域[4],在地下水中的应用较少.伊燕平等[5]建立了径向基函数神经网络模型作为替代模型,与地下水流模拟模型计算结果拟合的相对误差较小,说明径向基函数神经网络模型可以有效替代地下水流模拟模型.辛欣等[6]基于多相流模拟模型建立了双响应面模型,两者相对误差小于10%,表明建立的双响应面模型在功能上接近多相流模拟模型.

本文以吉林西部为研究区,建立了地下水流数值模拟模型,分别利用蒙特卡罗法和拉丁超立方法进行抽样,应用小波神经网络方法建立模拟模型的替代模型,并验证了替代模型的有效性,最后与多元非线性回归替代模型进行对比,旨在为以后替代模型的研究提供参考.

1 地下水流数值模拟模型

1.1 研究区概况

研究区位于吉林西部(123°09′E~124°22′E,44°57′N~45°46′N),处于半湿润半干旱的过渡地带,四季分明.多年平均降水量为400~500mm左右,主要集中于6~9月份,占全年总降水量的70%~80%.多年平均蒸发量为1500~1900mm,多年平均温度为4.6℃.

研究区作为一个巨大的含水层系统,埋藏多个含水层,包括孔隙潜水含水层、孔隙裂隙承压含水层及其间的弱透水层[7].地下水的补给来源包括降水入渗、河流渗漏、侧向地下径流补给和灌溉入渗,排泄途径包括潜水蒸发、向河流排泄、侧向径流排泄和人工开采.

1.2 水文地质概念模型

模拟区范围是吉林西部平原区,包括东部高平原、松拉河间地块、河谷平原、中部低平原和西部山前倾斜平原.本次模拟的目的层为第四系孔隙含水层,将第四系孔隙潜水含水层和第四系孔隙裂隙承压含水层作为一个整体.模拟区的上部边界为潜水面,与大气降水、潜水蒸发、河流入渗和灌溉水回渗等存在水力联系,下部边界由新近系的泥岩(局部为砂岩)组成,渗透性极差,可概化为隔水边界.在侧向上,边界的概化如图1所示.

图1 模拟区侧向边界类型概化示意Fig.1 The boundary of the study area

1.3 地下水流数值模拟模型的数学模型

根据水文地质概念模型,将模拟区地下水流系统概化为非均质、各向同性、二维非稳定流系统,用下述偏微分方程的定解问题来描述[8-10]:

式中:D为计算模拟区域;H为地下水水位,m;H0(x,y)为初始水位,m;Zb为含水层底板高程,m;W为含水层垂向补给强度,m/d;E为含水层蒸发排泄强度,m/d;Q为含水层开采强度,m/d;K为渗透系数,m/d;u为给水度无量纲;H1(x,y,t)为一类边界上的水位,m;q(x,y,t)为二类边界上的单宽流量,m3/(m·d);n为边界上的外法线方向.

1.4 地下水流数值模拟模型的校正与验证

基于现有资料,选取枯水期2006年10月26日~2007年3月26日作为模型校正时段,共计182d.通过识别时段的计算,确定模拟区的水文地质参数,并选取2007年3月27日~2007年9月26日作为模型验证时段,共计183d.

图2 校正时段末刻地下水流场拟合Fig.2 The fitting chart of groundwater flow field at the end of calibration period

本次模拟采用Visual Modflow进行求解,选取65口观测井作为校正和验证的校准数据点.模型校正时段水位拟合误差的平均绝对值为0.371m,拟合误差小于0.5m的观测井占总观测井的84%.验证时段误差平均绝对值为0.410m,拟合误差小于0.5m的观测井占总观测井数量的81%.地下水流场校正和验证阶段拟合如图2、3所示.

图3 验证时段末刻地下水流场拟合Fig.3 The fitting chart of groundwater flow field at the end of validation period

模型校正和验证结果表明研究区边界条件的概化、水文地质参数的分区和确定都是可靠的,可以较为真实的反映该区地下水流特征,据此所建立的地下水流数值模拟模型能够代表实际地下水流场.

2 抽样方法

输入输出数据集是建立替代模型的前提.本文对模拟区的10个县(市)进行面状开采,应用蒙特卡罗和拉丁超立方两种抽样方法对各县(市)开采量进行抽样,开采量取值范围如表1所示.

表1 开采量取值范围(×104m3/a)Table 1 The pumping data(×104m3/a)

2.1 蒙特卡罗抽样

蒙特卡罗方法(Monte-Carlo)是用事件发生的“频率”决定事件的“概率”,通过随机抽样和统计试验来求近似解的数值方法[11].它针对实际问题首先建立一个简单的概率统计模型,使所求解恰好是该模型某个指标的概率分布;然后对模型中的随机变量建立抽样方法,在计算机上产生随机数,进行大量统计试验;最后对模拟结果进行分析,求出它的统计特征值[12].

本文应用蒙特卡罗方法对离散随机变量抽样.①首先对开采量数据离散化处理,例如将洮北区开采量离散为1到56461的整数,即Q1∈{1,2,…,56461}.②Q1中每个数字出现的频率1/56461,按从小到大排序,将各个数字与其伪随机数区间对应,即1对应的区间为(0,0.000017711),2对应的区间为(0.000017711,0.000035422),…,56461对应区间(0.999982289,0.999999999],同理对其它县(市)开采量进行处理.③应用Matlab中rand(10)函数产生10组随机数,依次与上述各县(市)伪随机数区间对应的数值作为一组开采试验方案,运行30次,即得到30组开采试验方案.

2.2 拉丁超立方抽样

拉丁超立方(Latin Hypercube Sampling)是一种均匀分层抽样方法[13].在决定抽样规模后,首先将每个随机变量的定义域区间等分成N个互不重叠的子区间,然后在每个子区间上分别进行独立的等概率抽样,确保随机分布区能够被采样点完全覆盖;其次改变各随机变量采样值的排列顺序,使其相关性趋于最小;最后进行筛选,抽样[14].

基于拉丁超立方抽样原理,利用Matlab中rand()函数对研究区10个县(市)抽取了30组开采试验方案,并用randperm()函数对开采数据进行随机排列组合,得到最终的抽样结果.

2.3 抽样结果对比分析

为了确定最终开采试验方案数据,将2种抽样方法的数据进行对比.以洮北区为例,在数轴上表示出2种方法抽取的数据,如图4所示.

由图4对比发现,蒙特卡罗抽样的样品完全是随机出现,在总体中的分布没有规律,样品值之间可能过于贴近,也可能相距很远,说明蒙特卡罗抽样存在不均匀的问题,样品代表性不高;拉丁超立方抽样关键在于控制抽样点位置,使样品均匀的覆盖在总体内,避免了抽样点在某个小邻域内的重合问题,样品具有一定的代表性[15].因此,本文选用拉丁超立方的抽样结果作为开采试验方案的数据,即模拟模型的输入数据集.拉丁超立方抽样结果见表2.

图4 蒙特卡洛(a)和拉丁超立方(b)抽样结果示意Fig.4 The diagram of the Monte Carlo and the LHS sampling results

表2 LHS抽样结果(×104m3/a)Table 2 LHS sample results (×104m3/a)

续表2

3 建立地下水流数值模拟模型的替代模型—小波神经网络模型

3.1 小波神经网络模型的原理

小波神经网络(WA-ANN)是结合小波变换理论与人工神经网络思想而构造的一种新的神经网络模型[16].它由输入层、隐含层和输出层组成,其方法是将神经网络隐含层中神经元的传统激发函数用小波函数来代替,同时相应的输入层到隐含层、隐含层到输出层的权值及阈值分别由小波基函数的尺度参数与平移参数来代替,充分继承了小波变换良好的时频局部化性质及神经网络自学习功能的优点,因而具有较强的容错能力、较快的收敛速度和较好的预报效果[17].

本次研究的小波神经网络隐含层神经元的激励函数为Morlet小波,则小波神经网络模型可以表示为[18-20]:

式中:xk为输入层的第k个输入样本,yi

为输出层的第i个输出值,wij为连接输出层节点i和隐含层节点j的权值,wjk为连接隐含层节点j和输入层节点k的权值,aj为第j个隐含层节点的伸缩因子,bj为第j个隐含层节点的平移因子.

误差目标函数为:

在学习阶段通过大量的训练样本,不断修正神经网络参数和权值,使神经网络对样本具有模式识别能力,直至满足期望目标,得到相应的输出数据集.基于小波神经网络模型的识别模式特征功能,建立小波神经网络模型作为地下水流数值模拟模型的替代模型.

3.2 小波神经网络模型的建立

在模拟区内选择30口观测井,如图5所示.将拉丁超立方抽样结果代入地下水流数值模拟模型,计算得到观测井的地下水位降深均值和地下水位降深剩余标准差,即输出数据集.将输入(开采量)、输出(水位降深)数据集作为小波神经网络训练样本.如表3所示.

利用输入输出数据集分别建立开采量—地下水位降深均值、开采量—地下水位降深剩余标准差两个小波神经网络模型.以Matlab为平台,编制计算机程序,两个模型的输入层神经元个数均为10,输出层神经元个数均为1,经过训练,隐含层神经元个数均为8,即两个模型的网络结构最终确定为10:8:1.

图5 模拟区观测井分布Fig.5 Distribution of observation wells at the study area

表3 小波神经网络模型训练样本Table 3 Training samples of WA-ANN model

3.3 小波神经网络模型的验证

再次利用拉丁超立方方法对研究区各县(市)抽取5组开采试验方案,作为小波神经网络的验证样本.将5组抽样数据同时代入地下水流数值模拟模型和小波神经网络模型,得到地下水位降深均值和地下水位降深剩余标准差.作为与小波神经网络模型的对比,笔者又构建了解决该问题的多元非线性回归模型[21-22],回归方程如公式(4)所示,将两种替代模型的输出结果分别与数值模拟模型结果进行拟合,结果见表4、表5.

式中,a为多项式回归系数,uε为拟合误差.

由表4、表5可以看出,小波神经网络模型和地下水流数值模拟模型的地下水位降深均值的平均相对误差为0.19%;地下水位降深剩余标准差的平均相对误差为0.06%,多元非线性回归模型和地下水流数值模拟模型的地下水位降深均值的平均相对误差为0.79%;地下水位降深剩余标准差的平均相对误差为0.11%.两种替代模型的相对拟合误差都比较小,说明所建立的小波神经网络模型和多元非线性回归模型两者在功能上都能逼近地下水流数值模拟模型.

经计算,多元非线性回归模型得到的水位降深均值的拟合误差比小波神经网络模型得到的拟合误差高76%,水位降深剩余标准差的拟合误差比小波神经网络模型得到的拟合误差高45%,可见,小波神经网络模型运行的结果精度高于多元非线性回归模型,更逼近地下水流数值模拟模型.另外,从模型应用过程中可以看出,多元非线性回归模型的建立必须有大量的样本支持,且样本总数要远大于自变量个数才能求得方程的相关系数,进而验证替代的有效性;而小波神经网络模型不限定输入层神经元的个数,即使输入层的变量数较多也能顺利完成模拟.因此,与多元非线性回归模型相比,小波神经网络模型计算过程简单,对训练样本数量要求低,且运行结果精度更高,更适合作为地下水流数值模拟模型的近似替代模型.

表4 小波神经网络模型和地下水流数值模拟模型相对拟合误差Table 4 The relative fitting error of WA-ANN model and groundwater numerical simulation model

表5 多元非线性回归模型和地下水流数值模拟模型相对拟合误差Table 5 The relative fitting error of multivariate nonlinear regression model and groundwater numerical simulation model

4 结论

4.1 利用实测数据对地下水流数值模拟模型进行校正和验证,发现水位拟合误差<0.5m的观测井数占总数的75%以上,满足误差允许范围,说明所建立的地下水流数值模拟模型能够客观反映该区地下水流的运动特征.

4.2 对比2种抽样方法的结果发现,蒙特卡罗抽样得到的样品在总体中分布没有规律,均匀性较差;拉丁超立方抽样对总体做分层处理,分别在每一层抽取样品,确保抽样的覆盖性,抽取的样品更具代表性.因此,选用拉丁超立方抽样的结果作为模拟模型的输入数据集.

4.3 利用输入(开采量)—输出(水位降深)数据集建立的多元非线性回归模型和小波神经网络模型验证结果表明,两种模型在功能上都能逼近地下水流数值模拟模型.小波神经网络模型得到的水位降深均值和水位降深剩余标准差与模拟模型计算结果的拟合精度分别高于多元非线性回归模型76%和45%,且对训练样本数量要求低,因此,小波神经网络模型更适合作为地下水流数值模拟模型的替代模型.

4.4 小波神经网络模型是一种黑箱模型,给定一组输入即可得到一组输出,将其作为替代模型,在优化模型迭代求解过程中直接被调用解决多目标优化问题,能够大幅度地减少优化模型求解过程中调用模拟模型所造成的计算负荷,节省大量时间,具有解决问题的实际价值和挖掘潜力.

[1]卢文喜.地下水系统的模拟预测和优化管理 [M]. 北京:科学出版社, 1999.

[2]Kourakos G, Mantoglou A. Development of a multi-objective optimization algorithm using surrogatemodels for coastal aquifer management [J]. Journal of Hydrology, 2013,479:13-23.

[3]伊燕平.地下水数值模拟模型的替代模型研究 [D]. 长春:吉林大学, 2011.

[4]安永凯,卢文喜,董海彪,等.基于克里格法的地下水流数值模拟模型的替代模型研究 [J]. 中国环境科学, 2014,34(3):383-389.

[5]伊燕平,卢文喜,张耘,等.基于径向基函数神经网络的地下水数值模拟模型的替代模型研究 [J]. 水土保持研究, 2012,19(4): 265-269.

[6]辛 欣,卢文喜,罗建男,等.DNAPLs污染含水层多相流数值模拟模型的替代模型 [J]. 吉林大学学报, 2011,41(3):855-860.

[7]汪馨竹.吉林省西部地下水埋深时空变化研究 [D]. 长春:吉林大学, 2009.

[8]杨青春,卢文喜,马洪云.Visual Modflow在吉林省西部地下水数值模拟中的应用 [J]. 水文地质工程地质, 2005,3:67-69.

[9]卞玉梅,卢文喜,马洪云.Visual MODFLOW在水源地地下水数值模拟中的应用 [J]. 东北水利水电, 2006,24(3):31-33.

[10]李 平,卢文喜,马洪云,等.Visual MODFLOW在地下水数值模拟中的应用——以公主岭市黄龙工业园水源地为例 [J]. 工程勘察, 2006,3:24-27.

[11]宋晓通.基于蒙特卡罗方法的电力系统可靠性评估 [D]. 济南:山东大学, 2008.

[12]童继平,韩正姝.蒙特卡罗方法与计算机模拟研究 [J]. 计算机与农业, 2000,7:17-21.

[13]戴英彪.基于拉丁超立方试验设计的事故再现结果不确定性分析 [D]. 长沙:长沙理工大学, 2011.

[14]邓乾旺,文文.基于拉丁超立方抽样的薄板装配误差分析 [J].中国机械工程, 2012,8:947-950.

[15]YIN Jinhang, LU Wenxi, XIN Xin, et al. Application of Monte Carlo sampling and latin hypercube sampling methods in pumping schedule design during establishing surrogate model[C]//Proceedings of 2011 International Symposium on Water Resource and Environmental Protection (ISWREP 2011) VOL.01,2011:212-215.

[16]郑小洋.小波神经网络及其应用 [D]. 重庆:重庆大学, 2003.

[17]侯泽宇,卢文喜,陈社明.基于小波神经网络方法的降水量预测研究 [J]. 节水灌溉, 2013,3:31-34.

[18]Vahid Nourani. A combined neural-wavelet model for prediction of Ligvanchai watershed precipitation [J]. Engineering Applications of Artificial Intelligence, 2009,22:466-472.

[19]傅荟璇,赵 红.MATLAB神经网络应用设计 [M]. 北京:机械工业出版社, 2010.

[20]Jan Adamowski. A wavelet neural network conjunction model for groundwater level forecasting [J]. Journal of Hydrology, 2011,407:28-40.

[21]张德伟,李淑琴,徐 实.用虚拟水位流量关系作多元回归的相应水位法洪水预报 [J]. 东北水利水电, 1993,5:13-16.

[22]董大校.基于MATLAB的多元非线性回归模型 [J]. 云南师范大学学报, 2009,29(2):45-48.

Surrogate model of numerical simulation model of groundwater based on Wavelet Neural Network.

WANG Yu, LU Wen-xi*, Bian Jian-min, AN Yong-kai (College of Environment and Resources, Jilin University, Changchun 130021,China). China Environmental Science, 2015,35(1):139~146

Western Jilin was selected as the study area, and the groundwater numerical simulation model for this area was established. Monte-Carlo and Latin Hypercube method were applied to sample exploitation of 10counties (cities) as practicable range in the study area, Latin Hypercube Sampling was selected to obtain input (pumping) and output (water level drawdown) data sets, and wavelet neural network was proposed to establish an surrogate model of the groundwater numerical simulation model, Compared the fitting mean relative error of wavelet neural network model with that of multivariate nonlinear regression model. Two surrogate models both could approach the function of numerical simulation model of groundwater, however, the relative error of mean groundwater level drawdown and the remaining average relative standard deviation of groundwater level drawdown between wavelet neural network model and simulation model was smaller than the multiple nonlinear regression model 76% and 45%, which indicated that the wavelet neural network model can effectively replace groundwater numerical model. This study will provide an effective surrogate method to reduce computational load resulted from multiple invocation of the numerical simulation model of groundwater in the processes of iteration solution by optimization model.

surrogate model;numerical simulation model of groundwater;Latin hypercube sampling;Wavelet neural network model

X523,P641.8

A

1000-6923(2015)01-0139-08

王 宇(1988-),女,吉林长春人,吉林大学硕士研究生,主要从事水资源数值模拟与优化管理方面的研究.发表论文1篇.

2014-04-25

吉林省科技厅科技发展计划项目(20130206011SF)

* 责任作者, 教授, Luwenxi@jlu.edu.cn

猜你喜欢
蒙特卡罗拉丁开采量
宫颈癌调强计划在水与介质中蒙特卡罗计算的剂量差异
再谈河北省滦平县马营子乡高锶天然矿泉水特征与开采量估算
利用蒙特卡罗方法求解二重积分
利用蒙特卡罗方法求解二重积分
拉丁新风
爱美的拉丁老师
基于蒙特卡罗的战略投送能力动态评估方法
复合型种子源125I-103Pd剂量场分布的蒙特卡罗模拟与实验测定
拉丁一派热辣辣