改进的神经网络模型在水文模拟中的应用

2013-04-17 09:30阚光远李致家刘志雨李巧玲胡友兵
关键词:新安江产流流域

阚光远,李致家,刘志雨,李巧玲,胡友兵

(1.河海大学水文水资源学院,江苏 南京 210098;2.水利部水文局,北京 100053)

水文模拟常用的模型有2种,一种是概念性模型 ,另一种是数据驱动模型。BP神经网络模型(以下简称BP模型)是数据驱动模型,具有强大的非线性拟合能力[6],取得了良好的应用效果[7-8]。BP模型在应用中还存在一些难题。Minns等[9]发现仅将降雨作为输入无法计算出流,这是由于土壤湿度对产流有重要影响,故以往大多数研究都将前期实测流量作为网络输入来表征土壤湿度[10],无法进行连续模拟。BP模型还存在率定期模拟效果好但检验期严重变差,即泛化能力差的现象,这是由于网络拓扑结构选择不当及训练不当造成的。新安江模型是赵人俊[11]于20世纪80年代初提出的概念性模型,在中国得到广泛应用和不断完善。以往文献中关于BP模型、K-最近邻算法和新安江模型的报道多为单独应用,三者的耦合应用不多见。笔者将BP模型与K-最近邻算法耦合起来,建立BK模型,将新安江模型的产流、产流分水源计算模块与BK模型相耦合建立XBK模型及XSBK模型,以提高模拟精度和降低模型使用难度为目的,在呈村等3个不同类型流域将BK模型、XBK模型及XSBK模型与新安江模型进行对比应用。

1 BP模型、BK模型、XBK模型及XSBK模型简介

水文模拟中BP模型的通常形式如下:

式中:t——计算时刻;QBP,t——BP模型模拟的t时刻出口断面流量;Qt-i——实测的t-i时刻出口断面流量,即前期实测流量;n0——出口断面流量自回归阶数;Pt-j-τ——实测的t-j-τ时刻流域面平均雨量(j=0,1,…,n1-1;n1为降雨阶数,τ为降雨滞后时段数);EM,t-k——实测的t-k时刻流域蒸散发能力(k=0,1,…,n2-1;n2——蒸散发能力阶数);FBP——BP神经网络函数。

传统的BP模型需用预报时刻前若干时刻的实测流量(即前期实测流量)来表征土壤湿度,实际预报时由于无法获得前期实测流量,式(1)无法进行连续模拟,难以充分利用降雨预报信息提高预见期。K-最近邻算法[12]是一种简洁有效的机器学习算法,可用于回归预测。笔者将K-最近邻算法与BP神经网络耦合起来,建立BK(BP-KNN)模型,在保证较高模拟精度的前提下实现不需前期实测流量的连续模拟,使改进的BP模型具有充分利用降雨预报信息的能力。BK模型的通用建模方式见式(2)~(4)。式(2)为BP神经网络连续模拟,式(3)、式(4)为K-最近邻算法误差修正。

式中:QBP,t——BP神经网络模拟的(未经K-最近邻算法修正的)t时刻出口断面流量;FBP和FKNN——BP神经网络函数和K-最近邻算法函数;Qsim,t,Qsim,t-i——BP神经网络模拟的(并经K-最近邻算法修正的)t及t-i时刻出口断面流量,即前期模拟流量;Il,t-jl-τl——t-jl-τl时刻与出口断面流量相关的l个影响因素,一般为实测的面平均降雨、蒸散发能力等(l≥0);jl——影响因素阶数;τl——影响因素滞后时段数;Et——QBP,t与Qsim,t间的差值。

式(2)、式(3)均未用到实测流量,式(3)根据历史样本的模拟误差对输出进行修正,不需要实时信息,故BK模型不是实时校正模式。为加快训练速度,将输入输出归一化到[-1,1]后进行计算[13]。BK模型的参数为nj,τj,以及BP神经网络隐含层神经元个数、BP神经网络权值偏置和最近邻数K。依计算流程将参数分为3个层次,各层次使用NSGA-Ⅱ算法进行参数优选,第1层次优选阶数、滞后时段数;第2层次优选BP神经网络隐含层神经元个数和权值偏置;第3层次优选最近邻数。NSGA-Ⅱ[14]是非支配排序遗传算法,由Deb在2000年提出,有较快的收敛速度,优化结果有良好的分布性,是最流行的多目标优化算法[15]。

建立分单元式BK模型进行流域产汇流计算,建模方式见式(5)~(7)。

其中

式中:Ps,t-i+1-τs——实测的t-i+1- τs时刻第s个子流域的降雨(i=1,2,…,n1,τs为第s个子流域的降雨滞后时段数);ns——子流域个数;EM,t-k——实测的t-k时刻流域蒸散发能力。

BK汇流模块是BK模型用于汇流计算的形式,有两种,与新安江产流模块相耦合的命名为BK2,表示两水源汇流,与新安江产流分水源模块相耦合的命名为BK3,表示三水源汇流。

2 改进模型与新安江模型应用比较

为保证在相同条件下与新安江模型进行汇流计算精度对比,新安江产流(或产流分水源)模块的参数与新安江模型的对应参数取相同值。BK模型、XBK模型和XSBK模型统称为改进模型,参数τ表示各子流域各影响因素滞后时段数,反映各子流域降雨或径流向出口断面汇集过程中所受滞后作用的大小,改进模型为多滞时模型,各子流域分别使用一个滞时值。为考察参数τ的效果,建立单滞时改进模型,模型中各子流域滞后时段数取相同值。改进模型采用分单元处理方式考虑降雨分布不均产生的影响,为考察分单元处理方式的效果,建立不分单元改进模型,各影响因素使用面平均值,不分单元改进模型使用单滞时形式。故本文涉及的模型包括以下10种:不分单元新安江模型、分单元新安江模型;不分单元XBK模型、XSBK模型;分单元单滞时BK模型、XBK模型、XSBK模型;分单元多滞时BK模型、XBK模型、XSBK模型。选择呈村、东湾和大阁3个不同类型的流域进行比较,各流域水系和泰森多边形分块见图1。各流域概况如下:(a)呈村流域年平均降水量1600 mm,属典型湿润地区,流域面积290 km2,选用1989—1999共11 a的日资料系列进行日状态变量计算,1989—1999年间20场次洪水资料的前14场次洪水进行模型率定,后6场次洪水进行模型检验;(b)东湾流域属半湿润流域,流域面积2856 km2,选用1970—2000共31 a的日资料系列进行日状态变量计算,1970—2000年间18场次洪水资料的前12场次洪水进行模型率定,后6场次洪水进行模型检验;(c)大阁流域面积1850 km2,选用1964—1999共36 a的日资料系列进行日状态变量的计算,1964—1999年间的14场次洪水资料的前9场次洪水进行模型率定,后5场次洪水进行模型检验。

新安江模型采用客观优选法先后进行日、次模人工率定[15];BK模型只进行次模计算,使用分层次多目标优化方法率定;XBK模型和XSBK模型中新安江产流(或产流分水源)模块日时段长和次洪时段长的参数使用新安江模型优选值,BK汇流模块由分层次多目标优化方法率定,新安江模型、XBK模型和XSBK模型次模初值从相应时刻各自日模计算结果中读取[16]。使用MATLAB软件进行计算,NSGA-Ⅱ算法的种群数取100,进化代数取500,算法其他参数取值见前文或取MATLAB软件默认值[17]。

图1 流域水系图和泰森多边形分块Fig.1 Water systems in watersheds and Thiessen polygons

表1 误差统计(各场次洪水确定性系数的算术平均值)Table 1 Error statistics(arithmetic mean of coefficient of determination for various flood events)

3 结 果 分 析

用各场次洪水确定性系数的算术平均值作为评价准则进行模型预报能力比较,各模型误差统计结果见表1。K-最近邻算法进行修正时需要在训练样本集中挑选K个最近邻,率定期计算时需要预报的样本存在于训练样本集中,挑选的K个最近邻中必然包含预报样本本身,其距离为零,权重无穷大,取算术平均值进行预测时其他K-1个最近邻的权重相对很小,几乎不发挥作用,故率定期误差修正结果精度较高,平均确定性系数Dc基本为0.99,因此各模型只进行检验期Dc的比较。

a.不分单元新安江模型与不分单元XBK模型、XSBK模型的比较。呈村流域是典型的湿润流域,适用新安江模型进行模拟,3个模型的Dc分别达到0.87,0.98和0.96,XBK模型和XSBK模型Dc均高于新安江模型;东湾流域是半湿润流域,会发生超渗产流现象,与新安江模型的产流机制不完全一致,3个模型的Dc均比呈村流域有所下降,但XBK模型和XSBK模型Dc仍比新安江模型高;大阁流域是干旱半干旱流域,以超渗产流为主,3个模型的Dc均较低,但XBK模型和XSBK模型仍比新安江模型高。以上结果说明不分单元情况下,各流域XBK模型和XSBK模型的精度均较新安江模型有所提高。

b.分单元新安江模型与分单元多滞时BK模型、XBK模型和XSBK模型的比较。4个模型在呈村流域均取得很好的模拟效果,改进模型Dc均高于新安江模型;BK模型在东湾流域的Dc为0.53,稍低于新安江模型的Dc(0.63),该流域XBK模型和XSBK模型的Dc均高于新安江模型,并且XSBK模型Dc达0.77;BK模型在大阁流域的Dc为0.21,稍低于新安江模型的Dc(0.28),XBK模型和XSBK模型的Dc均稍高于新安江模型。以上结果说明分单元情况下,除BK模型在东湾流域和大阁流域精度稍低于新安江模型外,改进模型的精度均高于新安江模型。原因如下:首先,改进模型使用分层次、多目标优化算法,得到的参数接近最优值,使改进模型具有更强的预报能力;其次,BK模型是BP模型的改进版,同时具有连续模拟能力和非线性逼近能力,配合使用分层次多目标优化方法,能在不损失预见期的前提下取得更高的模拟精度。

c.不分单元XBK模型和XSBK模型与分单元单滞时XBK模型和XSBK模型的比较。呈村流域分单元单滞时XBK模型与不分单元XBK模型的Dc相等(均为0.98),分单元单滞时XSBK模型的Dc(0.98)高于不分单元XSBK模型的Dc(0.96);东湾流域分单元单滞时XBK模型的Dc为0.63,稍高于不分单元XBK模型的Dc(0.62),分单元单滞时XSBK与不分单元XSBK模型的Dc相等(均为0.64);大阁流域分单元单滞时XBK模型和XSBK模型的Dc均高于不分单元XBK模型和XSBK模型。以上结果说明分单元处理方式能提高改进模型的精度。

d.分单元单滞时BK模型、XBK模型和XSBK模型与分单元多滞时BK模型、XBK模型和XSBK模型的比较。呈村流域多滞时改进模型的Dc分别为0.94,0.97和0.97,单滞时改进模型的Dc分别为0.93,0.98和0.98,2种处理方式精度相差不大;东湾流域多滞时改进模型的Dc分别为0.53,0.73和0.77,单滞时改进模型的Dc分别为0.43,0.63和0.64,多滞时处理方式精度高于单滞时处理方式;大阁流域多滞时改进模型的Dc分别为0.21,0.34和0.32,单滞时改进模型的Dc分别为0.12,0.17和0.24,多滞时处理方式精度高于单滞时处理方式。这些结果说明多滞时处理方式能提高改进模型的精度。以上分析说明分单元和多滞时处理方式均能提高改进模型的模拟精度,分单元考虑了降雨空间分布不均产生的影响,多滞时反映了各子流域的径流汇入出口断面前所受滞后推移作用的影响,间接反映了各子流域与出口断面间距离的远近以及各径流在该距离上受到调蓄作用的影响。

e.不分单元情况、分单元单滞时情况、分单元多滞时情况下XBK模型和XSBK模型的比较。3种情况下各流域XBK模型和XSBK模型的Dc,不分单元情况下:呈村流域为0.98和0.96,东湾流域为0.62和0.64,大阁流域为0.11和0.21,XSBK模型的Dc总体略高于XBK模型;分单元单滞时情况下:呈村流域为0.98和0.98,东湾流域为0.63和0.64,大阁流域为0.17和0.24,XSBK模型的Dc略高于XBK模型;分单元多滞时情况下:呈村流域为0.97和0.97,东湾流域为0.73和0.77,大阁流域为0.34和0.32,XSBK模型的Dc总体略高于XBK模型。以上结果说明分水源处理方式能提高改进模型的精度。原因如下:由于各径流成分的汇流速度不同,需要给各径流成分配以不同的汇流阶数,分水源对各径流成分的描述比不分水源更加接近自然流域的实际状况,因此能取得更高的精度。

f.分单元单滞时情况、分单元多滞时情况下的BK模型、XBK模型和XSBK模型的比较。分单元单滞时情况下BK模型、XBK模型、XSBK模型的Dc,呈村流域为0.93,0.98和0.98,东湾流域为0.43,0.63和0.64,大阁流域为0.12,0.17和0.24,精度关系为BK模型<XBK模型<XSBK模型;分单元多滞时情况下BK模型、XBK模型、XSBK模型的Dc,呈村流域为0.94,0.97和0.97,东湾流域为0.53,0.73和0.77,大阁流域为0.21,0.34和0.32,精度关系总体上满足BK模型<XBK模型<XSBK模型。以上结果说明BK模型的精度不如XBK模型和XSBK模型,这是由于XBK模型和XSBK模型中,产流过程的非线性体现在产流模块中,BK模型汇流模块仅对汇流过程的非线性进行拟合,这种耦合的处理方式降低了BK模块处理数据的非线性程度。此外,由于加入了分水源处理,XSBK模型的精度高于XBK模型。

g.新安江模型与分单元多滞时XSBK模型比较。新安江模型与分单元多滞时XSBK模型的Dc,呈村流域为0.89和0.97,东湾流域为0.63和0.77,大阁流域为0.28和0.32,XSBK模型的Dc均高于新安江模型,Dc提高百分比为呈村流域0.09%、东湾流域0.22%、大阁流域0.14%。新安江模型与分单元多滞时XSBK模型相比,Dc提高率东湾流域最高,大阁流域次之,呈村流域最低。原因如下:呈村流域属湿润地区,以蓄满产流为主,新安江模型的精度高,提高的空间相对不大;东湾流域属半湿润区,蓄满产流模式占主导地位,但仍含较多超渗产流因素,BK汇流模型的优势得以体现,能够取得比新安江模型更高的精度;大阁流域位于半干旱半湿润过渡区,密云水库流域上游,地形坡度大,植被覆盖率低,有岩石裸露,流域洪水的发生多为山区性的集中暴雨,雨强大,降雨历时相对较短,以超渗产流为主,常出现洪峰涨不起来的现象,新安江模型在该流域的计算精度比东湾流域下降许多,总体模拟结果不好,XSBK模型的改进程度也不如东湾流域大。

4 结 论

a.改进模型的模拟结果总体上好于新安江模型,分单元、多滞时和分水源处理方法均能提高改进模型的模拟精度,使其具有更强的非线性模拟能力。分单元多滞时XSBK模型取得了最高的模拟精度。将概念性模型与改进的BP模型耦合起来建立的耦合型模型比单一改进的BP模型取得更高的模拟精度。随着流域干旱程度的增大,超渗产流成分增加,模拟精度下降。

b.改进模型使用分层次多目标优化算法进行参数优选,提高了优化效率,解决了同时优化网络拓扑结构和权值偏置的难题,提高了BP模型的泛化能力。改进模型的参数优化不依赖于人工试算,降低了使用难度,可以找到更合理的模型参数并取得更高的模拟精度。

c.改进模型继承了新安江模型产流计算精度高和黑箱子模型非线性模拟能力强的优势,同时还解决了常见BP模型在无前期实测流量时不能进行连续模拟和损失精度的问题,改善了BP模型检验期预报能力下降的现象,充分发挥了概念性模型和黑箱子模型的优势并克服了各自的不足,探索出一条将两类模型耦合起来使用的途径。

[1]LI Zhijia,BAO Hongjun,XUE Cangsheng,et al.Real-time flood forecasting of Huai River with flood diversion and retarding areas[J].Water Science and Engineering,2008,1(2):10-24.

[2]DENGPeng,LIZhijia,XIEFan.Application of TOPMODEL in Buliu River Basin and comparison with Xin’anjiang model[J].Water Science and Engineering,2008,1(2):25-32.

[3]LI Zhijia,WANG Lili,BAO Hongjun,et al.Rainfall-runoff simulation and flood forecasting for Huaihe Basin[J].Water Science and Engineering,2008,1(3):24-35.

[4]DENG Peng,LI Zhijia,LIU Zhiyu.Numerical algorithm of distributed TOPKAPI model and its application[J].Water Science and Engineering,2008,1(4):14-21.

[5]BAO Hongjun,WANG Lili,LI Zhijia,et al.Hydrological daily rainfall-runoff simulation with BTOPMC model and comparison with Xin’anjiang model[J].Water Science and Engineering,2010,3(2):121-131.

[6]LESHNO M,LIN V Y,PINKUS A,et al.Multilayer feed forward networks with a no polynomial activation function can approximate any function[J].Neural networks,1993,6(6):861-867.

[7]许银山,吕孙云,梅亚东,等.维新息径向基神经网络模型在需水预测中的应用[J].水资源保护,2012,28(2):8-11.(XU Yinshan,LYU Sunyun,MEI Yadong,et al.New information RBF neural networKand its applilcation in forecasting of water demand[J].Water Resources Protection,2012,28(2):8-11.(in Chinese))

[8]袁伟,闫小虎.基于SPA-BP的河流水质评价模型[J].水利水电科技进展,2011,31(增刊1):11-13.(YUAN Wei,YAN Xiaohu.River water quality assessment model based on SPA-BP[J].Advances in Science and Technology of Water Resources,2011,31(Sup1):11-13.(in Chinese))

[9]MINNSA W,HALL M J.Artificial neural networks as rainfall runoff models[J].Hydrol Sci J,1996,41(3):399-417.

[10]RAJURKAR M P,KOTHYARI U C,CHAUBE U C.Modeling of the daily rainfall-runoff relationship with artificial neural network[J].Journal of Hydrology,2004,285:96-113.

[11]赵人俊.流域水文模拟:新安江模型与陕北模型[M].北京:水利电力出版社,1984:107.

[12]SHAMSELDIN A Y,O’CONNOR KM,A nearest neighbor linear perturbation model for river flow forecasting[J].Journal of Hydrology,1996,179(1/2/3/4):353-375.

[13]刘勇,王银堂,陈元芳,等.丹江口水库秋汛期长期径流预报[J].水科学进展,2010,21(6):771-778.(LIU Yong,WANG Yintang,CHEN Yuanfang,et al.Long-term runoff forecasting for autumn flooding seasons in Danjiangkou reservoir based on analyzing the physical causes[J].Advances in Water Science,2010,21(6):771-778.(in Chinese))

[14]DEB K,PRATAP A,AGARWAL S,et al.A fast and elitist multiobjective genetic algorithm:NSGA-II[J].IEEE Transactions on Evolutionary Computation,2002,6(2):182-197.

[15]张栋,蔡开元.基于遗传算法的神经网络两阶段学习方案[J].系统仿真学报,2003,15(8):1088-1090.(ZHANG Dong,CAI Kaiyuan.A genetic-algorithm-based two-stage learning scheme for neural networks[J].Journal of System Simulation,2003,15(8):1088-1090.(in Chinese))

[16]芮孝芳.水文学原理[M].北京:中国水利水电出版社,2004:53.

[17]苏金明,张莲花,刘波,等.MATLAB工具箱应用[M].北京:电子工业出版社,2004:122.

猜你喜欢
新安江产流流域
产流及其研究进展
压油沟小流域
不同坡面单元人工降雨产流试验与分析
堡子沟流域综合治理
罗堰小流域
北京山区侧柏林地坡面初始产流时间影响因素
地表粗糙度对黄土坡面产流机制的影响
打造智慧流域的思路及构想——以讨赖河流域为例
新安江雾
新安江上游横江地表水中砷、硒、汞含量变化研究