中国东部夏季雨型的人工神经网络集合预测

2013-02-24 07:14孙照渤谭桂容赵振国卢明
大气科学学报 2013年1期
关键词:雨型人工神经网络交叉

孙照渤,谭桂容,赵振国,卢明

(1.南京信息工程大学气象灾害省部共建教育部重点实验室,江苏南京210044;2.南京信息工程大学大气科学学院,江苏南京210044;3.中国气象局国家气候中心,北京100081)

0 引言

人工神经网络(artificial neural networks,ANN),是对人类大脑系统的一阶特性的一种描述。简单地讲,它是一个数学模型,可以用电子线路来实现,也可以用计算机程序来模拟,是人工智能研究的一种方法。

与其他类型的计算方法相比,人工神经网络具有一些明显的优点。如:它的自适应性和容错性,使得人工神经网络具有广阔的应用前景,特别是对于那些事物相互联系而规律未知的反问题,人工神经网络方法表现出较大的优越性。

气象中有不少问题受实验条件的限制,事物发生发展的机理或机制还不清楚;或者因为影响因子太多,但各因子之间的相互联系和作用机理及其演变还没被完全揭示出来的反问题有很多,因此,作为基于经验知识和数据样本建立预报模型的一种有效手段和技术途径,人工神经网络在缺乏动力机理认识的复杂气象要素和天气预报中得到了广泛应用。如:基于各种数值预报产品的人工神经网络对气温、降水、雷暴、大雾等的预报技术(胡江林等,2001;袁志康等,2002;Jin et al.,2005;Manzato,2005;Wedge et al.,2005;林健玲等,2006;Jain et al.,2006;Smith et al.,2006;Fabbian et al.,2007;Shank et al.,2008;张雪慧等,2009);针对台风路径的预报等(蒋乐贻和费亮,1997;孙军波等,2010)。此外,人工神经网络还应用于集合数值预报、雷达卫星资料的数据处理和对降水的估计等(Hsu et al.,1997,1999;Yang et al.,2004;Hong et al.,2005;王静和程明虎,2007;刘科峰等,2008;熊聪聪等,2008;何如等,2010;Behrangi et al.,2010)。

众多的应用研究表明,人工神经网络模型优于多元线性回归,特别是BP网络的模拟结果表现较好,在确定合理的输入变量和网络结构后,可以尝试得到各种预测模型,取得了较好的预报效果。如:ANN模型在月降水量的预测中表现出了一定的优势(冯亚文等,2011);ANN在台风路径和频数预报以及其他要素场的反演预报中也取得了比其他统计方法更好的预报效果(蒋乐贻和费亮,1997);BP多模式集成预报效果明显好于各子模式效果(熊聪聪等,2008)。但ANN方法也存在一些问题,如对初始权值的选取较敏感、网络结构(如隐层神经元数量)有一定的人为因素(吕庆平等,2009)、模型的泛化性能和独立预报能力受预报因子的选取和样本序列的质量影响较大等(孙军波等,2010)。由于年代际变化,运用同一均值背景下的样本进行训练得到的预测模型的预测能力也相应受到影响。因此,考虑到气候背景的改变,引入集合预报的思想,通过交叉检验方法实现多次训练建模和预测,最后给出对象的概率预报结果将更可能接近于真实情况。

近年来,神经网络逐渐被广泛用于降水预测研究(胡江林等,2001;林健玲等,2006)。关于降水量的预测效果,对于不同神经网络模型,其说法不一。这可能是因为我国夏季降水变率大,又不符合正态分布,对降水量进行直接预测较困难。因此,采用对降水型进行预测较好。孙照渤等(1998)运用人工神经网络方法对我国东部夏季降水型进行的汛期预测取得了较好的效果,但由于我国夏季降水时空分布的复杂性,同一类雨型之间也存在较大差异,这样即使正确地预报出了雨型,也难以勾画具体年份雨型的分布,从而影响到预测的应用效果。孙林海等(2005)在总结前人关于中国夏季雨型划分研究成果及其存在主要问题的基础上,采用1880—2006年中国东部地区夏季降水量,利用经验正交分解、主成分分析、奇异值分解、聚类分析等数理统计方法,并结合经验分析,对中国夏季雨型进行了客观分型,共分为两类四型。客观细化的分型相对原来的三类雨型来讲,更有利于具体年份降水分布的勾画。

本文将在BP人工神经网络的基础上,引入交叉检验及集合预报思想,改进人工神经网络单次预报的方法,并针对中国东部夏季四类雨型采用交叉检验集合的概率预报方法进行预报试验。

1 资料和方法

资料包括:NCEP/NCAR再分析逐月200、500 hPa高度场和海平面气压场,网格格距为2.5°×2.5°,范围为 90°S ~90°N、0°~360°E;逐月 NOAA 2°×2°全球海温资料;中国东部夏季(6—8月)四类雨型资料。所用因子资料的时段为1978年12月—2011年2月。

人工神经网络依赖的数学原理为近似定理。对于任意的 ε >0 和任意的 L2 函数 f:[0,1]n→Rm,存在3层型神经元网络,使之在ε的均方误差精度范围内,可得出 f的近似(胡上序和焦李成,1994)。BP(back propagate),指采用s型活化函数、δ法则训练的多层映射网络。在参数适当时,它能收敛到较小的均方误差(孙照渤等,1998)。

交叉检验,又叫旋转评估(或评价),用于检验统计分析结果是否具有总体特性。一般用于评估在运用独立于预报建模之外资料进行预报的能力。通常把样本资料分成两部分,运用其中一段较长时间的资料样本建立预报方程,利用剩余部分资料做独立预报试验,即交叉检验。交叉检验又分为K折交叉检验(K-fold cross-validation)、2折交叉检验(2-fold cross-validation)、随机重复抽样交叉检验(repeated random sub-sampling validation)和留一法交叉检验(leave-one-out cross-validation)。本文采用K折交叉检验,就是依次抽取k个样本,以k-1个样本进行训练,把剩下的第k个样本作为交叉检验的样本,这样重复k次试验,建立k次模型,得到k次评估结果。

由于数值天气预报的结果对初始条件的微小误差非常敏感,所以观测资料的不准确及资料分析和同化处理中导入的误差会使数值预报的结果产生较大误差。集合数值天气预报就是针对这类问题而提出的。同样,在预报系统中,由于单个资料样本自身误差或不同样本集合引起的气候均值的微小改变也可能使预报结果产生差异。为此,借用集合预报思想,结合交叉检验方法,本文在对建立的预报方程进行交叉检验评估的同时,利用预报年前期因子资料和建立的预报方程进行预报。最后可给出针对某预报年的多次预报结果,即概率预报。

这里使用四类雨型资料及其相关的预报因子。先运用1979—2010年32 a资料进行方程建立和交叉检验,每次以31个样本进行训练建模,把剩下的第32个样本作为交叉检验的样本,这样重复32次试验,得到32次检验评估结果。每次检验的同时,利用2010/2011年冬季因子资料对2011年夏季雨型进行预报,这样一共可得到32次预报结果,针对某一年雨型的预报结果都会存在一个相对于32次的概率。人工神经网络集合预报方案设计、具体流程见图1。图的左虚框内为网络的训练与建立,步骤同单一网络模型的建立,在交叉检验中需要进行k次的建模过程;右虚框内为模型预报与检验结果部分。每次建模运用k-1对样本进行训练建模,利用建好的模型对剩下的一对进行检验评估,同时把预测年的因子输入该模型,由此得到一次雨型的预测结果。由于有k个k-1对样本的不同组合,所以共需进行k次建模,得到k次预报结果。因每次模型对预测年的预报结果不是唯一,可能出现四类雨型中的任意一类,最后只以预测雨型出现最多的为预测年的预测雨型,但以相对于k次出现的概率来表示。

2 试验结果

2.1 因子选择

图1 人工神经网络训练预报框图(左边虚框:模型训练与建立;右边虚框:模型独立预报与检验)Fig.1 Frame diagram of artificial neural networks training and prediction(the left dashed line rectangle:the training and establishing of model;the right dashed line rectangle:the independent prediction and test of model)

20世纪70年代首次提出了中国夏季三类雨型(廖荃荪等,1981;廖荃荪和赵振国,1992),它们分别指:第1类雨型(主要多雨带在黄河流域及其以北地区);第2类雨型(主要多雨带位于黄河与长江之间);第3类雨型(主要多雨带在长江流域及其以南地区)。专家通过分析各类雨型的大气环流成因及海洋和大气的前兆信号,建立了三类雨型的预测概念模型(许力等,1999;赵振国,1999;陈兴芳和赵振国,2000)。三类雨型的概念和预测模型在全国短期气候预测业务中被推广应用,成为每年全国汛期预报会商讨论的重点。此外,还有针对夏季降水的四类、六类分型(王绍武等,1998;孙林海等,2005)。谭桂容和周晓兰(2003)建立了针对三类雨型的汛期预测模型,在业务应用特别是在2002年夏季雨型的预测中取得了较好的效果。考虑到夏季降水空间分布的年际差异较大,分型较粗,即使准确地预报出雨型,也难以较准确地勾画具体年份的降水分布。因此,针对雨型的预报,雨型分得细一点更有助于具体年份雨型的细致刻画;同时,考虑到业务上的应用推广,雨型分得太细会把同一环流背景下的降水型划分为不同类。为此,本文将以四类雨型(表1)作为预测对象(孙林海等,2005),建立关于中国东部夏季四类雨型的人工神经网络预测模型。

表1 1979—2011年四类雨型的划分Table 1 The division off ourrainfallpatternsduring 1979—2011

预报因子的选择,就是运用相关和合成分析方法,对四类雨型前期冬季的大气环流和海洋状况进行分析,寻找相关的显著信号作为预报因子。考虑到气候系统演变,本文在选择因子时不是按照季节选取因子,而是把冬季按照12月、1月、2月的演变,逐月选择预报因子。初选因子有15个,考虑到预报因子之间的相互独立性,最后从前期冬季500、200 hPa高度场、海平面气压场和海表温度场中共选取了9个预报因子。

2.2 模拟预测

2.2.1 模拟结果

利用1979—2010年共32 a资料进行交叉检验时,依次选取1 a为检验评估年,剩余31 a用做预报方程的建立。这样,一共进行31次方程的建立,每一样本参与方程的模拟和建立31次,而参与交叉检验评估只有1次。

为了了解近30 a来不同因子组合的均值变化及其对模拟结果的影响,本文进行了一个简单的试验。先依据某段固定30 a长度样本进行网络建模,然后利用该网络对某一年的雨型进行拟合。即运用同一的网络模型对同一年的雨型进行模拟,但该年的因子距平会因采取不同样本的均值而变化。

从所选9个因子标准化距平均值随不同组合样本的变化曲线(图略)可知,因子均值随不同样本组合而变化,虽然多数因子的均值距平变化在正负0.1以内,但仍有不少因子的均值差异在正负0.1以外,某具体年份的距平差异大于0.6。结果表明:在同一网络模型中,同一年份的因子因为均值改变,对雨型的模拟结果存在差异。尽管与该年实际雨型(3类雨型)一致的概率为78%,但仍有19%概率的2类雨型,3%概率的1类雨型。也就是说,所取样本均值的改变可以影响到模拟结果。因此,根据均值改变,进行集合预报是必要的。

图2为交叉检验中雨型模拟准确率的历年变化。可见,平均模拟准确率超过92.3%;准确率超过90%的有27 a(全部31 a),准确率最高为96.7%(1981年);模拟准确率低于90%的只有4 a,准确率最低为77%(1982年)。

从四类雨型的模拟准确率来看,第1、3类雨型的模拟准确率都是100%,第2、4类雨型的模拟准确率分别为77.1%和97.7%。即在对四类雨型的218、341、216、217 次的模拟中,模拟准确的次数分别为218、263、216 和212 次。

2.2.2 交叉检验结果

对1979—2010年夏季雨型进行交叉检验,结果表明,模型预报32 a,有26 a预报正确,6 a预报错误(表2),总的预报准确率为81.2%。其中:1类雨型共有7 a,预报正确的有6 a,1 a误报为3型;2类雨型共有11 a,预报正确的有7 a,3 a误报为1型,1 a误报为3型;3类雨型共有7 a,预报正确的有6 a,1 a误报为2型;4类雨型共有7 a,均预报正确。

表2 四类雨型的交叉检验结果Table 2 Results of the cross validation for four rainfall patterns

图2 模拟准确率(a;单位:%)和频次(b)的历年变化Fig.2 Yearly variations of(a)simulated accuracy(%)and(b)frequency

2.2.3 集合预报结果

在32次交叉检验过程中,每次模型建立之后都对2011年夏季的雨型进行1次预测。结果表明,该年出现3类雨型的概率最大(56.25%)。32次试验预报中,出现1、2、3、4 类雨型的次数分别为 3、6、18和5次,1、2、4类雨型发生的概率分别为9.4%、18.8%和15.6%。实际上,2011年夏季我国长江中下游降水偏多,为3类雨型,表明模型对该年雨型的预报与实况较吻合。

3 结论

本文在BP人工神经网络建模的基础上,考虑到历史资料的个体差异及其年代际变化会影响到样本均值,使预测因子的距平值发生变化,从而使得该方法的模拟和预测效果产生差异,故引入交叉检验及集合预报思想,以减少人工神经网络单次独立预报方法的随机性,从而改进该方法的预报效果。在采用交叉检验集合训练时,利用不同历史样本资料建立网络模型,并进行交叉检验,同时对预测年的雨型进行预测。从人工神经网络模拟试报的结果来看,其预报能力有一定改进。但是,由于人工神经网络在建模过程中训练时间较长,所以运用人工神经网络进行集合建模预报时训练时间更长。由于本文是对雨型进行预测,而不是对某变量进行定量预测,所以为了减少训练时间,又不影响模拟和预报效果,在选择判断是否继续进行训练的条件时,以对雨型的模拟准确率不再提高为条件,这样可以增加网络训练的效果,减少训练时间。

陈兴芳,赵振国.2000.中国汛期降水预测技术的研究和应用[M].北京:气象出版社.

冯亚文,任国玉,张丽,等.2011.长江上游月降水人工神经网络预测模型[J].长江流域资源与环境,20(1):40-47.

何如,管兆勇,金龙.2010.一种神经网络的云图短时预测方法[J].大气科学学报,33(6):726-729.

胡江林,张礼平,宇如聪.2001.神经网络模型预报湖北汛期降水量的应用研究[J].气象学报,59(6):776-783.

胡上序,焦李成.1994.人工神经元计算导论[M].北京:科学出版社:190-220.

蒋乐贻,费亮.1997.台风路径人工智能预报方法的研制[J].应用气象学报,8(2):254-255.

廖荃荪,赵振国.1992.我国东部夏季降水分布的季节预报方法[J].应用气象学报,3(增刊):1-9.

廖荃荪,陈桂英,陈国珍.1981.北半球西风带环流和我国夏季降水[C]//长期天气预报文集.北京:气象出版社:103-114.

林健玲,金龙,林开平.2006.神经网络方法在广西日降水预报中的应用[J].南京气象学院学报,29(2):215-219.

刘科峰,张韧,李文才,等.2008.奇异值分解与神经网络结合的卫星云图云团移动预测[J].解放军理工大学学报:自然科学版,9(3):298-301.

吕庆平,罗坚,朱坤,等.2009.基于人工神经网络的热带气旋路径预报试验[J].广东气象,31(1):15-18.

孙军波,钱燕珍,陈佩燕,等.2010.登录台风站点大风预报的人工神经网络方法[J].气象,36(9):81-86.

孙林海,赵振国,许力,等.2005.中国东部季风区夏季雨型的划分及其环流成因分析[J].应用气象学报,16(增刊):56-62.

孙照渤,谭桂容,赵振国.1998.人工神经网络方法在夏季降水预报中的应用[J].南京气象学院学报,21(1):47-52.

谭桂容,周晓兰.2003.我院气象台2000—2002年短期气候预测业务工作进展[J].气象教育与科技,25(2):10-14.

王静,程明虎.2007.用神经网络方法对雷达资料进行降水类型的分类[J].气象,33(7):55-60.

王绍武,叶瑾林,龚道溢,等.1998.中国东部夏季降水型的研究[J].应用气象学报,9(1):65-73.

熊聪聪,王静,宋朋,等.2008.遗传算法在多模式集成天气预报中的应用[J].天津科技大学学报,23(4):80-84.

许力,赵振国,王永光,等.1999.中国东部夏季(6—8月)降水的一种客观分型方法[J].气象科学,20(3):270-276.

袁志康,张韧,周树道,等.2002.基于人工神经网络算法的某机场雾的模式识别预报[J].解放军理工大学学报:自然科学版,3(4):82-86.

张雪慧,官莉,王振会,等.2009.利用人工神经网络方法反演大气温度廓线[J].气象,35(11):137-142.

赵振国.1999.中国夏季旱涝及环境场[M].北京:气象出版社.

Behrangi A,Hsu K,Imam B,et al.2010.Daytime precipitation estimation using bispectral cloud classification system[J].J Appl Meteor Climatol,49:1015-1031.doi:http://dx.doi.org/10.1175/2009JAMC2291.1.

Fabbian D,de Dear R,Lellyett S.2007.Application of artificial neural network forecasts to predict fog at canberra international airport[J].Wea Forecasting,22:372-381.doi:http://dx.doi.org/10.1175/WAF980.1

Hong Y,Hsu K,Sorooshian S,et al.2005.Improved representation of diurnal variability of rainfall retrieved from the tropical rainfall measurement mission microwave imager adjusted precipitation estimation from remotely sensed information using Artificial Neural Networks(PERSIANN)System[J].J Geophys Res,110,D06102.doi:10.1029/2004JD005301.

Hsu K,Gao X,Sorooshian S,et al.1997.Precipitation estimation from remotely sensed information using artificial neural networks[J].J Appl Meteor Climatol,36:1176-1190.

Hsu K,Gupta H,Gao X,Sorooshian S.1999.Estimation of physical variables from multi-channel remotely sensed imagery using a neural network:Application to rainfall estimation[J].Water Resour Res,35:1605-1618.

Jain A,McClendon R W,Hoogenboom G.2006.Freeze prediction for specific locations using artificial neural networks[J].Trans ASABE,49(6):1955-1962.

Jin Long,Kuang Xueyuan,Huang Haihong,et al.2005.Study on the over fitting of the artificial neural network forecasting model[J].Acta Meteor Sinica,19(2):216-225.

Manzato A.2005.The use of sounding-derived indices for a neural network short-term thunderstorm forecast[J].Wea Forecasting,20:896-917.

Shank D,Hoogenboom G,Mcclendon R.2008.Dewpoint temperature prediction using artificial neural networks[J].J Appl Meteor Climatol,47:1757-1769.

Smith B A,McClendon R W,Hoogenboom G.2006.Improving air temperature prediction with artificial neural networks[J].Int J Comput Intell,3(3):179-186.

Wedge D,Ingram D,McLean D,et al.2005.A global-local artificial neural network with application to wave overtopping prediction[M]//Duch W,et al.Artificial Neural Networks:Formal Models and Their Applications-ICANN 2005,LNCS 3697:109-114.doi:10.1007/11550907_18.

Yang Hong,Hsu K,Soroosh S,et al.2004.Precipitation estimation from remotely sensed imagery using an artificial neural network cloud classification system[J].J Appl Meteor Climatol,43:1834-1852.

猜你喜欢
雨型人工神经网络交叉
概化的累计暴雨量百分数法在太湖区域设计暴雨雨型研究的应用
红壤区典型茶园模式对侵蚀性降雨的减流减沙效应
利用人工神经网络快速计算木星系磁坐标
天津市设计暴雨雨型的演变
“六法”巧解分式方程
人工神经网络实现简单字母的识别
深圳市流域暴雨雨型及变化趋势分析
滑动电接触摩擦力的BP与RBF人工神经网络建模
连数
连一连