基于回声状态网络的干旱预测方法研究

2020-10-12 06:26贾家超胡浩赵相斌蒋先荣刘振男
贵州农机化 2020年3期
关键词:储备神经元贵州省

贾家超,胡浩,赵相斌,蒋先荣,刘振男

(贵州理工学院 土木工程学院,贵州 贵阳 550003)

0 引言

干旱问题一直受到世界各国及组织的高度关注,由于其成灾原因复杂多变且历时较长,进而对社会经济造成了严重的危害。 因此,如何有效的对干旱进行预测显得格外重要,国内外学者针对干旱预测进行了大量的研究,并取得了丰硕的成果。 灰色系统GM(1,1)模型被成功应用到短期干旱预测当中,并取得了良好的结果[1];吴晶等[2]将森林随机模型(Random Forest,RF)应用于淮河流域的干旱预测当中,结果的准确率达到73 %;刘洪兰等[3]将人工神经神经网络模型(Artificial Neural Network,ANN)应用于河西走廊伏旱预测当中,准确率高达84.6 %;白致威等[4]应用ARIMA 模型对云南的干旱进行了预测,结果表明云南干旱在未来一段时间内仍将持续;林洁等[5]基于马尔科夫链模型对湖北省的干旱进行了预测,证实了马尔科夫链模型在干旱预测方面具备一定的预测能力;迟道才等[6]应用支持向量机对辽宁省的干旱进行了预测,结果表明该模型能够成功应用于干旱预测,同时能为决策部门提供有力的技术支撑;Bacanli 等[7]应用了自适应模糊推理系统(ANFIS)分别对土耳其的干旱进行了预测,结果表明ANFIS 在预测精度上由于ANN;Mishra 等[8]应用随机过程模型对干旱进行了预测;Deo 等[9]应用极限学习机对澳大利亚的干旱进行了预测,并且取得了较好的效果。 回声状态网络作为一种新型的动态神经网络,因为其隐含层较传统的动态神经网络有所不同,其采用储备池代替传统的隐含层结构,具有更明显的非线性特征,从而被成功应用于半自磨机功率[10]、短期风速[11]、网络流量[12]、短期股价[13]及光伏功率[14]预测当中,而在干旱预测方面还鲜有尝试,因此,本文选用标准化降水指数(Standardized precipitation index,SPI)作为干旱预测指数,同时应用回声状态网络对贵州省贵阳市的干旱进行预测,以便验证回声状态网络在干旱预测方面的适用性,为当地的抗旱减灾工作提供参考,进一步丰富干旱预测的研究成果。

2 回声状态网络

回声状态网络(Echo State Network,ESN)是由Jaeger 于2001 年提出的一种新型动态神经网络算法[15]。 ESN 的网络结构与传统的神经网络相同,均由三层结构组成(如图1 所示),不同的是ESN 采用储备池(dynamic reservoir,DR)代替了传统神经网络的隐含层,即输入层、储备池以及输出层。 显然,ESN 的储备池的作用等同于传统网络的隐含层ESN 的储备池是由大量的稀疏矩阵构成,具体作用可以归纳为以下两点:(1)可以将输入变量进行高维非线性扩展处理;(2)可以对输入变量进行短暂记忆。

图1 ESN 网络结构图

假 设{xi}(i= 1,2,…,K) 为 输 入 变 量,{uj}(j=1,2,…,N) 为 储 备 池 内 的 神 经 元,{yk}(k=1,2,…,L) 为输出变量。 储备池内部是由神经元构成的循环网络结构,其中,神经元之间的连接权值矩阵W采用稀疏矩阵的形式,为了使储备池具有短暂记忆能力,该稀疏矩阵的连接度在5 %到10 %,谱半径一般不大于1。 ESN 的学习步骤可以总结如下:

(I)储备池形成记忆信息阶段。 训练集通过输入权值Win导入到储备池中,使储备池形成记忆信息。 记忆信息形成阶段公式如下:

其中,f与fout分布为储备池内部神经元与输出层神经元的激活函数。

(II)计算输出权值矩阵阶段。 通过应用最小误差计算输出权值Wout。 输出权值计算公式如下:

其中,M是输入变量构成的矩阵,而T是输出变量构成的矩阵。

综上可知,ESN 的预测效果与储备池的关系密切,而储备池的优劣取决于以下4 个参数。

1)为了保证网络的稳定性,储备池内的连接权谱半径SR(记为λmax),其值要求小于1。

2)储备池的规模N,即储备池内神经元的个数。 该参数对于网络性能影响异常敏感,如何选取适当的值仍是一个有待解决的问题。

3)输入单元尺度IS,该参数主要是对输入变量进行一个缩放处理。

4)稀疏程度SD,由于储备池内部的神经元连接是稀疏的,因此,SD 反映的是相连神经元与全部神经元的比值,SD 越大,该模型的非线性逼近能力越强,运算也就越复杂。

3 研究区的干旱预测

3.1 数据资料

本文的研究区为贵州省贵阳市,原因如下:一是因为近年来贵州省的干旱发生频繁、损失严重,特别是2010 年以来,贵州省发生了历史罕见的大旱,对当地社会经济造成了巨大损失;二是经查阅文献发现,贵州省干旱预测研究基础薄弱、成果较少,对省会城市贵阳的干旱进行预测研究具有一定的代表性。 为了计算贵阳市的干旱指数SPI,本文选用中国气象数据网中1971 年至2016 年贵阳市的逐月降水数据。

3.2 预测因子与模型结构

模型预测的精度不但与模型自身结构参数有关,还取决于模型预测因子选取是否合理。 贵州省的干旱主要为春旱和秋旱,春旱发生在3 月份至5 月份,而秋旱则发生在9 月份至11 月份,因为春秋两季的历时均为3 个月,因此,累积降水3 个月的SPI 指数能够较好的反映贵州省贵阳市的干旱情况,本文选用SPI-3 描述研究区域的干旱情况,其中,SPI-3 代表该时长的SPI 指数。由于贵州省干旱物理成因关系复杂,目前研究还不够深入,因此本文借鉴文献[7]的预测因子选取方法,利用自相关性与偏相关性对SPI 进行分析(如图2、3),进而确定模型的预测因子。

图2 SPI-3 自相关图

图3 SPI-3 偏相关图

由图2 与图3 可知,SPI-3 的值与前期1、2、5、6 月的SPI-3 的值关系密切,因此,模型预测因子选用SPI-3(t-1)、SPI-3(t-2)、SPI-3(t-5)与SPI-3(t-6)。 据此,建立了以下3 个模型,如表1所示。

表1 模型结构表

3.3 模型训练与结果分析

本文将处理过的数据集分为两部分,训练集选择1971 年至2011 年,测试集选择2012 年至2016 年。 同时,选用均方根误差(Root Mean Squared Error,RMSE)、效能系数(Efficiency,E)及相关系数(Correlation coefficient,CORR)对预测结果进行评价。 RMSE 越接近于0,同时E 与CORR 越接近于1,代表模型的精度越高。 具体公式如下:

其中,xi,yi分别表示实测值与预测值。

根据ESN 的基本原理,借助MATLAB 软件对其编程。 模型预测的关键还在于模型参数的选取,而ESN 的关键参数是储备池的规模N,该参数的最佳规模个数是通过反复实验所得(如表2),为了清晰的反映实验的过程,表3 给出一部分M3 不同储备池规模的预测性能结果。 其他参数设置如下:因为样本总数量为550,训练集样本数量为490,测试集样本数量为60,故初始化储备池的样本数量设置为150,SD 为10%,W 谱半径为0.8,IS 为0.3,激励函数均选取‘tanh’。

表2 储备池最优规模参数表

表3 模型3 不同储备池规模预测性能对比表

为了比较ESN 在干旱预测方面的性能,本文同时采用BP 神经网络对上述模型进行了预测,其中BP 神经网络的参数设置如下:隐含层节点数的设置借鉴经验公式l=n+m+a,其中,n为输入层神经元个数,m为输出层神经元个数,a为[ 1,10]之间的常数,故3 个模型的隐含层节点数均设置为23;迭代次数设置为3 000;学 习 率 设 置 为0. 01, 激 励 函 数 选 取‘tansig’。 表4 分别给出了ESN 与BP 神经网络对3 个模型的预测结果。 通过比较模型性能评价指标RMSE、E 和CORR 可知,ESN 对研究区干旱的预测性能均高于BP 神经网络。 而从运行时间来看,由于ESN 储备池内部调整可以简化为回归计算,因此运行时间较BP 神经网络大幅度减少。 单从ESN 预测的性能而言,RMSE的值从小到大排序为模M3、M2 和M1;E 的值从大到小的排序为M3、M2 和M1;CORR 的值从大到小的排序为M3、M1 和M2。 综合三个指标来看,预测精度最高的是M3,其次是M2,最后是M1。 原因在于M3 的输入因子有4 个,M2有3 个,而M1 只有2 个,据此可知,ESN 预测的精度与模型输入因子的个数有一定的关系,即有效的输入因子个数越多,模型预测精度越高。为了直观的比较ESN 应用于3 个模型的预测精度,最佳预测结果如图4 所示。

表4 模型预测结果

图4 ESN 应用于3 个模型预测对比图

4 结语

(1)采用SPI-3 对贵阳市的干旱情况进行描述,能够合理的反映当地干旱的实际情况。

(2)通过模型性能比较指标RMSE、E 和CORR 知,ESN 应用于研究区干旱预测的性能优于BP 神经网络,较BP 神经网络拥有更好的泛化能力,大大减少了预测运行的时间。

(3)通过比较3 个模型的预测结果知,ESN的预测性能与模型的输入因子有关,即有效的输入因子维数越大,精度越高。

(4)研究区属我国经济较为落后的省份,干旱预测相关研究成果与其他省份相比较少,应用ESN 对研究区干旱进行预测,对当地的防旱减灾工作具有一定的参考价值。

猜你喜欢
储备神经元贵州省
释放钾肥储备正当时
贵州省博物馆大悬挑超限结构设计
AI讲座:神经网络的空间对应
2019年贵州省中国共产党党内统计公报
国家储备林:为未来储备绿色宝藏
仿生芯片可再现生物神经元行为
这个神经元负责改变我们的习惯
贵州省党代会开得最成功
外汇储备去哪儿了
研究人员精确定位控制饮酒的神经元