基于VMD-CQPSO-GRU模型的气象干旱预测方法

2021-10-08 07:40刘雪梅宋文辉钱峰王立虎冯岭谢文君
关键词:方根信阳市安阳市

刘雪梅, 宋文辉, 钱峰, 王立虎, 冯岭, 谢文君

(1.华北水利水电大学 信息工程学院,河南 郑州 450046; 2.水利部 信息中心,北京 100053)

干旱预测对防灾减灾具有重要意义[1]。当前,干旱预测模型主要分为机理驱动和数据驱动两类。机理驱动模型以水文理论为主,如孙龙等[2]基于机理性较强的分布式水文模型SWAT和集合预报ESP思想建立了一套干旱预报体系;彭雪婷等[3]基于分布式水文模型对怒江流域进行了气象干旱和水文干旱分析。数据驱动模型以统计科学为基础,如隐马尔科夫模型[4]、灰色模型[5]、支持向量机[6]、人工神经网络等[7-9]。机理驱动模型往往存在机理认识不深刻、应用场景具有局限性等问题,且已有的水文模型是因洪水预报而诞生的,用于干旱预报时有明显的短板。数据驱动模型不需要考虑复杂的水文过程,只对时间序列进行数学分析,在解决预测问题以及时间序列分析方面有独特优势[10]。但数据驱动模型存在两个问题:问题一是数据驱动模型涉及大量调参工作,如神经元数目、学习率等,依靠经验确定参数影响模型效果,造成模型稳定性不足[11];问题二是精度低、泛化能力差、特征提取能力有限,单一预测模型很难得到理想的预测精度[12]。混合模型可结合各单一模型优势,通过模型组合来弥补单一数据驱动模型的不足。针对问题一,刘振男等[13]基于遗传算法优化的极限学习机以云贵高原干旱为例进行试验,对比传统的极限学习机实现了模型稳定性的提升;刘雅云[14]提出了一种基于粒子群优化的支持向量机预测模型,通过粒子群算法来优化支持向量机参数,从而提高了预测精度;魏腾飞等[15]提出了一种改进的粒子群算法优化长短期记忆神经网络的短期电力负荷预测模型,提高了预测的精度和预测结果的稳定性。以上研究表明,遗传算法、粒子群算法等优化算法可用于超参数寻优,从而提高了模型稳定性;针对问题二,可对气象序列进行信号预处理以提高预测精度。分解技术是一种信号处理方法,可将气象序列分解为一系列相对稳定的子序列,常用的分解算法如经验模态分解、集合经验模态分解、小波分解等。TAESAM Lee[16]提出了一种基于经验模态分解与长短期记忆神经网络的太阳黑子数时间序列预测方法;TAN Qiaofeng等[17]采用集合经验模态分解对径流进行分解,更好地提取了数据信息,提高了预测精度;DEO Ravinesh等[18]使用离散小波变换将干旱指数序列分解为其时频分量,以捕获有关周期性的重要信息,提高了预测精度。经验模态分解算法可将非平稳的时间序列转化为若干个规律性显著的分量进行预测,并将分量预测结果进行合并以得到精度较高的预测值。但经验模态分解过程中容易出现端点效应以及模态混叠问题[19];集合经验模态分解通过加入白噪声,可有效抑制经验模态分解过程中的模态混叠现象,但也可导致分解后的信号重构造成误差加大[20];小波分解存在小波核函数难以优选的问题,影响分解效果。而变分模态分解避免了模态混叠的现象,提升了信号分析效果[21-22]。目前,变分模态分解在风力、电力、径流预测中已有诸多研究,但尚未在气象干旱预测中运用[23-24]。

基于以上讨论,本文以提高气象干旱预测模型的精度及可信度为目标,结合变分模态分解(VMD)[25]、改进的混沌量子粒子群(CQPSO)[26]以及门控循环单元(GRU)[27]的各自优势,提出一种以“分解-合成”理论为基础的VMD-CQPSO-GRU深度学习混合预测模型。

1 模型理论

1.1 变分模态分解

变分模态分解是由Dragomiretskiy等于2014年提出的一种自适应、完全非递归的模态变分和信号处理技术。它用于非平稳信号的自适应分解,将输入信号分解为若干个相对稳定的分量,使模型更好地捕捉特征,具有更坚实的理论基础[28]。VMD的实现具体可以描述如下:

设f(t)时间序列,将变分问题描述为利用中心频率求K个有限带宽的模态函数uk(t),k=1、2、…、k,从而使每个模态的带宽估计之和最小。所有本征模态分量之和等于原始信号f(t),定义如下[29]:

(1)

式中:{uk}={u1、u2、…、uk},代表分解得到的k个本征模态分量;{ωk}={ω1、ω2、…、ωk},代表各分量的中心频率;⊗为卷积计算;K为模态函数的总数;δ(t)为狄拉克分布;ω(k)为模态函数的中心频率。

为了求取上述约束变量的最优解,将约束问题转换为非约束问题,引入二次惩罚因子α和Lagrange乘法算子λ(t),得到增广Lagrange函数如下:

(2)

式中二次惩罚因子α是为了在高斯噪声存在的条件下保证信号的重构精度,Lagrange算子λ(t)是为了使约束条件保持严格性[30]。

利用交替方向乘子法,通过迭代更新求得增广拉格朗日表达式的鞍点即为原问题的最优解,而所有的分量可从频域中获得,表示为:

(3)

(4)

1.2 量子粒子群优化算法

量子粒子群优化算法(Quantum Particle Swarm Optimiztaion,QPSO)是对粒子群优化算法的一种改进算法,其灵感来自于量子力学理论以及对于典型粒子群轨迹的分析[31]。由于量子巨大的计算能力,以及其随机计算状态可以避免粒子群优化算法在优化过程中过早陷入局部最优,进而促进粒子在空间中更有效地寻找全局最优解[32]。与粒子群算法相比,QPSO算法进化方程简单且控制参数少。QPSO优化算法的粒子迭代寻优过程可表达为:

(5)

Pi=φpbest_i+(1-φ)pgbest,

(6)

(7)

式中:Mbest为所有粒子个体最优位置的平均值;M表示种群数目;pbest_i和pgbest分别为粒子的个体最优位置和全局最优位置;Pi用于第i个粒子位置的更新;φ和u为0~1间均匀分布的随机数;xi表示第i个粒子的位置,xi+1表示下一次迭代;α为压缩扩张因子,用于控制搜索过程中粒子的收敛速度。

1.3 门控循环单元

门控循环单元(GRU)神经网络是由CHO Kyunghyun等于2014年提出的,是循环神经网络的增强版,有效解决了循环神经网络梯度消失和梯度爆炸问题,常用于时间序列预测领域[33]。门控循环单元将长短期记忆神经网络的遗忘门和输入门整合为更新门,用来控制当前输入是否被保留。重置门用于确定是否要结合当前状态与先前状态的信息[34]。GRU的神经元结构如图1所示。

GRU各神经网络单元可定义为[35]:

zt=σ(Wz·[ht-1,xt]),

(8)

rt=σ(Wr·[ht-1,xt]),

(9)

(10)

(11)

图1 GRU神经元结构

2 基于VMD-CQPSO-GRU模型的气象干旱预测方法构建

2.1 改进的门控循环单元神经网络

GRU神经网络中有多个超参数,人工调参得到的超参数不够精确,理论支撑不足。故可以通过优化算法来确定超参数的取值,提高参数选取的可靠性。量子粒子群算法是在粒子群算法基础上的改进算法,在一定程度上提高了获取最优解的能力。但在处理高维复杂问题时,存在收敛速度慢、可能陷入局部最优的可能[36]。针对QPSO算法的不足,使用混沌映射来改进量子粒子群的初始化以及粒子位置更新过程。常见的混沌映射有12种,其中Logistic映射与Tent映射使用较多。单梁等[37]的研究表明,Tent映射的遍历均匀性和收敛速度均优于Logistic映射,并通过严格的数学推理,证明了Tent映射在混沌优化算法中具有广泛的应用前景。Tent映射表达式如下:

(12)

Tent混沌量子粒子群优化门控循环单元神经网络(CQPSO-GRU)的流程为:

1)初始化CQPSO算法参数,包括种群规模n、粒子维度Pd、最大迭代次数Tmax、压缩扩张因子α、GRU待优化的参数以及值域。其中,将GRU第一层、第二层神经元个数以及batch-size作为待优化参数,值域设置为[4,128]。

2)确定粒子的评价函数。种群中粒子的适应度函数定义为:

(13)

式中:n为种群规模;Qo为实测值;Qf为预测值。

3)通过Tent混沌序列,对粒子群进行初始化,用得到的种群粒子对GRU神经网络参数赋值,进行训练。

4)计算每个粒子的适应度值,根据更新公式以及Tent混沌映射对粒子位置进行更新,在更新过程中不断更新当前最优解以及全局最优解。

5)若满足最大迭代次数,输出最优粒子种群位置,将得到的参数作为GRU模型的最优解,随后对干旱序列进行预测。

2.2 VMD-CQPSO-GRU混合模型构建

VMD-CQPSO-GRU混合模型参数固定如下:时间步长为6,分解分量数为9,GRU模型参数由Tent混沌量子粒子群算法确定。提取VMD-CQPSO-GRU模型的特征相关性和时间相关性特征之后传入全连接层进行预测,模型结构如图2所示。

图2 VMD-CQPSO-GRU模型结构图

VMD-CQPSO-GRU模型的计算步骤如下:

2)其次,CQPSO-GRU模型获得本征模态分量输入后,计算更新门,用于决定前一时间步和当前时间步哪些信息需要继续传递。公式定义如下:

zt=σ(Wzzzv+Wzhht-1)。

(14)

式中:zv为VMD输出信息;ht-1为前一时间步的输出信息;t为当前时间;Wzz、Wzh分别指更新门权重。

3)再次,计算CQPSO-GRU的重置门,用于决定过去的信息有多少需要遗忘。公式定义如下:

rt=σ(Wrzzv+Wrhht-1)。

(15)

式中Wrz、Wrh分别指重置门权重。

重置门与更新门的表达式类似,但线性变换的参数以及用途不同。

4)最后,计算CQPSO-GRU的当前输出,用于决定过去的信息有多少需要遗忘,并将ht传入下一步作为新的神经元信息。公式定义如下:

ht=(1-zt)ht-1+zttanh(Whzzv+Whhht-1)。

(16)

式中Whz、Whh分别指权重。

2.3 基于VMD-CQPSO-GRU模型的气象干旱预测方法

基于VMD与CQPSO-GRU模型,构建VMD-CQPSO-GRU混合模型,增强模型非稳态特征表达能力。在此基础上,利用标准化降水蒸散指数计算区域干旱等级,进而建立基于VMD-CQPSO-GRU混合模型以及SPEI指数的气象干旱评估方法。

1)对研究区域气象数据进行清洗过滤,并将过滤数据进行归一化操作,归一化方式可定义如下:

(17)

式中:fNormalized为归一化序列;max(xi)、min(xi)分别为输入序列xi的最大值和最小值。

2)对归一化数据进行VMD分解,将原始气象信号分解为若干本征模态分量,并完成非稳态序列的稳态化。然后将每个本征模态分量分别划分为训练集和测试集。

3)将划分完成的训练集和测试集输入到CQPSO-GRU模型,利用历史气象数据,预测目标地点未来气象数据。

4)以纳什指数(NSE)、平均绝对误差(MAE)、均方根误差(RMSE)评估VMD-CQPSO-GRU模型预测结果的可信度和准确度。其中,NSE值域区间为(-∞,1),NSE值越接近1,模型可信度越高,NSE值越接近-∞,模型可信度越低;MAE用于评估模型预测结果的总体误差;RMSE用来衡量预测值与真实值之间的偏差。各计算式分别如下:

(18)

(19)

(20)

5)将VMD-CQPSO-GRU模型的预测值通过SPEI干旱指标值进行干旱等级划分。SPEI采用降水与蒸散的差值构建,通过正态标准化处理差值,最终用差值的累积频率分布来划分等级。SPEI[38]定义如下:

步骤1:采用Thornthwaite方法计算潜在蒸散量PET。

(21)

式中:Ti为月平均气温;A为常数。

步骤2:计算逐月降水量与潜在蒸散量的差值。

Di=Pi-PETi。

(22)

式中:Pi为月降水量;PETi为月潜在蒸散量。

步聚3:对Di数据序列进行正态化处理,求出log-logistic概率分布的累计函数F(x),计算每个数值对应的SPEI指数。

(23)

3 结果与分析

以河南省的安阳市、郑州市、信阳市为验证区域,选取3座城市1951—2020年共70 a的气象站月降水量、月平均气温资料为研究数据,数据来源于中国气象数据网。

将文中模型与GRU、CQPSO-GRU、EMD-LSTM模型的预测结果进行对比,以纳什指数、平均绝对误差、均方根误差为评估指标,最后通过标准化降水蒸散指数(SPEI)来划分干旱级别,分析安阳市、郑州市、信阳市气象干旱状况。安阳市、郑州市、信阳市降水与气温的预测曲线和纳什指数评估曲线分别如图3和图4所示。

图3 安阳市、郑州市、信阳市的降水与气温预测曲线

图4 安阳市、郑州市、信阳市的降水及气温纳什指数评估曲线

从图3可以看出:4种模型的预测精度有较大差距;月降水量特征呈现非线性的上升-下降循环变化趋势,而月平均气温的周期性较明显。在降水特征预测上,VMD-CQPSO-GRU模型相较于其他3个模型的预测精度更高、拟合效果更好、整体表现最佳,CQPSO-GRU模型较传统GRU模型性能有一定提升,而EMD-LSTM模型的性能时好时坏,不够稳定;在气温预测上,同样是VMD-CQPSO-GRU模型的预测效果优于其他3种模型。同时,从细节可以看出,CQPSO-GRU模型较传统GRU模型的预测误差更小,可靠性更高,EMD-LSTM模型的预测结果局部出现了震荡,可信度不足。

从图4可以看出:VMD-CQPSO-GRU模型预测结果的整体纳什指数达到了0.90以上,表明此模型是一个高可信模型,泛化能力强;CQPSO-GRU模型预测结果的可信度略优于传统GRU模型的,EMD-LSTM模型对安阳市和信阳市的预测可信度略优于CQPSO-GRU模型,但郑州市对降水的预测可信度低于CQPSO-GRU模型,EMD-LSTM模型不够稳定,这进一步验证了图3中的结果。在气温纳什指数曲线中,同样是VMD-CQPSO-GRU模型性能最佳,CQPSO-GRU模型优于传统GRU模型,EMD-LSTM模型表现稍差。整体来看,在月降水量预测上,4种模型预测可信度由高到低排序为:VMD-CQPSO-GRU>EMD-LSTM>CQPSO-GRU>GRU;在月平均气温预测上,4种模型预测可信度由高到低排序为:VMD-CQPSO-GRU>CQPSO-GRU>GRU>EMD-LSTM。

4种模型对安阳市、郑州市、信阳市月降水量的评估指标结果对比如图5所示及见表1。

图5 安阳市、郑州市、信阳市的月降水量评估指标柱状图

表1 安阳市、郑州市、信阳市的月降水量评估指标对比

由图5和表1可知:VMD-CQPSO-GRU模型预测结果的平均绝对误差数值为11.39~20.56,均方根误差数值为16.75~28.69,纳什指数数值在0.90以上;与EMD-LSTM模型的相比,VMD-CQPSO-GRU模型预测结果的平均绝对误差减少了66.24%,均方根误差降低了65.36%,纳什指数提高了207.38%;与CQPSO-GRU模型的相比,VMD-CQPSO-GRU模型预测结果的平均绝对误差减少了62.85%,均方根误差降低了65.65%,纳什指数提高了212.44%;与GRU模型相比,VMD-CQPSO-GRU模型预测结果的平均绝对误差减少了64.63%,均方根误差降低了66.32%,纳什指数提高了250.44%。

上述对比结果表明,VMD-CQPSO-GRU模型预测中较好地缓解了噪声的干扰,减小了干旱特征因子预报误差,提高了纳什指数水平,预测效果优于其他3种对比模型的。另外,由于均方根误差指标对异常值更加敏感,因此在降水量特征上,均方根误差数值略大。

4种模型对安阳市、郑州市、信阳市月平均气温预测的评估指标结果对比见表2。由表2可知:VMD-CQPSO-GRU模型预测结果的平均绝对误差数值为0.52~0.54,均方根误差数值为0.65~0.68,纳什指数数值在0.99以上;与EMD-LSTM模型相比,VMD-CQPSO-GRU模型预测的平均绝对误差减少了81.98%,均方根误差降低了82.76%,纳什指数提高了27.78%;与CQPSO-GRU模型相比,VMD-CQPSO-GRU模型预测结果的平均绝对误差减少了75.84%,均方根误差降低了75.20%,纳什指数提高了9.49%;与GRU模型相比,VMD-CQPSO-GRU模型预测结果的平均绝对误差减少了78.47%,均方根误差降低了77.57%,纳什指数提高了13.68%。

表2 安阳市、郑州市、信阳市的月平均气温评估指标对比

上述对比结果表明,VMD-CQPSO-GRU模型性能最优,尤其是在非稳态特征上,如对月降水量的预测可信度明显提高。

基于SPEI指数的干旱等级划分标准[39]见表3,等级1—5分别表示无旱、轻度干旱、中度干旱、重度干旱、特大干旱。

表3 标准化降水蒸散指数干旱等级划分表

2019—2020年安阳市、郑州市、信阳市的月实际SPEI-1干旱等级与VMD-CQPSO-GRU模型的预测结果对比如图6所示。

由图6(a)可知,VMD-CQPSO-GRU模型预测的安阳市24个月的SPEI-1干旱级别中完全与实际一致的值有20个,准确率83.33%。其中,2019年3月、6月、11月以及2020年2月的预测结果与实际存在明显误差。对误差进行分析可知,2019年3月、6月、11月的误差主要由于降水预测偏多造成,而2020年2月的误差可能是由于降水预测偏少造成。

由图6(b)可知,VMD-CQPSO-GRU模型预测的郑州市24个月的SPEI-1干旱级别中完全与实际一致的值有22个,准确率91.67%。其中,2019年3月的误差可能由于SPEI-1干旱级别对月尺度下数据变化敏感造成,2020年3月的误差原因可能在于SPEI-1的值处于干旱等级划分的临界点处。

由图6(c)可知,VMD-CQPSO-GRU模型预测的信阳市24个月的基于SPEI-1值的干旱级别中完全与实际一致的值有20个,准确率83.33%。在预测发生偏差的这4个月份中,干旱等级相差1个级别的有2个月份,表明预测干旱趋势与真实干旱趋势基本一致。此外,信阳市未出现5级干旱,符合河南省由北向南降雨逐渐增多、干旱逐渐减轻的特点。

图6 2019—2020年安阳市、郑州市、信阳市月实际干旱等级与模型预测结果对比

综上所述,使用本文提出的VMD-CQPSO-GRU深度学习混合模型对安阳市、郑州市、信阳市2019—2020年月干旱级别预测结果中,与实际基于SPEI-1值的干旱级别完全一致的平均准确率为86.11%。且在未能准确预测的级别中,70%的月份等级差距在2个级别以内,表明预测结果和真实结果接近,符合干旱趋势。

4 结论

本文提出了一种基于VMD分解与改进GRU神经网络混合模型的气象干旱预测方法,以安阳市、郑州市、信阳市的历史数据进行算例评估。结论如下:

1)VMD-CQPSO-GRU模型相对于GRU模型,预测误差降低了71.55%,可信度提高了132.06%,证明本文提出的模型无论在精度还是可信度方面都要优于单一神经网络模型。

2)对于稳态特征,如月平均气温,4种模型在拟合优度方面效果相近,但VMD-CQPSO-GRU模型精度更高;但对于非稳态特征序列预测,如对月降水量的预测,VMD-CQPSO-GRU模型体现出明显优越性。

3)从3座城市干旱级别划分结果发现,VMD-CQPSO-GRU模型预测的干旱趋势与历史结果基本一致。另外,由于基于SPEI-1值的干旱等级对月尺度下特征变化敏感,而冬季与春季的降水较少,故干旱级别较高。

本文对气象干旱预测进行了初步探索,预测方法和结果可为相关结果人员提供参考。本文提出的模型具有一定的通用性和可拓展性,可用于其他时序预测。

猜你喜欢
方根信阳市安阳市
信阳市审计局 开展“我们的节日·清明”主题活动
二年级数学强化训练(第一学期)
中秋
开展送温暖活动 安阳市关工委
美 丽 的 天 鹅
信阳市环宇针织服装有限公司
我们爱把马鲛鱼叫鰆鯃
坚持稳、准、狠原则 确保干在实处、走在前列——信阳市检察机关扫黑险恶专项斗争纪实
俯首听民意 开门迎监督——安阳市中级人民法院加强人大代表联络工作纪实
数学魔术——神奇的速算