基于EEMD-LSTM的森林火灾成灾面积预测模型

2022-07-04 07:05徐艳杰
农业与技术 2022年12期
关键词:成灾分量火灾

徐艳杰

(内蒙古森林消防总队兴安盟支队,内蒙古 兴安盟 137400)

1 研究背景

森林火灾是一种随机性强、破坏性大的自然灾害,对林业发展和生态环境保护影响恶劣,同时造成了较为严重的生命和财产损失[1]。我国是森林火灾发生频次高、受灾面积广的国家之一,2007—2017年我国森林火灾平均成灾面积达26467hm2,各省市均经历了不同程度的森林火灾。由于全球气候不断变暖,加之火灾还受到地形和人为等众多因素的干扰和影响,林火发生概率逐渐提高[2]。因此,构建准确的森林火灾成灾面积预测模型,可以为林火预防工作提供指导,从而减少相应损失。

目前针对森林火灾面积预测方面,一些学者开展了相关研究。沈姣姣等[3]采用聚类分析对陕西省森林火灾成灾面积、次数等特征进行分析,考虑温度、湿度等气候因素,建立了森林火灾面积预测模型,模型正确率超过70%。汪文野等[4]从时间和空间尺度进行了气候条件分析,建立了深度学习算法-森林火灾面积预测模型,研究表明预测模型的数据泛化能力提升,预测精度较高。徐海龙等[5]根据主成分分析消除了所选取10个气象因子之间的共线性关系,利用多元回归构建了森林火灾成灾面积预测模型,结果表明模型的相关系数为0.66,预测结果较为符合实际情况。黄家荣等[6]建立了3层神经网络森林火灾面积预测模型,引入变结构法确定了预测模型的主要参数,预测结果与实际受灾面积吻合度较好,为森林火灾预防提供了一种较为可靠的方法。

针对森林火灾发生具有随机性和不确定性等特点,且受到诸多因素的影响,森林火灾成灾面积时间序列往往具有较大的波动性,属于非平稳时间序列[7]。因此,本文将集合经验模态分解EEMD和长短期记忆网络LSTM相结合,提出了基于EEMD-LSTM的森林火灾成灾面积预测模型,根据集合经验模态分解EEMD将样本数据分解,采用长短期记忆网络LSTM对分解后的各分量进行预测并将各分量预测结果叠加重构。基于1992—2017年我国森林火灾成灾面积对上述所建预测模型应用验证,并与BP和LSTM神经网络模型的预测结果进行比较,所建EEMD-LSTM预测模型的平均绝对误差MAE和均方根误差RMSE最小,验证了该模型在森林火灾成灾面积预测方面具有更高的预测精度。

2 算法介绍

2.1 EEMD算法

集合经验模态分解EEMD(Ensemble Empirical Mode Decomposition,EEMD)是一种新型自适应信号处理方法,广泛应用于从噪声非线性和非平稳过程中产生的数据提取信号。集合经验模态分解EEMD将样本数据分解成多个本征模函数IMF(Intrinsic Mode Function)和趋势项RES(Trend Items),实现非平稳数据序列的平稳化处理,具体过程如下。

生成幅值为k的白噪声序列n(t),设置EMD分解运算的总次数M和初始迭代次数m=1。

进行第m次EMD运算,分解流程如下。

①将生成的白噪声序列nm(t)加入森林成灾面积时间序列x(t),得到新的森林成灾面积时间序列xm(t):

xm(t)=x(t)+k×nm(t)

(1)

②循环变量初始化:

i=1,j=1,x1(t)=x(t),y1(t)=xi(t)。

③对森林成灾面积时间序列yj(t)的局部极大值点进行统计,根据3次样条插值拟合形成上包络线lj(t);同理,对局部极小值点进行统计拟合形成下包络线nj(t),求出2条线的均值pj(t):

(2)

④计算森林成灾面积时间序列yj(t)与pj(t)的差值hj(t):

hj(t)=yj(t)-pj(t)

(3)

⑤根据EMD分解的要求对hj(t)进行判断,满足条件则得到分解量Ci(t),不满足则重复上述③和④,Ci(t):

Ci(t)=hj(t)

(4)

⑥计算剩余分解量ri(t):

ri(t)=xi(t)-Ci(t)

(5)

⑦循环i和j进行计算,得到n个IMF分量和1个剩余分量:

Ci,m(t)=hj,m(t),i=1,2,…,n

(6)

rn,m(t)=rn-1,m(t)-Cn,m(t)

(7)

⑧如果m

2.2 LSTM算法

长短期记忆网络(Long Short-Term Memory,LSTM)是一类机器学习智能算法,广泛应用于信号建模、时间序列预测等研究,能够有效解决循环神经网络RNN所带来的一系列梯度问题影响。长短期记忆网络LSTM主要由3种门状态组成,具体内容见图1。

长短期记忆网络LSTM具体计算公式:

ft=σ(ωf[qt-1,xt]+bf)

(8)

it=σ(ωi[qt-1,xt]+bf)

(9)

s′t=tanh(ωc[qt-1,xt]+bc)

(10)

st=ftst-1+its′t

(11)

ot=σ(ωo[qt-1,xt]+bo)

(12)

qt=ot×tanh(st)

(13)

式中,ft表示遗忘门的输出;it表示输入门的输出;s′t表示前一时刻细胞状态;st表示当前时刻细胞状态;ot表示输出门的输出;qt表示t时刻单元输出;xt表示t时刻的输入;σ表示sigmoid函数;ωf、ωi、ωc、ωo分别表示对应门或细胞状态的权重值;bf、bi、bc、bo分别表示对应门或细胞状态的偏移值。

3 实例应用

将1992—2017年共计26个年份的全国森林火灾成灾面积作为本文预测模型的输入样本,资料选自《中国林业统计年鉴》,具体见表1。

表1 1992—2017年全国森林火灾成灾面积数据

将1992—2009年的样本数据作为训练集,2010—2017年的样本数据作为测试集。采用集合经验模态分解EEMD对全国森林火灾成灾面积数据时间序列有效分解,将分解后的各分量分别代入LSTM模型进行预测,将所有分量预测的数据进行组合重构,得到EEMD-LSTM模型的预测结果。为验证所建EEMD-LSTM模型的预测性能和可靠性,分别采用BP和LSTM神经网络模型对森林火灾成灾面积时间序列进行预测。3种模型预测结果的相对误差如图2所示。

图2 3种模型预测结果的相对误差对比

从图2可以看出,EEMD-LSTM模型预测结果的相对误差较为稳定,最大相对误差出现在2012年,其值为12.19%,2010年、2011年、2016年、2017年4个年份预测结果的相对误差小于10%。另外2个模型预测结果相对误差的波动变化较为明显,尤其是从2014—2015年,LSTM模型预测结果的相对误差从最大值23.82%变化为不到15%。整体而言,EEMD-LSTM模型的相对误差明显小于BP和LSTM模型的相对误差,除2014年外,LSTM模型各年份的相对误差均小于BP模型的相对误差。

采用常见的评价指标平均绝对误差MAE和均方根误差RMSE,3个模型的具体计算结果见表2。

表2 3种模型预测精度对比

由表2可知,EEMD-LSTM模型预测结果的平均绝对误差MAE和均方根误差RMSE分别为2021hm2和2415hm2,根据2个预测结果评价指标可知,模型预测精度排序:EEMD-LSTM>LSTM神经网络>BP神经网络。从平均绝对误差MAE考虑,相较于LSTM神经网络和BP神经网络,EEMD-LSTM模型的预测性能分别提高了33.7%和41.8%。从均方根误差RMSE考虑,相较于LSTM神经网络和BP神经网络,EEMD-LSTM模型的预测性能分别提高了28.8%和39.1%。由此可知,EEMD-LSTM模型的预测结果准确性明显高于另外2种模型,原因在于集合经验模态分解EEMD将非平稳的森林成灾面积时间序列转化为多个不同变化规律的分量,各分量预测值重构后的预测结果较为准确,有效降低了预测的误差,从而保障了预测精度。

4 结论

考虑到集合经验模态分解EEMD能够将非平稳时间序列分解成具有不同变化规律的分量,基于先分解后重构的思想,将该方法与LSTM神经网络相结合,建立了EEMD-LSTM森林成灾面积预测模型,基于1992—2017年全国森林火灾成灾面积数据,将所建模型与单一BP和LSTM神经网络模型进行比较验证。研究结果表明,EEMD-LSTM模型预测结果的相对误差较为稳定且明显小于BP和LSTM神经网络模型的相对误差。EEMD-LSTM森林成灾面积预测模型平均绝对误差MAE的预测性能分别提高了33.7%和41.8%,均方根误差RMSE的预测性能分别提高了28.8%和39.1%。相较于另外2个模型,EEMD-LSTM模型能够更为准确地预测森林成灾面积,为森林火灾预测提供了一种新的方法。

猜你喜欢
成灾分量火灾
帽子的分量
木石也可成灾
论《哈姆雷特》中良心的分量
沙棘木蠹蛾成灾原因及控制措施
分量
掌握火灾逃生知识
基于瞬时对称分量法的三相四线制D-STATCOM控制研究
秦巴山区浅表层滑坡成灾规律研究
借我抄抄 等
离奇的火灾