高铁沿线大风预测技术研究

2021-04-15 23:57金曈宇叶小岭熊雄巩灿灿姚锦松
铁道科学与工程学报 2021年3期
关键词:大风分量风速

金曈宇,叶小岭, 2,熊雄,巩灿灿,姚锦松

高铁沿线大风预测技术研究

金曈宇1,叶小岭1, 2,熊雄1,巩灿灿1,姚锦松1

(1. 南京信息工程大学 自动化学院,江苏 南京 210044;2. 南京信息工程大学 气象灾害预报预警与评估协同创新中心,江苏 南京 210044)

风速预测是风致灾害预警的关键技术。针对高铁大风预测中延迟性和误报的问题,提出一种基于完整集合经验模态分解(CEEMDAN)和长短期记忆神经网络(LSTM)的组合预测模型对高铁沿线风速进行预测。为了减少预测模型的复杂度和提高模型预测精度,原始风速数据用CEEMDAN分解并利用样本熵(SE)理论将分解出的分量按照样本熵近似值重组成趋势、细节、随机三分量后用长短期记忆神经网络建立预测模型。以高铁沿线某段风速气象数据为例,实验结果表明,与其他预测方法相比,本方法可有效降低预测延迟性和提高预测精度,准确追踪风速的波动性和非线性非平稳的变化,性能更加优越。在高速铁路沿线大风预测中能够发挥良好的适用性,减少大风预警的误报或不报等情况的发生。

铁路大风预测;样本熵;完整集合经验模态分解;长短期记忆神经网络

随着高速铁路的快速发展,高铁安全问题也愈加重要。高速列车的速度越快,临界倾覆风速越 小[1],更容易受强风天气的影响,发生倾覆等风致灾害,造成严重的经济损失和人身伤害。因此建立一套高速铁路沿线大风预警系统是十分有必要的。相较于其他行业,高速铁路对短期乃至超短期的风速预测需求更大,要求更高。常规预报分辨率太低、预测时间过长,缺乏针对性,难以满足铁路运行的精细化和个性化要求,因此解决高速铁路的风速预测问题是大风预警的一项关键环节。目前国内外用于风速预测的方法主要有卡尔曼滤波法[2−4],支持向量机法[5−7],空间相关性法[8],以上方法在短期乃至超短期风速预测中误差较大,显然不能满足高速铁路沿线大风预警这种要求精度高,时效短的预测。针对以上研究中存在的不足,文章提出了一种基于完整集合经验模态分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise, CEEMDAN)和长短期记忆神经网络(Long-Short- Term Memory Neural Network, LSTM)的超短期高铁风速预测模型。首先CEEMDAN对原始风速序列进行分解,接着利用样本熵(Sample Entropy, SE)进行重构,最后利用LSTM对重构后的模态分量建模进行超短期风速预测。以国内高铁某段沿线气象站点的历史数据为例,通过实验和其他的预测方法进行对比,以期证明本方法可以有效地提高高速铁路沿线风速超短期预测的精度和降低预测的延迟性。减少大风预警误报或不报等情况的发生。

1 数据

不同于传统行业的风速预测需求。高速铁路采用分级限速模式。孙呈欣[9]提出了不同风速级别下对应的列车限速如表1所示。

区别于其他行业,低风速段的预测精度对高铁大风预警系统的意义不大,高速铁路沿线大风预警更注重在高风速段和临界值点的预测精度。

表1 不同风速级别下对应的列车限速

为了验证提出的方法在高速铁路沿线大风预警中的效果,特意选用国内高速铁路某段沿线气象监测站台风季7,8和9共3个月的气象数据,包含了低中高3段风速,时间分辨率为秒级。风速观测资料经过传统的数据质量控制,明显错误的数据已经被剔除。为了减少风速时间序列的噪声干扰,提高大风预警的准确率。选用以下方法对原始风速序列进行预处理和复杂性分析。

1.1 完整集合经验模态分解

EMD是一种希尔伯特-黄变换(Hibert-Huang Transform, HHT)中一种进行信号分析的方法,EMD改良而来的方法就是CEEMDAN。CEEMDAN通过自适应的添加白噪声能够有效的利用噪声特性减弱模态混叠现象,同时也剔除了噪声的影响,提高了分解效率。CEEMDAN在EMD的基础上改进 如下:

为添加噪声的次数。

2) 计算CEEMDAN的第1个余量信号:

4) 重复式(1)和式(2),得到第个余量信号和第+1阶IMF分量分别如式(4)和式(5):

5) 重复上述步骤,直到余量信号再也无法进行EMD分解为止。

记最后分解出个IMF分量。最终得到的余量信号为:

1.2 样本熵

CEEMDAN虽然能够自适应地分解时间序列。但分解出来的子分量数量众多,如果对每一个分量都建立模型进行预测。不仅大幅增加了模型复杂性和运算量。而且也忽略了各个子分量之间的相关性。如果能够把相关性高的子分量进行重组,即能够降低预测模型的复杂性,减少计算量,又更能够突出预测分量的特性。信息论中提出的熵理论就能够很好的达到以上的效果。其中运用较为广泛的就是样本熵理论。

和的取值大小虽然会影响到样本熵的取值,但是样本熵的整体趋势走向是不会改变的。样本熵的维度一般取1或2。容限一般取0.1~0.25SD,SD为时间序列的标准差。这里取为2,为0.25SD。

2 预测模型的建立

在LSTM的神经网络模型中,x为LSTM时刻的输入,h则为输出,=1,2,3,…由文献[10]可知。LSTM记忆单元的输出h由以下各式迭代得到:

其中:www分别为输入,上时刻的输出和记忆细胞到输入门的权重矩阵。www分别为输入,上一时刻的输出和记忆细胞到遗忘门的权重矩阵。www则分别为输入,上一时刻的输出和记忆细胞到输出门的权重矩阵。bbbb则分别为输入门,遗忘门,输出门还有记忆细胞的偏置量。(•)为函数。(•)为激活函数。一般取双曲正切函数tan(•)。

自然风具有波动性大,非平稳性严重的特点,因此风速序列也具有非平稳性和非线性的特点,限制了风速预测模型,为了更加准确的预测风速,提出了一种CEEMDAN-LSTM风速预测模型。先利用CEEEMDAN分解风速序列,然后利用样本熵衡量各子分量的复杂性和随机性。按照样本熵值将近似的子分量重组成趋势分量、细节分量、随机分量3个分量,分别利用LSTM建模预测。风速预测模型如图1所示。

详细建模步骤如下:

1) 将逐秒级的风速时间序列使用CEEEMDAN分解成个不同尺度的,相对平稳的固有模态函数IMF1~。

2) 分别计算各个固有模态函数的样本熵值,然后把个固有模态函数按照样本熵值相似性重组,从高到低分别重组为随机分量,细节分量和趋势分量。

3) 将随机分量,细节分量和趋势分量分别进行归一化处理,统一量纲,划分测试集和训练集。

4) 分别对各个分量的训练集和预测集建立LSTM模型进行预测,得到风速时间序列子序列。

5) 对不同时间尺度的时间序列子序列进行反归一化处理后进行叠加,得到最终的风速预测结果。

图1 基于CEEMDAN和LSTM的超短期风速预测模型

3 实验结果与讨论

3.1 数据处理

实验选用2019年高速铁路沿线某段气象监测站台风季7,8和9 3个月的风数据,为了保证泛化性,从3个月的时间序列中随机截取2 000段时间序列。每段2 400个数据。以其中一段数据为例:

原始风速数据经过CEEMDAN的自适应分解得到了11个固定模态函数,为了衡量每个模态分量的复杂性,计算每一个模态函数的样本熵值大小,其值如图2所示。

通过图2可以发现,固定模态函数IMF1~11的样本熵值从高到低依次下降,说明IMF1~11的风速时间子序列复杂性从高到低依次降低。为了验证样本熵判断风速时间序列复杂性的正确性,将IMF1~11的波形进行对比,如图3所示。通过观察可以看出IMF1~11的波动性和复杂性从上到下依次降低。

图2 模态函数样本熵值

分解的固定模态函数如果全部单独建模预测后再合成为最终结果,不仅会增大预测模型的复杂性同时也会增大时间成本,这和高速铁路沿线大风预警的高时效性要求是背道而驰的。为了在保证预测精度不变的情况下,尽量减少预测时间和模型复杂度,将分解的固定模态函数按照提前设定的阈值,将样本熵值近似的分量重构为趋势分量,细节分量和随机分量。实验中阈值取0.6和0.01来划分分量,具体重构情况如表2所示。

图3 CEEMDAN分解图

表2 CEEMDAN分量重构

重组后的3个分量如图4所示。

(a) 趋势分量;(b) 细节分量;(c) 随机分量

分析图4可以发现,重组后的3个分量各自有各自的特点:趋势分量4(a)为低样本熵值重构分量,波动性和随机性低,具有明显的趋势性,用来预测风速的变化趋势;细节分量4(b)为中样本熵值重构分量,波动性和随机性一般,用来预测风速时间序列的细节波动情况;随机分量4(c)为高样本熵值重构分量,具有高波动性和随机性,用来预测风速时间序列的随机性波动情况。以上分类情况同时也符合自然风的构成特征。

3.2 LSTM模型参数寻优

LSTM的网络超参数中最为重要的参数是Batchsize.Batchsize决定着每个批次输入LSTM的数据的大小,当Batchsize取值过小时,模型的精度会提高,但是预测时间会大幅增加;当Batchsize取值过大时,预测时间缩短,但是精度也会下降。因此为了兼顾预测时间成本和预测精度,使用网格搜索法对Batchsize进行寻优,寻优结果如图5所示。

从图5可以看出,当Batchsize逐渐增大时,时间成本逐渐下降,但是超过30后下降速度逐渐减缓,而误差却呈现一个近似于线性的增长,继续增大Batchsize弊大于利,因此当Batchsize取值为30时最为合适,可以在保持精度的情况下尽可能的减少预测时间。

图5 Batchsize参数寻优结果对比

3.3 结果分析

为了便于观察重组分量和原始时间序列预测的结果,仅截取其中一部分样本切片作图:通过图6的对比可以发现,未经处理的时间序列直接利用LSTM预测具有明显的延迟性,在波峰和波谷的预测误差较大。而经过提出方法改进过后,随机分量(a)能够紧跟变化反映时间序列的短时波动;细节分量(b)在保持了原有波动趋势的情况下,延迟性得到明显改善;趋势分量(c)则反应风速整体呈下降的变化趋势。3个分量合成的风速序列(e)兼具3个分量的特点,不仅预测误差减小,同时也减少了延迟性。

实验采用均方根误差RMSE,平均绝对误差MAE,平均绝对百分比误差MAPE来评价预测结果。公式分别为:

(a) 随机分量;(b) 细节分量;(c) 趋势分量;(d) 原始风速序列;(e) 重组风速序列

为了验证所提出的模型的优越性,分别选用未改进的模型(LSTM),BP神经网络(BP Neural Network, BPNN),支持向量机(Support Vector Machine,)这3种模型来进行对比。

各模型上下限极值处的预测结果对比如图7和图8所示。

图7 各模型风速上限极值预测对比

图8 各模型风速下限极值预测对比

分析图7可以看出:BP神经网络风速上限极值预测值偏大,容易引起误报;SVM预测值偏小,容易引起不报;LSTM虽然预测值比前两者误差较小,但仍存在延迟性;CEEMDAN-LSTM则在误差和延迟性上均优于其他模型。分析图8可得:各模型在风速下限极值的预测值均大于实际风速,但CEEMDAN-LSTM的误差与延迟性明显小于其他模型。为了更好的贴合铁路需求,按照表1把风速划分为高中低3种风速段统计误差,误差值取2 000段时间序列均值,如表4所示。

从表4可以看出各模型在高风速段的预测效果最好,中风速次之,低风速段效果最差,符合高铁大风预警系统的需求。而CEEMDAN-LSTM在各风速段均优于其他模型。从图7,8和表4中的预测结果评价对比可以看出,文章所提出的CEEMDAN-LSTM模型各项指标均优于其他模型,与其他模型相比,CEEMDAN-LSTM预测模型的预测误差更小,同时预测的延迟性得到降低,说明CEEMDAN-LSTM模型能够更加准确的预测出风速的波动性和非线性非平稳的变化,性能更加优越,在高速铁路沿线大风预警中能够发挥良好的适用性。

表4 模型预测结果对比

4 结论

1) 文中提出的CEEMDAN分解时间序列并利用样本熵近似值重组为趋势、细节、随机三分量的方法可以有效减少预测模型的复杂度与延迟性。

2) 在对比实验中,文章所提出的方法在高、中、低3个风速段RMSE,MAE和MAPE误差相较于其他模型都得到了减少,其中高风速预测效果最好,中风速次之,低风速最差。整体具有更高的预测精度,有效减少大风预警误报或不报的几率。

3) 在研究中发现,LSTM模型对趋势分量拟合效果误差较大,进一步的研究中可以考虑加入多要素(气压、湿度、温度)和风速的空间特性。

[1] 刘荣, 姚松, 许娇娥. 侧风下高速列车临界倾覆风速研究[J]. 铁道科学与工程学报, 2019, 16(11): 2643−2650. LIU Rong, YAO Song, XU Jiaoe. Research on critical overturning wind speed of high-speed trains under crosswinds[J]. Journal of Railway Science and Engineering, 2019, 16(11): 2643−2650.

[2] Alexander Samalot, Marina Astitha, Jaemo Yang, et al. Combined Kalman filter and universal kriging to improve storm wind speed predictions for the northeastern united states[J]. Weather and Forecasting,2019, 34(3): 587−601.

[3] Carlos D Zuluaga, Mauricio A Álvarez, Eduardo Giraldo. Short-term wind speed prediction based on robust Kalman filtering: An experimental comparison[J]. Applied Energy, 2015, 156: 321−330.

[4] CHEN Kuilin, YU Jie. Short-term wind speed prediction using an unscented Kalman filter based state-space support vector regression approach[J]. Applied Energy, 2014, 113: 690−705.

[5] LIU M, CAO Z, ZHANG J, et al. Short-term wind speed forecasting based on the Jaya-SVM model[J]. International Journal of Electrical Power & Energy Systems, 2020, 121: 106056.

[6] DANG X J, CHEN H Y, JIN X M. A method for forecasting short-term wind speed based on EMD and SVM[J]. Applied Mechanics & Materials, 2013, 392: 622−627.

[7] Natarajan Y J, Nachimuthu D S. New SVM kernel soft computing models for wind speed prediction in renewable energy applications[J]. Soft Computing, 2019(3): 1−18.

[8] L Yang, Y Zhengling, Z Ze, et al. Improvement of spatial correlation wind speed prediction based on variable coefficient model[J]. Guangdong Electric Power, 2017, 151: 737−752.

[9] 孙呈欣. 铁路综合防灾安全监测预警系统研究与实现[D]. 兰州: 兰州交通大学, 2014. SUN Chengxin. Research and implementation of railway comprehensive disaster prevention safety monitoring and early warning system[D]. Lanzhou: Lanzhou Jiaotong University, 2014.

[10] Hochreiter S, Schmidhuber J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735−1780.

Research on prediction technology of high wind along high-speed railway

JIN Tongyu1, YE Xiaoling1, 2, XIONG Xiong1, GONG Cancan1, YAO Jinsong1

(1. School of Automation, Nanjing University of Information Science and Technology, Nanjing 210044, China;2. Collaborative Innovation Center on Forecast and Evaluation of Meteorological Disasters, Nanjing University of Information Science and Technology, Nanjing 210044, China)

Wind speed prediction is a key technology for early warning of wind-induced disasters. Aiming at the problems of delay and false positives in high-speed rail gale warning, a combined prediction model based on complete ensemble empirical mode decomposition with adaptive noise (CEEMDAN) and longshort-term memory neural network (LSTM) was proposed to predict the wind speed along the high-speed railway. In order to reduce the complexity of the prediction model and improve the prediction accuracy of the model, the original wind speed data was decomposed with CEEMDAN and the decomposed components were reconstructed into three components of trend, detail and randomness according to the sample entropy approximation by using the sample entropy (SE) theory. Then the long short-term memory neural network was used to establish the prediction model. Taking a piece of meteorological data of wind speed along a high-speed railway as an example, the experimental results show that, compared with other prediction methods, this method can effectively reduce the prediction delay and improve the prediction accuracy, accurately track the fluctuation of wind speed and nonlinear and non-stationary changes, and the performance is more superior. It can play good applicability in the gale warning along the high-speed railway and reduce the occurrence of false alarm or non-reporting of gale warning.

railway gale forecast; sample entropy; complete ensemble empirical mode decomposition with adaptive noise; longshort-term memory neural network (long short-term memory neural network)

P425.6+2

A

1672 − 7029(2021)03 − 0615 − 08

10.19713/j.cnki.43−1423/u.T20200435

2020−05−02

高铁气象图谱与列车运行气象辅助技术研究(N2019T003);高铁气象定制化监测分析技术与行车安全辅助保障系统研究(2019041);江苏省高校自然科学研究面上项目(19KJB170004)

叶小岭(1964−),女,河南封丘人,教授,从事气象信息集成与分析研究;E−mail:xyz.nim@163.com

(编辑 蒋学东)

猜你喜欢
大风分量风速
1960—2021年商丘风速风向时空变化分析
高速铁路风速监测异常数据判识方法研究
大风之夜(组诗)
画里有话
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
论《哈姆雷特》中良心的分量
2006—2016年平凉市风速变化特征分析
看不见的大风(外一首)
大风