基于EWT-CNN-BiGRU 的多特征电力负荷预测模型

2024-03-18 05:13孙梦觉邓安明周植高
科技创新与应用 2024年7期
关键词:步长卷积神经网络

保 富,孙梦觉,邓安明,周植高

(1.云南电网有限责任公司信息中心,昆明 650000;2.云南云电同方科技有限公司,昆明 650000)

随着电力市场进一步改革,电力行业成为了实现“双碳”目标的关键领域,而电力负荷作为时序数据的观测目标,在各个时间单位对所有对应的特征状态值都有详细记录,通过分析不同特征变量与电力负荷数据之间的内在联系,可实现对电力负荷的预测,这对电力系统的有效运行、合理调度及可持续发展都具有重要意义[1]。

针对电力负荷的传统时间序列预测模型主要围绕基于统计学的方法展开[2],例如贝叶斯算法、自回归移动平均模型、马尔可夫链等。基于统计的预测算法具有模型构造简单、运算速度较快的特点,但对于非线性及不稳定的历史数据,该类型方法存在无法实现较高预测精度的问题。随着计算机算力的逐步提升,基于机器学习的时序数据预测模型逐步发展并得到了普遍应用。基于机器学习的预测模型需要投入大量的数据对模型进行训练学习,且目前尚未提出一套针对优化神经网络泛化性的建模标准与参数调整理论,但神经网络可通过增加训练数据量来提升预测精度,深度挖掘各类样本特征之间的潜在关系,对提取线性与非线性数据的特征具有较优能力。近年来,研究人员将数据预处理与预测模型相结合,或将多个预测模型进行组合融合,进一步实现了对时序数据预测精度的提升。

卷积神经网络(Convolutional Neural Networks,CNN)对于捕获多维数据中的潜在特征具有优秀的能力,可有效解决原始时序数据带来的不确定性问题,据此,Wang 等[3]提出了用于实现风力发电预测的CNN 模型;Hong 等[4]使用了CNN 径向基函数神经网络(Radial Basis Function Neural Network,RBFNN)混合模型对时序风电数据实现了预测;文献[5]将CNN 与长短期神经(Long Short-Term Memory,LSTM)网络进行融合,实现了对短期电价的预测;文献[6]提出了一种基于LSTM 结合极限梯度提升(XGBoost)的短期电力负荷预测方法。为进一步实现对原始数据的深层次挖掘,研究人员对投入神经网络进行训练的原始时序数据进行处理与分析;文献[7]利用小波分解(Wavelet Decomposition,WD)将风速原始数据分解为若干个平稳的子序列,再通过自回归滑动平均(Auto-Regressive Moving Average,ARMA)模型实现对风速的预测,该模型降低了对单一变量的预测难度;Xiong 等[8]基于经验模态分解和支持向量回归(SVR)理论,提出了针对电力需求的预测框架;文献[9]提出了基于变分模态分解(Variational Mode Decomposition,VMD)结合CNN 融合门控循环单元(Gated Recurrent Unit,GRU)的混合模型,提高了对时序风电短期预测的准确率;张未等[10]针对短期电力负荷提出了一种基于VMD-LSTM 神经网络结合轻量级梯度提升机(Light Gradient Boosting Machine,LightGBM)的预测模型;文献[11]通过优化基于鲸鱼算法的注意力机制结合双向门控循环单元的混合策略,提出了一种短期电力预测模型。

1 理论基础

1.1 经验小波变换

经验小波变换(Empirical Wavelet Transform,EWT)是一种用于非平稳信号分析的自适应信号分解方法[12]。该方法解决了小波分解导致结果中出现与输入信号无关的滤波组现象,同时与经验模态分解(Empirical Mode Decomposition,EMD)相比,EWT 方法解决了由于时域信号不连续导致的模态混叠现象,可剔除无关的信号特征,实现更具有一致性的信号分解。以一组离散的正弦波信号为例,其仿真信号的表示形式如式(1)

式中:x(n)为输入信号的离散形式;Ah为振幅;fh为组成输入信号的频率;φh为初始相位角;H为输入信号波中不同频率成分的数量,其取值范围在[0,π]之间,根据傅里叶级数,可将公式(1)表示如下

在此基础上,可将EWT 分解模式视作一组包含了H个频谱滤波器的滤波器组,该滤波器组包含了1 个低通滤波器(Lowpass Filter,LPF)及(H-1)个带通滤波器(Bandpass Filter,BPF)。EWT 的分解方法如下。

首先将输入的离散信号进行傅里叶变换(Fourier Transform,FT),即

式中:ω为频率;X(jω)为经傅里叶变换的输入信号,其输出结果范围在[0,π]之间。在输出信号ωmax=[ω1,ω2,…,ωi,…,ωH]中标记局部频率最大值ωH,根据信号集[ω1,ω2,…,ωi,…,ωH]获取对应的滤波带宽,即Δ=[Δ1,Δ2,…,Δi,…,ΔH-1],其中。

其次,通过经验尺度函数ϕ1(ω)与经验小波函数ψi(ω)实现(H-1)个带通滤波器的自适应性质,其中经验尺度函数ϕ1(ω)的计算公式如式(4)所示

经验小波函数ψi(ω)的计算方式如公式(5)所示

式中:γ为常量系数;β(γ,ω,Δi)为变换函数,其表达式如式(6)所示

根据式(4)与式(5)生成自适应滤波器边界值,即

最后,对式(7)的输出结果进行傅里叶逆变换(Inverse Fourier Transform,IFT),得出时域小波近似系数与细节系数,即

式中:x1(n)为小波近似系数,即低通滤波器的输出结果;xi(n)为小波细节系数,即带通滤波器的输出结果。

1.2 卷积神经网络

卷积神经网络(Convolutional Neural Network,CNN)实现了权重共享的概念,无论在执行分类任务还是回归任务中都有较出色的表现。CNN 通过卷积运算从不同邻域内提取数据的局部优势,从而深度挖掘数据特征以实现目标预测[13]。CNN 模型主要由输入层、隐藏层及输出层组成,其中隐藏层又包含了卷积层、池化层、全连接层。

卷积层作为CNN 的核心单元,具有提取关键特征及缩减模型以便提高计算速度的功能,是决定预测结果精确度的关键所在。其具体计算公式如式(9)所示

式中:Cj为第j层卷积输出结果;At为卷积层的输入;⊗为卷积符号;ReLu 为激活函数;wi为权重矩阵;bi为偏置矩阵。

池化层则可为卷积运算压缩数据,并剔除不必要的信息,本文在CNN 中使用了最大池化算子。全链接层则将卷积运算中提取的特征进行整合,以便获取最终的预测结果。

1.3 门控循环单元

门控循环单元(Gated Recurrent Unit,GRU)神经网络与长短期记忆神经(LSTM)网络在处理时间序列任务上都有良好的表现,但相较于LSTM,GRU 单元具有更简单的结构,同时,在收敛速度、参数更新和泛化方面都具有较优的表现,能有效捕捉时序数据之间的依赖关系,因此,本文采用GRU 作为对电力负荷实行预测的神经网络方法[14]。

GRU 的核心结构由2 部分组成:重置门(Reset gate,Rt)与更新门(Update Gate,Zt),其中,重置门Rt用于控制当前时刻t输入的信息保留量,重置门被允许丢弃与预测结果无关的信息,当Rt趋近于0 时,t时刻之前的隐藏信息将被丢弃,保留t时刻对应信息,反之,当Rt趋近于1 时,该神经网络单元将把过去的信息视作有用信息。

更新门Zt用于控制过去时刻的信息保留量,当Zt接近于0 时,代表对过去的信息遗忘得越多,当Zt趋近于1 时,代表对于过去的信息记忆得越多[15]。GRU 的网络结构如图1 所示。

图1 GRU 结构图

GRU 模型的计算过程如公式(10)、(11)、(12)与(13)所示

式中:σ 为Sigmoid 激活函数;W和U为线性变换的权重;xt为当前时刻t的输入;⊙为内积符号;tanh 为双曲正切函数;ht-1和ht分别对应t-1 时刻和t时刻的隐藏层状态。

1.4 双向门控循环单元

由于发电负荷数据具有较强时序性,在模型训练过程中,时刻t-1 所对应的数据与时刻t+1 所对应的数据都将对时刻t的预测结果产生较大影响。为进一步提高本文针对电力负荷预测模型的准确性,本文在预测模型中运用双向门控循环单元(Bidirectional Gated Recurrent Units,BiGRU)。BiGRU 将传统的GRU 神经元划分为正向传输状态与反向传输状态,分别通过向前计算组件与向后计算组件计算实现,二者分别对应根据历史数据更新隐藏状态和根据未来数据更新状态的功能,其计算公式如(14)、(15)、(16)所示

2 EWT-CNN-BiGRU 的预测架构

本文为优化电力负荷预测结果,提出了基于EWT-CNN-BiGRU 的混合预测模型,其预测流程如图2 所示。

图2 EWT-CNN-BiGRU 预测模型流程图

本文模型实现预测的具体流程如下。

步骤1,准备数据集。本文采用的预测模型其实质为数据驱动的监督学习模型,通过最小化损失函数达到尽可能准确的预测结果。增加投入训练的历史数据数量可进一步优化预测结果的精确率,本文设定训练集与测试集的比率为8∶2。

步骤2,关键特征选择。通过计算皮尔逊相关系数、距离相关系数或互信息熵,可实现对强关联性时序特征的筛选。

步骤3,EWT 分解。根据EWT 对关键特征进行分解变换,获得m 组子序列,作为本文预测模型的特征变量。

步骤4,CNN-BiGRU 预测。使用CNN-BiGRU 模型对m 组子序列与关键特征原始数据进行训练学习,形成预测模型,获取最终预测结果。

3 实验详情

本节分别从数据集介绍、模型评价指标、模型参数设定、预测模型实现及结果分析5 个方面进行分析与阐述。

3.1 数据集介绍

本文使用的数据集来自于德国某联合循环电厂(Combined Cycle Power Plant,CCPP)[16],该电厂被设定为满负荷工作。该数据集包含了9 568 条时间序列数据样本,时间间隔为1 h,含有平均温度(Average Temperature,AT)、环境平均压力(Average Pressure,AP)、相对湿度(Relative Humidity,RH)和真空效果(Vacuum,V)4 个特征,待预测的目标变量为满负荷电力输出(PE)。

3.2 模型评价指标

为了评价本文所使用的预测模型的准确性,本文采用了均方根误差(Root Mean Square Error,RMSE)、平均绝对误差(Mean Absolute Error,MAE)、绝对百分比误差(Mean Absolute Percentage Error,MAPE)及拟合优度(Goodness of Fit,R2)4 个指标对本工作任务进行评估。

3.3 模型参数设定

本小节内容将对本文模型中使用的特征选择、数据清洗及时间步长参数设定进行介绍说明。

3.3.1 特征选择

本文使用皮尔逊相关系数对数据集中与预测目标具有强相关性的特征进行选择。

在本文使用的数据集中含有4 个特征:平均温度(AT)、环境平均压力(AP)、相对湿度(RH)和真空效果(V)。通过计算该四维特征与电力负荷(PE)数据的皮尔逊相关性系数,得到了四维特征与预测目标的关系热图,如图3 所示。该热图的颜色越深,则代表2 个变量的相关性越强,反之代表二者的相关性较弱。通过图3 可知,环境平均压力特征与电力负荷输出的相关性系数为0.52,为与预测目标相关性系数的最大值,因此,环境平均压力特征变量被选择作为模型的输入参数。

图3 皮尔逊系数相关性热力图

3.3.2 数据清洗

本文使用的实验数据来自于循环电厂所收集的样本,为排除数据集中的异常样本对预测模型产生的负面影响,对投入训练的数据进行数据清洗。

3.3.3 时间步长参数设定

根据实验,时间步长参量数值对预测模型的效果具有直接影响,若时间步长太短,会导致EWT 分解效果不佳,预测模型参数数量过多,输入变量的特征无法被模型完全学习,相反,时间步长过长会导致预测结果精度不够的现象。本文时序数据的原始采集频率为1 h,即默认时间步长为1 h,为测试不同时间步长对EWT分解效果与预测结果精度的影响,本文设定了不同时间步长的滑动时间窗口,滑动步长为1,分别为1 h、2 h、4 h、5 h 和6 h 五种参数设置进行了实验,通过综合考虑EWT 分解效果与预测精度,本文选定时间步长参数为2,以此展开后续实验。

3.4 预测模型实现

本小节内容将以CCPP 数据集为例,对本文预测模型的实现进行详细介绍。

3.4.1 EWT 分解

通过3.3.1 小节中的特征选择,将环境平均压力特征变量作为EWT 分解的对象。EWT 需尽可能分离更多数量子序列为CNN-BiGRU 提供更多特征,同时需确保子序列之间的模态差异性。通过测试确定当CCPP 的环境平均压力变量分解为4 组子序列时,能满足上述要求。分解的原始数据和子序列如图4 所示,可见该4 组子序列都保留了原始特征变量的波动特性,同时未出现模态混叠的现象。其中,子序列1 反映了原始特征变量的变化趋势,可见该子序列的波动频率较平稳;而子序列4 反映了局部波动趋势,可见该子序列的波动频率较大。

图4 EWT 分解结果

3.4.2 CNN-BiGRU

多层CNN-BiGRU 网络可以更深层次挖掘目标变量特征,有助于提高预测的精度,但过于复杂的结构可能会带来过拟合现象的产生,因此,模型结构与参数选择对降低预测结果误差具有重要影响作用。

本文分别对2×CNN-1×BiGRU、3×CNN-2×BiGRU、4×CNN-3×BiGRU 及5×CNN-4×BiGRU 4 种不同的多层网络结构进行了实验,实验结果见表1,通过对比实验,可确定针对该数据集的最优神经网络结构为2*CNN-1*BiGRU。该结构神经网络的其他参数设定为:逐步衰减学习率,SDG 优化器,步长为50,迭代次数为120。

表1 不同参数的多层CNN-BiGRU 预测模型结果比较

3.5 结果分析

为证明针对短期电力负荷预测所使用的CNNBiGRU 模型性能,本文使用LSTM、CNN-LSTM 与CNN-GRU 3 种神经网络预测模型与CNN-BiGRU 预测模型使用相同数据样本进行了对比实验,实验结果如图5 所示,其对应的4 个误差指标结果,即RMSE、MAE、MAPE及R2见表2。

表2 不同模型的预测结果

图5 不同电力负荷预测方法的结果对比

在CCPP 电力负荷数据集下,LSTM、CNN-LSTM、CNN-GRU 和CNN-BiGRU 的MAPE分别为1.016%、1.105%、0.270%和0.130%,故上述4 种预测模型的预测结果都存在一定误差,但CNN-BiGRU 预测模型较为稳定,其误差率相较于其他3 种方法较低,说明本文模型能在目前已有的预测模型上继续提升精度,在电力预测上具有较好的表现。

4 结束语

本文针对电力负荷提出了一种基于经验小波变换的卷积神经网络融合双向门控循环单元预测模型。该模型通过皮尔逊系数提取关键特征,对关键特征进行经验小波分解,并通过卷积神经融合双向门控循环单元网络对分解的子序列与原始数据进行训练,以获取最终的预测结果。通过使用德国某联合循环电厂采集的数据对本文模型进行了实验,实验结果表明,本文提出的模型具有较高的预测精度。

猜你喜欢
步长卷积神经网络
基于Armijo搜索步长的BFGS与DFP拟牛顿法的比较研究
基于3D-Winograd的快速卷积算法设计及FPGA实现
神经网络抑制无线通信干扰探究
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于逐维改进的自适应步长布谷鸟搜索算法
基于支持向量机回归和RBF神经网络的PID整定
一种新型光伏系统MPPT变步长滞环比较P&O法