基于EMD-LSTM模型的台区负荷短期预测方法

2022-03-23 06:41王荣茂于海洋杨宏宇
实验室研究与探索 2022年1期
关键词:精确度台区分量

王荣茂, 谢 宁, 于海洋, 禹 加, 蒋 蕾, 杨宏宇

(1.国网辽宁省电力有限公司,沈阳 110006;2.上海交通大学电子信息与电气工程学院,上海 200240;3.上海博英信息科技有限公司,上海 200241)

0 引 言

由于电能难以大量存储以及电力需求时刻变化,电力系统发电与负荷的变化难以实现动态平衡。电力系统的经济稳定运行要求以最少的能源消耗和运行成本保证供电的可靠性和用户的满意度。精确的台区负荷预测有利于经济调度和提高电力系统自动化水平。按照预测时间的长短,台区负荷预测可分为超短期负荷预测(1 h以内)、短期负荷预测(以d、w为单位)、中期负荷预测(以m、a为单位)和长期负荷预测(10 a以上)[1]。其中,台区负荷短期预测对电网调度人员合理安排开、停机计划以及制定机组最优组合的影响尤为显著。提高台区负荷短期预测的精确度对电网安全稳定运行十分重要。

短期台区负荷是综合考虑气象因素、增容策略、节假日以及地理位置等影响因素,构建合理的数学模型,预测下一天整个供电台区的用电量。为充分分析负荷周期性增长和负荷爬坡的规律,近年来,国内外已有不少学者对台区负荷短期预测技术进行了研究。台区负荷预测的方法也从原本的常规技术[2]和统计学方法[3-4]发展到以机器学习算法(如神经网络[5-6],支持向量机[7-8])和概率图模型[9-10]为主的方法。依托智能电表和远程终端提供的海量数据,机器学习算法是目前电力负荷预测的主流。直接采用人工智能算法学习负荷的波动规律,会因为数据存在噪声、模型陷入局部最优等问题在精确度和鲁棒性上得不到保证[11]。

为提高基于机器学习算法的负荷预测的精确度和鲁棒性,部分文献从提高数据样本质量出发,采用非监督学习算法将负荷数据按照用电习惯聚类,作为预测模型的前驱[12];有些研究从优化预测算法出发,提出具有更精确预测非线性时序序列的方法[13-14];也有文献从负荷的影响因素出发,将地理因素、温度热累积效应和湿度累积效应等考虑进预测模型中[15-16]。台区负荷包含多种类型的负荷分量,不同负荷分量的主要影响因素存在差异。例如:居民负荷的波动主要来源于空调负荷,因此很大程度上受到温度、湿度这类与人体舒适度有关的因素影响;工业、政府机构以及商场负荷主要受到日类型(工作日、节假日)影响等等。大多数机器学习模型通过建立统一的模型预测台区负荷,缺少物理层面上的逻辑拟合,导致模型往往缺乏可解释性。并且,随着智能电网的不断发展,台区负荷的构成愈发复杂,亟需一种针对台区负荷多样性的短期预测方法。

为解决上述问题,本文采用先将台区负荷进行经验模态分解(empirical mode decomposition,EMD),再配合长短记忆神经网络(Long short-term memory,LSTM)算法的预测策略。首先采用EMD方法将原始负荷分解为多个负荷分量,每个分量独立代表一类负荷;生成尽可能大的负荷预测模型特征集,依据相关性分析自适应的为每类负荷选择对应的特征子集,作为LSTM的输入。用EMD从逻辑层面分解负荷,以相关性分析完成模型的特征工程,最后结合LSTM算法学习各类负荷在时序上的波动规律。实验结果表明,预测方法相较于现有台区负荷预测模型,不仅具有良好的可解释性,且具有较高的精确度和计算效率。

1 基于EMD-LSTM的台区负荷短期预测模型

在特征工程中,与预测目标相关性较低的特征被称为冗余特征,带入冗余特征的预测模型不仅在精确度上难以提高,并且计算效率会因为数据维度增加而降低。基于这一理念,首先将台区负荷数据进行频域分解,获得具有不同波动规律的负荷分量。常见的频域变换方法有两种,一种是小波变换(wavelet transform,WT),另一种是经验模态分解。小波变换虽然具有表征时频两域信号局部特征的能力,但需要人为设定小波基和分解尺度这些超参数,因此不适用于自适应匹配特征子集的场景。EMD方法由Huang教授提出[17],其显著贡献在于克服了基函数无自适应性的问题。对于一段未知序列,EMD无需做预先的分析与研究即可直接分解,免去了不必要的人为设置和干预。对于构成复杂且变化多样的台区负荷,EMD能够将非平稳序列转化为多个不同频率相对平稳的数据,这对于充分挖掘台区负荷与影响因素间的非线性关系具有极大的辅助作用。

LSTM是Sepp Hochreiter设计的一种循环神经网络的改进结构[18],可以很好地解决以往神经网络在预测时间序列时出现的梯度消失和梯度爆炸等问题。LSTM改进了普通循环网络的隐藏层单元,改进后的网络隐藏层由多个LSMT单元构成,单个LSTM单元的结构如图1所示。

图1 LSTM结构

LSTM单元中的输入、输出节点均通过具有非线性的激活函数的阀门压缩控制。

LSTM单元在t时刻的状态:

式中:ut为自循环状态;ct为候选状态;ft为输入节点上遗忘门输出;ht-1为隐层层上一时刻的状态。

式中:σ为自循环函数;g为遗忘函数;W、R、b分别为网络的输入权重、循环权重以及网络偏置。LSTM单元在t时刻的输出:

式中:g2(ht)为输出节点上遗忘门的输出;ot=σ(Woxt+Royt-1+bo)为输出阀门的输出。通过在循环神经网络单元上加入阀门,LSTM能够判断模型网络的记忆态(之前网络的状态)在该层输出的结果是否达到阈值,来决定是否将以往信息加入到当前该层的计算中。时间序列的长期依赖关系经过阀门控制后得以保存,这种决定历史信息遗忘保留结构被证明是高效而科学的[19]。

综上,本文首先通过EMD算法将负荷序列分解为多个分量,再利用特征工程选择每一个分量对应的特征子集,以特征子集和负荷分量历史数据为LSTM模型的输入,对分量负荷分别进行预测,最终叠加各分量得到预测结果。构建台区负荷短期预测方案如图2所示。

图2 基于EMD-LSTM模型的台区负荷短期预测方案

2 电力负荷的EMD分解

与傅里叶变换和小波变换不同,EMD分解过程是一个有限次滤波过程,无须预先设定任何基函数,是一种自适应分解方法[20]。使用EMD分解将含有多个波动分量的负荷分解为多个频率的固有模态函数(intrinsic mode function,IMF)。每个IMF都需要满足以下2个条件。

(1)各IMF分量的跨零点个数必须与波峰波谷个数之和最多相差1。

(2)各IMF分量的极大值包络线与极小值包络线之和的平均值为0。

分解得到的IMF分量与原始负荷数据相比,具有更好的平稳性和更有规律的波动特性。因此,以各个IMF为预测目标减小了模型受到数据噪声而发生梯度爆炸的可能。采用EMD分解台区负荷的主要计算步骤如下:

步骤1 找出原始台区负荷数据l(t)中所有局部极大值和极小值点,依据各个极值点利用样条插值法构造出台区负荷数据的上、下包络线,原始台区负荷数据被上下包络线所包络。

步骤2 求出上、下包络线的均值曲线m1(t),再用原始数据l(t)减去均值曲线得到新的序列,即

步骤3 判断N1(t)是否满足IMF的两个条件,如果满足,将N1(t)从原始台区负荷序列中分离,剩余的信号为残差分量,即

N1(t)如果不满足要求,将N1(t)作为新的信号,重复步骤1~2,直到得到的第1个满足条件的N1(t)。

步骤4 检查r1(t)是否为单调函数,若不是,则将r1(t)作为新的信号回到步骤1。

步骤5 不断重复筛选步骤,得到最后的残余分量,即

若残余分量rm(t)为单调函数,则EMD分解完成。原始信号l(t)可由m个IMF和rm(t)表示:

以江苏省某地市台区负荷为例,将台区负荷进行EMD分解的结果如图3所示。

图3 基于EMD算法的台区负荷分解

经验模态分解的自适应特性灵活的分解能力使其在处理具有随波二象性的时间序列上具有明显的优势。

3 基于LSTM网络的本征模函数预测

3.1 特征相关性分析

学习或训练LSTM模型的过程是为了从数据集中学得匹配的“假设”更加逼近数据潜在的规律。数据驱动理念中,负荷预测过程并非算法至上,数据的质量以及特征选择决定了监督学习模型的上限。如果特征选择不当,使用再好的模型也无法突破特征工程决定的上限。下面将介绍本文在特征工程以及数据处理方面采用的方法。

为从各维度找出台区短期负荷的影响因素,本文采用Pearson相关系数分析法分析各潜在影响因素与负荷的关系:

式中:ρX,Y为2个变量的相关系数;cov(X,Y)为2个变量间的协方差;σX、σY分别为2个变量的标准差。Pearson相关系数的取值范围为-1~1之间,如果2个变量升降一致,则Pearson系数为正,如果2个变量升降相反,Pearson系数为负。Pearson系数的数学特征是不随变量的位置或大小的变化而变化,它消除了2个变量变化幅度的影响,而只是单纯反应2个变量每单位变化时的相似程度。Pearson系数的绝对值越大,则2个变量间的相关程度越高。

短期台区负荷的一个特点是:明显受到各种环境因素的影响,如季节更替、天气突然变化。台区负荷由于用电性质不同,还可能受到日类型(节假日、工作日),需求侧响应策略(电价调控)等因素影响,这些因素都会直接或间接影响台区负荷序列。本文采取的特征选择策略是首先挑选出一个足够大的特征向量,确保预测模型过配,在此基础上,依据每一个IMF挑选出特征向量的子集作为LSTM的输入。需要说明的是虽然短期台区负荷的数据采集频率为15/min,但一些特征的频率是以天为单位的(如最高、最低温度、日类型等)。针对这些特征,采取宏观上分析每个特征与日均负荷序列lave(t)的相关性的方式进行特征选择。选取跨度为1年的台区负荷(日均值)序列,负荷向量的表达式如下。

通过式(8)求得特征向量以及它们与台区负荷序列的Pearson相关系数见表1。

表1 各影响因素与台区负荷相关性分析

表1中,Pearson相关系数越接近1,代表影响因素与台区负荷升降一致性越高。日电价一栏中的Pearson数为小于0,代表日电价与台区负荷呈接近负相关的关系。

3.2 基于LSTM的本征模函数预测

使用深度神经网络进行本征模函数预测主要可以分为如下几个步骤:

步骤1 从特征集合中提取本征模函数的特征。

步骤2 定义网络超参数,例如网络层数、每层隐藏层神经元个数。

步骤3 将特征输入模型,经过前向传播和反向传播完成模型的训练。

步骤4 利用训练好的模型对本征模函数进行预测。

特征提取采用上1节提出的相关性分析法,除前一天本征模函数值外,在剩余7个特征中选择相关系数排名前5的特征作为模型的输入,防止模型的过拟合和冗余特征导致预测精确度的下降。

深度神经网络是由多个单层非线性网络叠加而成,理论证明,2层神经网络可以无限逼近任意连续函数。也就是说,面对复杂的非线性分类任务,2层(带1个隐藏层)神经网络可以分类得很好。网络每层隐藏层LSTM单元个数依据训练样本的大小决定,为保证模型的泛化能力,一般网络连接权数为训练样本数的1/3~1/10。最终构建的LSTM本征模函数结构如图4所示。

图4 基于LSTM的本征模函数预测模型

4 算例分析

为验证本文提出的考虑台区负荷构成多样性的EMD-LSTM台区短期负荷预测模型,使用某地区10 kV配变台区每15 min采集一次的实际负荷数据、地区气象数据以及电价数据对模型的精确度进行测试。采用未经过经验模态分解的LSTM网络、循环神经网络(Recurrent neural network,RNN)以及普通前馈神经网络(Feedforward neural network,FNN)这3种深度学习算法作为参照。采用均方根误差(root mean square error,RMSE)作为衡量精确度的标准。

式中:yp为台区负荷预测值;yt为台区负荷真实值;Nd为预测序列的长度,在本文中取值为96。负荷预测算法的精确度

实验中构建深度学习模型的平台是Python第3方神经网络库PyBrain。历史数据的时间跨度为2018年6月6~2019年6月,将预处理后的历史数据分为训练集(90%)和测试集(10%)。使用EMD算法对整个负荷序列进行分解后,各深度学习模型通过训练后完成台区负荷的日前预测。

选择重载、中载和轻载的典型台区,利用不同模型预测这些供电台区在2019年6月30日的负荷,各预测曲线和实际负荷曲线如图5(a)~(c)所示。

图5 不同深度学习模型台区短期负荷预测结果

由图中预测曲线与实际曲线的贴近性可见,本文提出的方法较目前各主流深度学习模型具有较高的预测精确度。其中轻载配变由于波动率较高,各深度学习模型的预测误差在预测轻载配变时的误差均比重载、中载配变负荷的预测误差要大。以各供电台区短期负荷预测测试集的误差平均值衡量各模型的预测精确度,EMD-LSTM的预测精确度为90.72%,普通LSTM的预测精确度为86.38%,RNN的预测精确度为84.17%,FNN的预测精确度为83.95%,实验结果证明了,本文提出的方法可以更好的拟合负荷曲线。

神经网络的训练时间是衡量模型实用性的重要标准之一,本文统计了不同深度学习模型在台区负荷预测时训练单个网络所花的时间,结果见表2。

表2 不同算法单个模型平均训练时间

表2表明,将台区负荷分解为IMF分别预测,由于各IMF预测模型的特征维度减小,单个模型的训练时间较普通LSTM要小很多。

5 结 语

随着分布式电源、储能装置等各类终端在配电网的渗透率不断提高,台区负荷的构成愈发复杂,与天气情况等影响因素的耦合度也越来越高。为避免构建统一台区短期负荷预测模型带来的特征冗余和过拟合,利用EMD算法将台区负荷分解为多个本征模函数,以相关系数作为特征选择的基准,将LSTM网络用于预测各本征模函数。通过实验分析,EMD-LSTM短期台区负荷预测方案相较于FNN、RNN和LSTM算法优势如下:

(1)将台区负荷分解为多个波动频率的分量,对每个分量分别进行特征选择,避免了特征冗余带来的训练速度降低和精确度下降。

(2)使用2层LSTM网络对各负荷分量分别预测,减少单一特征出现噪声或剧烈波动对预测结果带来的影响,提高模型的泛化能力。

(3)EMD-LSTM预测技术既具有一定的可解释性,又符合数据驱动的理念,在台区短期负荷预测方面,与传统的深度学习算法相比具有更好的表现。

猜你喜欢
精确度台区分量
配电台区变-户拓扑关系异常辨识方法
“硬核”定位系统入驻兖矿集团,精确度以厘米计算
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
论《哈姆雷特》中良心的分量
放缩法在递推数列中的再探究
降低台区实时线损整治工作方法
10kV变压器台区设计安装技术研究
基于用电信息采集系统的台区线损管理研究
基于FFT的航空发动机整机振动分量实时跟踪监视