基于极点对称模态分解-分散熵和改进乌鸦搜索算法-核极限学习机的短期负荷区间预测

2020-09-04 03:39岳有军刘英翰王红君
科学技术与工程 2020年22期
关键词:分量区间负荷

岳有军,刘英翰,赵 辉,2,王红君

(1.天津理工大学天津市复杂系统控制理论与应用重点实验室,天津 300384;2.天津农学院工程技术学院,天津 300384)

电力负荷预测在现代电力系统经济安全运行中发挥着重要作用,精准的负荷预测有利于电力企业制定合理的发电、调度、维护等计划,能为电力企业带来巨大效益[1]。

为此,国内外学者做了大量研究。目前短期负荷预测常用方法主要有以多元线性回归(MLR)、自回归移动平均(ARMA)为代表的统计学方法及以支持向量机(SVM)和人工神经网络(ANN)为代表的人工智能方法[2]。然而,上述方法仅能获得确定性点预测结果,由于实际预测过程中存在众多不确定因素,点预测会存在不同程度误差,难以反映电力需求的不确定性,给决策工作带来一定困难[3]。为此,负荷区间预测逐渐得到了重视。相比于点预测,区间预测可通过构建一定置信水平下的预测区间来描述未来负荷的变化范围,更有利于电力企业做出合理决策,因此负荷区间预测具有重要的研究意义。目前常见的区间预测方法主要有Delta法、贝叶斯法、Bootstrap法[4]等。通过上述方法虽能得到一定置信水平下的预测区间,但这些方法普遍存在实施困难、计算量大、预测区间可靠性差等问题,从而限制了负荷区间预测的进一步发展。

因此,为克服上述问题,区间预测上下限估计法(lower upper bound estimation,LUBE)[5]逐渐成为了当前的研究热点,该方法利用神经网络双输出结构,通过优化区间评价函数,直接获取预测区间上下限。能够降低区间预测计算复杂度且无需假设误差分布,在区间预测领域取得了不错的成果,但是目前在负荷区间预测问题中研究较少,且已有研究大多存在一定的不足。文献[6-7]利用基于神经网络的LUBE模型进行负荷区间预测,并采用PSO算法优化区间评价函数,得到了较高质量的预测区间。但传统神经网络训练时间过长且PSO算法易陷入局部最优。为此,文献[8]利用模拟退火算法(SA)代替PSO算法对该模型进行优化,虽提高了负荷预测区间质量,但仍存在模型训练时间过长的问题。文献[9]提出基于PSO优化核极限学习机(KELM)的LUBE区间预测模型,该模型以KELM代替传统神经网络,有效提高了区间预测效率和质量,但训练过程仍然容易陷入局部最优。此外由于原始负荷数据是具有随机性的非平稳时间序列[10],目前负荷区间预测模型很少考虑这一问题,同样很大程度地限制了负荷区间预测质量。

鉴于此,为解决上述研究所存在的问题,本文提出一种基于ESMD-DE和ICSA-KELM的短期负荷区间预测模型。首先利用ESMD对原始负荷序列进行分解,该方法克服了经验模态分解(EMD)模态混叠问题及集合经验模态分解(EEMD)所加噪声难以完全消除的问题;同时利用分散熵(DE)对各子序列分析重组,解决了样本熵(SE)计算耗时长及排列熵(PE)未考虑序列振幅值间差异的问题;随后由基于ICSA优化KELM的LUBE模型得到负荷预测区间,利用ICSA克服了PSO及CSA算法易陷入局部最优的问题,同时采用的KELM能够有效降低模型训练时的复杂度并提高负荷预测区间质量。最后通过实测电力数据仿真分析证明了本文所提方法能够有效提高负荷预测区间质量。

1 基本原理分析

1.1 ESMD算法

ESMD算法是2013年由Wang等[11]提出的一种新型非平稳信号处理方法。该算法采用内部极点对称插值代替常规的包络线插值,并利用最小二乘法的思想优化剩余分量得到自适应全局均线,以此选取最佳筛选次数。解决了EMD模态混叠及端点效应等问题,并克服了EEMD分解过程中所加噪声难以完全消除的问题。ESMD具体步骤如下:

(1)寻找待分解数据X的全部极值点,将相邻的极值点用线段连接,取各条线段的中点记为Fj(j=1,2,…,n-1)。采用线性插值法添加左右边界中点F0及Fn。

(2)通过上述n+1个中点构建T条插值曲线L1-LT,并对其进行均值计算得到均值线L*=(L1+L2+…+LT)/T。

(3)对X-L*重复上述步骤直到满足|L*|≤ε(ε为设定的误差阈值)或达到最大筛选次数P,从而得到第一个模态分量IMF1。

(4)对余量X-IMF1重复上述步骤,从而可以得到IMF2,IMF3,…,直到余项R的极值点数不再大于设定值为止。该算法允许R含有多个极值点。

(5)在整数区间[Pmin,Pmax]内改变P的取值,重复上述步骤并计算相应的方差比率σ/σ0,其中σ为X-R的相对标准差,σ0为数据X的标准差。

(6)最后在区间[Pmin,Pmax]内找到方差比率最小时的最大筛选次数P0。并以此重复步骤(1)~(4)得到最终的分解结果。

1.2 分散熵

DE是Rostaghi等[12]于2016年提出的一种用于度量时间序列复杂度的新型算法。该方法能够有效解决样本熵计算耗时长及排列熵未考虑序列振幅值间差异的问题。对于时间序列x={x1,x2,…,xn},DE的计算过程如下:

(3)求得cm个分散模式的相对频率如下:

(m-1)d]

(1)

(4)最后,通过式(2)计算可得到分散熵值:

(2)

1.3 改进乌鸦搜索算法

CSA算法是Askarzadeh[13]受乌鸦觅食行为启发于2016年提出的一种新型群体智能优化算法。该算法认为乌鸦觅食过程中会将剩余食物储藏起来,并在有需要时将其取回;此外,它们可以跟踪其他乌鸦并窃取其食物,而被跟踪的乌鸦将通过一定感知概率随机移动保护食物。CSA算法需设置的参数较少,计算过程简单,有较好的寻优能力,但寻优过程中飞行步长Lf选择不当会导致算法陷入局部最优。为此将Lévy飞行[14]引入到CSA算法中,利用Lévy飞行能够提高种群多样性及增大搜索范围的特点对Lf进行改进,从而增强算法搜索能力。改进乌鸦搜索算法(ICSA)具体过程如下。

xi,k+1=

(3)

(4)

(5)

最后,当乌鸦位置更新后计算其适应度值f(·),并通过式(6)更新记忆值:

(6)

1.4 核极限学习机

KELM是Huang[15]提出的一种将原有极限学习机(ELM)与核函数相结合的改进方法。KELM采用核映射取代ELM中原有的随机映射,相比ELM具有较强的稳定性及泛化能力且无需设置隐含层节点数。KELM中核矩阵ΩELM定义如下:

(7)

式(7)中:K(xi,xj)表示核函数,将其设定成RBF核:

(8)

将ELM与上述核学习结合可得到KELM模型的输出如(9)所示,其中ELM具体过程见文献[16]。

f(x)=h(x)HT(I/C+HHT)-1T=

[K(x,x1)K(x,x2) …K(x,xN)]T×

(I/C+ΩELM)-1T

(9)

式(9)中:I和C分别为对角矩阵和惩罚系数,核矩阵ΩELM用于取代ELM原有的随机矩阵HHT,核函数K(xi,xj)用于取代隐层输出函数h(x)。同时由该式可知KELM输出权值如下:

β=(I/C+ΩELM)-1T

(10)

2 ICSA-KELM负荷区间预测模型

2.1 ICSA-KELM区间预测模型结构

为克服传统区间预测方法计算过程复杂和需假设误差分布的问题。利用基于ICSA-KELM的LUBE模型进行后续的负荷区间预测。该模型采用KELM双输出结构,在训练过程中利用ICSA结合优化目标函数对模型输出权值β进行优化,从而直接获得最优负荷预测区间,模型结构如图1所示。

图1 区间预测模型结构Fig.1 Interval prediction model structure

2.2 区间预测优化目标函数

为得到合理的负荷预测区间,需构造该区间预测模型的优化目标函数,从而得到模型的最优参数。合理地预测区间应满足预测区间覆盖率尽可能大且预测区间宽度尽可能小,因此目标函数的构造需同时考虑这两个指标,本文以此构造目标函数。

2.2.1 预测区间覆盖率

预测区间覆盖率(PICP)表示目标值处于预测区间中的概率,用以衡量预测区间的可靠性。PICP越高说明越多的目标值落入预测区间内。其公式如下:

(11)

式(11)中:N代表预测样本个数;εi是变量,若目标值yi落在预测区间内则εi=1,反之εi=0。

2.2.2 预测区间平均宽度

在区间预测中若不考虑预测区间宽度,很容易得到较高的PICP。但如果区间过宽则将增加预测区间的不确定性,从而失去决策价值。因此为避免这一问题,需引入预测区间平均宽度(PINAW)指标。其公式如下:

(12)

式(12)中:R表示目标值变化范围;Ui与Li分别表示样本i的预测区间上下限。

2.2.3 优化目标函数

在实际决策时PICP和PINAW两个指标是存在矛盾的。当PICP较高时可能导致PINAW较大,而当减小PINAW时又将导致PICP减小。因此,为更好地权衡上述两个指标,以覆盖宽度准则(CWC)作为优化目标函数,CWC定义如下:

CWC=PINAW[1+γPICPe-η(PICP-μ)],

(13)

式(13)中:μ表示给定的置信水平;η为惩罚因子。当PICP不低于μ时表示PICP指标已满足要求,此时CWC由PINAW决定;当PICP低于μ时,由于惩罚因子的存在会导致CWC变得很大,此时反应区间预测质量较差。因此优化的目的是最小化CWC。

2.3 ICSA-KELM区间预测流程

(1)初始化KELM,确定其核函数,采用RBF核。将训练样本的输出目标值进行上下小幅度浮动,作为KELM初始区间。

(2)将步骤(1)处理后的训练样本代入模型中训练得到KELM初始输出权重。

(3)在步骤(2)的基础上初始化ICSA参数。设定乌鸦种群大小、飞行步长、感知概率、算法最大迭代次数。KELM初始输出权重作为乌鸦初始位置。

(4)按照ICSA步骤对乌鸦位置进行更新,并结合式(13)所提目标函数计算乌鸦在每次迭代中的适应度值。利用式(6)对乌鸦最优位置进行迭代更新得到最终的全局最优解即模型最优输出权重β,并以此得到最优负荷预测区间。

3 基于ESMD-DE和ICSA-KELM的负荷区间预测模型流程

经上文理论分析,结合各方法优势搭建了基于ESMD-DE和ICSA-KELM的短期负荷区间预测模型,该模型由数据处理环节(ESMD-DE)和区间预测环节(ICSA-KELM)组成。整体流程如图2所示。

图2 负荷区间预测模型流程Fig.2 Load interval prediction model flow

4 实验仿真

实验数据选用第九届电工数学建模竞赛提供的电力负荷数据集。该数据集内包含某地区连续三年的电力负荷数据和对应的同期气象数据。为有效验证所提短期负荷区间预测模型的优势,选取其中2012年7月26日—8月24日连续30 d每日整点负荷数据作为训练集,辅助数据为同期温度数据和日期类型。分别对8月25日和8月26日整点负荷进行区间预测。仿真软件为MATLAB 2016b。

4.1 数据处理

为降低原始非平稳负荷序列对预测区间质量的影响,首先利用ESMD对训练集负荷数据进行分解,即对720个连续负荷数据点进行分解。分解过程中Pmin和Pmax分别设置为1和40,剩余极值点数设定值为4,最终分解结果如图3所示。

图3 ESMD分解结果Fig.3 ESMD decomposition results

由图3可以看出原始负荷序列被分解为四个特征互异的模态分量和一个残余分量。原始非平稳负荷序列中的不同尺度特征被很好地分解出来。

随后考虑到分解得到的模态分量较多,若直接对其搭建预测模型会导致整体模型较为复杂。因此本利用分散熵对各分量进行复杂度分析,并将熵值相近的分量进行重组。其中DE参数通过多次实验确定,当m=3,d=1,c=3时最能体现各分量的复杂度差异。由此可得各分量分散熵值如图4所示。

图4 各分量DEFig.4 DE of each component

由分散熵值计算可知IMF1分散熵值最高且明显高于其他分量,即IMF1复杂度最高,因此IMF1单独作为重组分量F1;IMF2和IMF3的DE相差不大为0.29,复杂度相近,因此可以合并为重组分量F2;同理IMF4和R的DE相差为0.25,因此合并为重组分量F3。最终的重组方式如表1所示。

按照表1所示重组方式对各分量进行重组,可以得到重组后的新序列如图5所示。

表1 各分量重组结果

图5 重组序列Fig.5 Recombination sequence

由图5可以看出重组序列F1频率最高随机性最强,因此可以看作为高频随机分量;重组序列F2具有一定的周期性,因此可以看作周期分量;重组序列F3能够表示原始负荷数据的整体变化趋势,因此可以看作为趋势分量。

随后利用文献[17]的方法对各重组分量进行周期性分析,用以确定后续各重组分量对应的子区间预测模型的输入集合。经周期性分析可知重组分量F1周期为8 h,该分量随机性强复杂度高,主要受高频突发事件影响;F2周期为24 h,以天为单位,表示一天的负荷变化;F3周期为166.5 h,表示一周的负荷变化,波动变化平缓。且经相关性分析可得F3与日最高温度、日平均温度有较强相关性,因此F3对应的输入集合确定时需包含相应的温度数据。同时考虑到负荷变化与日期类型有一定关系,星期类型以0.7代表周一,0.8代表周二到周五,0.5代表周六,0.3代表周日。最终由上述分析可确定各重组分量对应的输入集合如表2所示。

表2 各重组分量对应输入集合

最后将实验数据归一化到区间[0,1],以提高模型精度及效率。

4.2 区间预测环节搭建

随后结合输入集合利用各重组分量分别建立并训练相应的ICSA-KELM区间预测模型,最终利用训练后的ICSA-KELM预测模型得到各分量的预测值,并将其叠加从而得到最终的负荷预测区间。由表2可知F1、F2、F3对应输入变量分别为8、5、10,因此各重组分量相应的模型中KELM的输入层节点分别为8、5、10,而KELM的输出层节点均设置为2,KELM核函数选择RBF核,取核参数γ=0.1,取惩罚系数取C=0.5,训练样本输出目标值上下浮动20%,作为KELM初始区间,取CWC中惩罚因子η=40。ICSA算法中,设置种群大小N=50,飞行步长Lf=2,感知概率Pa=0.1,最大迭代次数为100。

4.3 预测结果分析

为验证所提负荷区间预测模型的优势。在相同的实验环境下采用相同数据,在给定置信水平(95%)下分别构建ICSA-KELM、CSA-KELM、CSA-ELM负荷区间预测模型,分别对2012年8月25日和8月26日整点负荷进行区间预测。并将各模型的预测结果与本文所提预测模型所得预测结果对比。其中评价指标为预测区间覆盖率PICP,预测区间平均宽度PINAW。

最终得到的各模型预测结果如图6所示。

图6 预测结果Fig.6 Prediction results

由图6可以直观地看出,在给定置信水平下,本文所提出的区间预测模型能够得到最窄的预测区间,并且与其他预测模型相比覆盖了更多的真实值。为了进一步证明ESMD-DE-ICSA-KELM区间预测模型的优势,选用PICP和PINAW作为评价指标。最终各模型的评价结果对比如表3所示。

表3 各模型预测结果

由表3中结果可以看出,所提出的预测模型相比ICSA-KELM预测模型PICP提高了2.09%,PINAW降低了0.019 6,预测区间质量更高,说明通过引入数据处理环节有效降低了原始非平稳负荷序列对区间预测结果的影响;而ICSA-KELM预测模型相比于CSA-KELM预测模型,虽然PICP指标相同,但是PINAW降低了0.025 9,得到的预测区间更好,这是因为通过引入Lévy飞行得到的ICSA算法有效克服了常规CSA算法飞行步长Lf选择不当会导致算法陷入局部最优的问题,从而提高了预测区间质量;CSA-KELM预测模型相比于CSA-ELM预测模型,PICP指标提高了2.08%,并且PINAW值降低了0.063,在保证更高预测区间覆盖率的情况下具有更窄的预测区间,预测效果更好,这是因为KELM相比ELM具有较强的稳定性及泛化能力,有效提高了模型的预测能力。综上可以看出,所提区间预测模型的PICP值最高并且PINAW值最小,在满足给定置信水平的条件下,具有较窄的预测区间宽度,预测区间的质量和可靠性最高,从而证明了所提区间预测模型的优势。

5 结论

为提高短期负荷区间预测质量,提出了基于ESMD-DE-ICSA-KELM的短期负荷区间预测模型。首先为了克服EMD模态混叠问题和EEMD所加噪声难以完全消除的问题,将ESMD方法引入到负荷区间预测问题中,对原始负荷序列进行分解;随后,为克服样本熵计算耗时长及排列熵未考虑序列振幅值间差异的问题,利用DE对各子序列进行复杂度分析并重组;最后,为克服CSA算法易陷入局部最优和ELM稳定性及泛化能力较差的问题,构建了基于ICSA-KELM的LUBE模型作为区间预测环节,同时也克服了常规区间预测方法计算量大、预测区间可靠性差等问题。

总起来说,由理论和仿真结果分析可知本文所提出的ESMD-DE-ICSA-KELM预测模型在短期负荷区间预测领域中具有一定的优势,有效提高了区间预测质量,为日后的负荷区间预测提供了一定的参考,具有一定的研究意义。

猜你喜欢
分量区间负荷
你学会“区间测速”了吗
人造革合成革拉伸负荷测量不确定度评定
3项标准中维持热负荷要求对比分析
Opening flexible resources by integrating energy systems: A review of flexibility for the modern power system
画里有话
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
全球经济将继续处于低速增长区间
论《哈姆雷特》中良心的分量
区间对象族的可镇定性分析