基于MPA-LSTM模型和Bootstrap方法的短期光伏功率区间预测

2022-09-19 01:35宋绍剑罗世坚李国进刘斌
关键词:区间功率误差

宋绍剑, 罗世坚, 李国进, 刘斌

(广西大学 电气工程学院, 广西 南宁 530004)

0 引言

太阳能是一种绿色能源,具有储量丰富、污染小和可再生等优点[1]。据估计,到2030年全球光伏发电总装机容量将达到1 700 GW[2];但由于受到云层、风力和温度等天气因素影响,因此光伏电站的输出功率具有很强的波动性和间歇性。大规模光伏电源接入电网将给电力的调度和安全稳定运行带来巨大的挑战[3],精确的光伏功率预测是电力系统科学调度决策的前提,对电网的稳定运行具有重要意义。

光伏输出功率与影响因素之间存在很强的非线性关系,精确的解析模型难以获得。由于人工神经网络具有很强的非线性映射能力,因此被广泛用于光伏功率预测[4-6]。长短期记忆网络(long short term memory,LSTM)是一种循环神经网络(recurrent neural network,RNN)的变体,具有从大量时序数据中挖掘数据间复杂关联特性的能力[7]。与支持向量机(support vector machine,SVM)、极限学习机(extreme learning machine,ELM)等人工神经网络相比,LSTM网络在时序数据建模方面具有明显优势,目前被广泛用于负荷预测、风力功率预测和光伏功率预测等领域。从文献[7-9]可知,LSTM网络在预测光伏功率领域有良好的精确度和鲁棒性,但是,LSTM网络模型性能与其结构和超参数选取紧密相关,其参数目前主要通过人工试凑法选取。这种方法不但耗时、工作量大,而且难以获得合理的参数,为此,将遗传算法(genetic algorithm,GA)和粒子群算法(particle swarm optimization,PSO)等群智能优化算法用于LSTM超参数优化已成为一种新趋势,通常可以取得更好的精度[5,10],但是,大多数群智能优化算法仍面临结构复杂、搜索速度慢、易于陷入局部最优等问题。海洋捕食者算法(marine predators algorithm,MPA)是一种新型群智能优化算法[11],与其他群智能算法相比,具有结构简单、算法灵活、易于实现、兼顾勘探与开发的协调能力等优点。目前MPA优化LSTM网络的模型用于光伏功率预测的案例还鲜有报道。

目前大多数光伏功率预测主要侧重于光伏功率的点预测,即给出待预测点的期望值,忽略了更有价值的区间信息,并且模型不可避免的存在误差。随着调度决策对预测精度的要求进一步提高,给出精确的点预测结果及其区间范围更具实际意义[12]。光伏功率波动区间分析(即区间预测)方法主要有参数法和非参数法[13]。其中,参数法需假设预测误差服从已知概率分布,如Gaussian分布、Gamma分布和Beta分布等[14]。预测误差实际分布往往难以事先确定,且不同的应用场景和分布函数以及区间预测结果差别很大,这些因素制约了参数法的应用。相反,非参数法是根据预测误差直接估算误差的分布,给出不同置信度水平下的预测输出区间,无需事先假设误差的分布形式。它能够更加准确地量化误差分布特征,有助于提高区间预测的准确性。常用的非参数法包括分位数回归、核密度估计和Bootstrap等[15]。文献[12]用Bootstrap方法评估风电点预测误差,并计算置信区间,实验结果表明该方法具有较佳的性能。此外,Bootstrap方法无需对样本分布作假设和新增样本,在小样本和数据分布规律未知情况下依然具有很好的鲁棒性和精度,还可以借助计算机模拟,具有很高的灵活性和实用性[16]。

综上所述,如何进一步提高光伏功率预测模型的精度、鲁棒性及区间预测的可靠性仍然是一项具有挑战性的任务。为此,本文提出了一种基于MPA-LSTM网络模型的新型光伏功率区间预测方法。首先,针对LSTM网络的超参数难以确定的问题,采用MPA对LSTM网络的超参数(隐含层神经元数、训练批次数)自动寻优,并将优化后的LSTM模型用于光伏功率点预测;然后,采用Bootstrap方法分析光伏功率预测误差,并结合点预测结果确定预测输出区间;最后,通过算例对比分析,验证所提出模型的有效性。

1 基于MAP-LSTM网络的区间预测方法

1.1 基于MPA-LSTM短期光伏功率点预测模型

为了提高基于LSTM网络光伏功率模型的预测精度,减少因传统人工试凑法设置LSTM超参数不合理对模型精度带来的不利影响,将一种新颖的群智能优化方法(MPA)用于LSTM网络的超参数寻优,从而提高光伏功率预测模型的精度和鲁棒性。

1.1.1 LSTM网络

LSTM网络是一种特殊结构的RNN网络,用具有记忆功能的LSTM单元替代RNN中隐含层神经元,解决了RNN的梯度消失和梯度爆炸问题。单层LSTM网络的结构图如图1所示。图1中xt和zt分别表示t时刻LSTM网络的输入和输出;xt-1和zt-1分别表示t-1时刻输入和输出;xt+1和zt+1分别表示t+1时刻输入和输出。一个LSTM单元主要由存储单元、遗忘门、输入门、输出门组成,LSTM单元结构如图2所示。

图1 LSTM网络结构模型

图2 LSTM单元结构

LSTM单元的内部运算过程可以通过以下公式来描述:

ft=σ(Ufxt+Wfht-1+bf),

(1)

it=σ(Uixt+Wiht-1+bi),

(2)

(3)

(4)

Ot=σ(Uoxt+Woht-1+bo),

(5)

ht=Ot⊗tanhCt,

(6)

式(1)—(6)中:为xt表示当前时刻的输入;ht和ht-1分别表示t时刻和t-1时刻的状态;Ct和Ct-1分别表示t和t-1时刻存储单元的状态;ft为遗忘门;it为输入门;Ot代表输出门;Uf、Wf、Ui、Wi、Uc、Wc、Uo、Wo为权重矩阵;bf、bi、bc和bo为神经元的偏置量;σ(·)和tanh(·)为激活函数。

1.1.2 海洋捕食者算法(MPA)

MPA[11]是一种新型群智能优化算法,灵感源于海洋生物适者生存理论,即模仿海洋捕食者通过Lévy游走或布朗游走选取最佳捕食策略过程。该算法可分为3个阶段,即初始阶段、优化阶段、涡流的形成与鱼类聚集装置(fish aggregating devices,FADs)影响。其具体的数学描述过程如下。

(1)初始阶段。MPA通过随机生成初始解来启动算法。其数学表达式为:

Xn,d=Xmin+rand(Xmax-Xmin),

(7)

式中:Xmax、Xmin分别是变量的上、下分布边界,rand()是一个0~1的随机变量;Xn,d为第n个猎物、第d维空间位置。

根据适者生存原理构建顶级捕食者的精英矩阵E和猎物矩阵G,它们的数学表达式为

(8)

(9)

式中:XI为顶级捕食者向量;E是由XI复制N次构成,其中N为种群数;D为搜索空间的维度。

(2)MPA优化阶段。MPA的优化阶段根据捕食者和猎物的速度变化,分为3个阶段。

(10)

式中:Sn为移动步长;RB为呈正态分布的布朗随机向量;⊗为逐项乘法运算符;P取值为0.5;R为[0,1]内均匀随机向量;K表示最大迭代次数;k为当前迭代次数。

(11)

(12)

式(11)—(12)中:RL为呈Lévy分布的随机向量;CF是控制捕食者移动步长的自适应参数,它的表达式为CF=(1-k/K)2k/K;

(13)

(3)涡流效应与FADs影响。FADs或者涡流效应会改变海洋捕食者的觅食行为,这一策略有利于算法克服早熟问题并跳出局部最优,从而实现全局优化。其数学表达式为

(14)

式中:FAD取值为0.2;U为二进制向量,r为[0,1]内的随机数,r1、r2分别为猎物矩阵的随机索引。

1.1.3 基于MPA优化的LSTM网络模型

LSTM网络的隐含层神经元数和训练批次数对模型的预测性能具有重要影响,合理选择这2个参数有益于提高预测模型的性能,因此,将这2个参数作为MPA寻优的特征,利用MPA对LSTM网络模型超参数寻优。MPA方法对LSTM网络的关键超参数优化的流程框图如图3所示,具体实现步骤如下:

图3 MPA-LSTM的流程框图

① 设置LSTM网络隐含层神经元个数和训练批次数的范围,根据LSTM网络参数范围初始化MPA的参数。

② 根据捕食者的位置更新LSTM网络参数,并计算训练平均绝对误差(mean absolute error,MAE),将MAE作为MPA中个体适应度函数,判断是否要更新精英矩阵E。

③ 根据公式(10)—(14)更新参数,重复步骤②。

④ 判断是否达到终止条件,如果没有达到,则重复步骤③。当达到终止条件时,精英矩阵E的参数值即为LSTM网络的最优参数。

1.2 基于Bootstrap方法的置信区间估计

Bootstrap方法是由美国统计学教授Efron提出,具有计算方便、实现容易等优点,在数据分析领域得到广泛应用[17]。该方法通过假设给定一组数据集服从一个未知分布,并且这个分布的总体方差也未知,通过对给定数据集进行反复抽样,根据抽样样本估计样本的分布区间。具体的实现过程如下:

① 假设从原始样本y1,y2,…,ym进中行又放回抽取M次,得到1个Bootstrap样本集Y1;按照上述步骤重复B次,即可得到B个Bootstrap样本集,YB=(Y1,Y2,…,Yb),b=1,2,…,B;

(15)

(16)

③ 计算样本在置信度1-α下的置信区间的上下限Yup和Ylow:

(17)

(18)

式中Z1-α/2是标准正态分布100·(1-α)%对应的临界值。

1.3 区间预测方法

本文选取两步法实现光伏功率区间预测。首先通过MPA-LSTM模型实现短期光伏功率的点预测;然后,采用Bootstrap方法对预测误差分析,获得给定置信水平下的误差分布区间,通过综合点预测的结果和误差分布区间,实现区间预测。本文所提方法的区间预测流程图如图4所示。

图4 区间预测流程图

其实现的具体过程可具体描述为:

① 数据集的划分。由于地球的公转影响,全球的大部分地区的辐照度和温度等因素都呈现季节性周期变化,因此将样本数据按季节划分为春季、夏季、秋季和冬季4个子集,以便于更好地训练模型。

② 数据预处理。将光伏功率数据及对应的辐照度等数据根据数据边界原则,将异常数据修正、对缺失数据进行插值补全。由于数据集中每一个输入、输出特征量的量纲并不一样,为了加快模型训练速度和减小误差,利用最大最小值原理对数据进行归一化处理。

③ 将子数据集分别分为训练集和测试集,用训练集用于模型训练,并获取最优的MPA-LSTM网络;利用测试集验证优化后MPA-LSTM网络模型,实现光伏功率点预测。

④ 采用Bootstrap方法分析预测误差样本,计算给定置信区间下的预测误差的分布边界值。

⑤ 通过对MPA-LSTM模型的点预测结果和误差分布区间综合分析,计算光伏功率的区间预测结果。

2 算例分析

为了验证本文所提出方法的有效性,本文选取美国标准工程实验室设在马里兰校区内的光伏示范电站的地面光伏阵列作为研究对象,其安装容量为271 kW[18]。该电站提供大量不同时间尺度的光伏电站数据及气象数据,特别适合光伏电站功率预测的精细建模。本文选取了时间跨度为2015年12月到2016年12月的历史数据。为了使模型更具普适性、降低模型的复杂性,仅选取辐照度、温度、风速和风向作为光伏输出功率的主要影响因素。由于原始历史数据的时间分辨率为1 min,因此首先通过预处理,获得时间分辨率为15 min的光伏功率数据和气象数据。然后,依据季节特性,将数据划分为春、夏、秋和冬4个子数据集。此外,为了加快训练速度、降低输入变量不同量纲对模型的影响,对每个子数据的数据进行归一化处理。最后,分别从归一化后子数据集随机选取10%的数据作为测试数据集,其余数据作为训练集。模型的输入为辐照度、温度、风速和风向,输出为光伏功率。

本文实验的实验环境如下:Win10操作系统,处理器为Intel(R)Core(TM)i5-9400F CPU@2.90 GHz, 16 GB RAM,无GPU卡;所有仿真结果均在基于Python3.7.1的Tensorflow 2.1.0环境下完成。

2.1 评价指标

为了量化分析所建光伏功率预测模型的精度,本文选取均方根误差(root mean square error,RMSE)、平均绝对误差(MAE)作为点预测模型的典型评价指标[15]。对于区间预测结果,本文选取预测区间覆盖率(prediction interval coverage probability,PICP)、预测区间平均宽度(prediction interval normalized average,PINAW)和温克勒系数(Score)等指标评价模型[13]。上述评价指标在有关光伏功率点预测与区间预测上得到广泛的应用,限于篇幅,对上述评价指标的详细定义不再赘述。

2.2 光伏功率点预测结果及对比分析

为了验证本文所提出模型的性能的优越性,本文还建立了基于SVM、LSTM、PSO-LSTM、MPA-SVM网络的类似预测模型作为对照模型。为了公平起见,PSO和MPA的种群数也都设置为30,迭代次数均为500,LSTM和SVM模型的训练迭代次数为200。此外,本文所建的不同模型均在相同的训练集和测试集中完成了训练和测试。

为了更加直观地了解实际值与预测值之间的偏差,本文从4个子测试数据集中分别随机选取1 d的预测结果作为展示。光伏功率点预测结果如图5所示,其中(a)、(b)、(c)和(d)分别是4个季节的测试集中某一天不同方法的预测结果。

从图5可知,早上7:00时,春、夏两季已经有功率输出,而秋、冬季功率为0。夏季的输出值最大且稳定性好,秋季的输出功率小于春、夏两季的,但大于冬季的;从功率曲线可知光伏功率存在季节性差异。图中带实心圆的曲线为实际功率曲线,含倒三角形的黑色曲线为本文所提模型的预测曲线,其他曲线分别为对比模型预测曲线。从图中可知,在功率波动平缓的区域,各个方法的结果差异不大,但是在波动剧烈的部分,结果差异较大。LSTM和SVM模型的输出与实际输出功率的差距较大,预测性能较差。PSO-LSTM和MPA-SVM模型的预测曲线与实际功率曲线的拟合程度要好于SVM和LSTM模型的,MPA-LSTM模型的预测曲线与实际曲线差距最小,具有比较优异的预测性能,表明超参数优化后的预测模型精度更高。单纯从曲线的形状往往难以判别实际模型性能,因此,本文还分别统计了所提模型与对比模型在整个测试集上预测结果的RMSE和MSE,MPA-LSTM及对比模型的点预测指标如表1所示。

(a)春季

表1 点预测指标

从表1可知,相比于其他模型,基准SVM模型在4个季节中RMSE和MAE的值最大,由此可知SVM模型的预测效果最差;LSTM模型的RMSE和MAE值都小于SVM模型的。MPA-SVM模型的RMSE和MAE平均值分别比SVM模型的小0.59%和1.46 kW,但是与PSO-LSTM模型的结果相近。MPA-LSTM模型在春、夏、秋和冬季4个季节中,RMSE和MAE的值都小于SVM、LSTM、PSO-LSTM和MPA-SVM模型的。MPA-LSTM模型的RMSE和MAE的平均值为1.09%和1.52 kW;与SVM等对比模型相比,RMSE分别降低了0.72%、0.42%、0.15%和0.13%。从结果可知,MPA-LSTM模型对于不同的季节都有较好的预测效果,LSTM模型的预测精度比SVM模型的更高。同时通过MPA改进的LSTM模型精度比基准LSTM模型和PSO-LSTM模型有了提高,说明相比于PSO模型,MPA具有更好的勘探和开发能力。

2.3 区间预测结果及对比分析

由于光伏电站上空云层分布和周围的天气变化具有很大的随机性,分析光伏输出功率的区间范围更具有意义,因此本文采用Bootstrap方法分析MPA-LSTM模型的预测误差分布,然后根据误差分布结果与点预测结果,求解光伏功率概率区间。分别讨论置信度为80%、90%和95%条件下光伏功率区间的分布情况,并与参数法中的Gaussian分布和Gamma分布(分别假设预测误差分别服从Gaussian分布和Gamma分布)作对比。为了方便结果展示,区间结果与点预测选取同一天。Bootstrap方法区间预测结果如图6所示,图6中描述了置信度为80%、90%和95%的MPA-LSTM模型的预测区间,以及实际功率值落在区间内的情况。从图中可知,随着置信度增大,预测区间宽度变宽;与此同时,落在预测区间内实际光伏功率的点数也随之增多,但是从春季的区间结果可知,仍然存在少部分实际功率值会落在预测区间以外,这可能是由光伏功率的预测偏差或所采集的数据有误造成。

(a)春季

分别计算Bootstrap方法和Gamma分布、Gaussian分布法的PICP,PINAW和Score指标,Bootstrap方法及对比方法的区间预测指标如表2所示。

表2 区间预测指标

从表2中可知,随着置信水平增大,PICP和PINAW的值都会增大。在4个季节中,当置信度为80%和90%时,Gamma分布方法的PICP值都大于Bootstrap方法的,但是PINAW的值也比Bootstrap方法的大;Gaussian分布方法的PICP值在春季和秋季要大于Bootstrap方法,而在夏、冬季则小于Bootstrap方法。当置信度为95%时,Bootstrap方法在4个季节中的PICP值分别为96.4%、96.6%、97.8%和97.5%,均大于95%,但是在Gamma分布方法春季时分别只有94.0%;Gaussian分布方法在春季和夏季中,PICP分别只有93.1%和93.6%,这2种方法并不满足给定需求,因此,Gamma和Gaussian分布方法并不能很好描述光伏功率的误差分布。同时,从表中可知,Bootstrap方法的Score的值在不同的季节和置信度下,大部分时候都是最大的,仅有在秋季的置信水平为90%时,它的值略小于Gamma分布方法的。Score是一个负数,值越大,则代表预测效果越好,因此,总的来说Bootstrap方法在不同的季节和不同置信度之下都能很好地描述光伏功率地误差分布,表现出优异的区间预测性能,能够提供全面的预测信息。

综合点预测和区间预测结果可知,本文所提出的MPA-LSTM模型对光伏功率点预测有较高的精度,Bootstrap方法能准确描述误差分布,验证了所提出的方法有效性和实用性。

3 结论

针对目前光伏功率模型预测精度仍有待提高、以及因缺乏光伏电站功率输出误差分布先验知识而难以对光伏输出功率波动区间进行准确估计等问题,本文提出一种基于MPA-LSTM网络的光伏功率短期点预测模型,首先利用MPA对LSTM网络的关键参数隐含层神经元数和训练批次数优化,然后将优化后的MPA-LSTM模型用于预测光伏功率;然后,采用Bootstrap方法分析点预测的预测分布,并结合点预测结果实现其区间预测。实验结果表明:

① 与其他群智能优化算法相比,MPA具有更好的局部开发和全局搜索能力。

② 采用MPA对LSTM的参数寻优后,可以减少人为因素对模型效果的影响,能够提高基于LSTM网络模型预测精度。

③ 与参数法中的Gamma和Gaussian分布相比,Bootstrap方法可以直观评估不同置信度水平下光伏功率预测误差的分布,并且满足实际需求,而且该方法无需事先假设误差分布功率及其参数,更有利于工程应用。

猜你喜欢
区间功率误差
你学会“区间测速”了吗
『功率』知识巩固
比较功率大小有方法
功与功率辨
追本溯源识功率
Beidou, le système de navigation par satellite compatible et interopérable
全球经济将继续处于低速增长区间
隧道横向贯通误差估算与应用
隧道横向贯通误差估算与应用
精确与误差