基于TCN-MHA 的短期光伏功率预测

2023-10-18 13:32孙永叡任晓颖
科技创新与应用 2023年29期
关键词:残差注意力卷积

孙永叡,任晓颖,2*,张 飞,2,高 鹭,郝 斌

(1.内蒙古科技大学信息工程学院,内蒙古 包头 014000;2.华北电力大学新能源学院,北京 100000)

据国家能源局统计,2022 年1—6 月光伏新增并网容量3 087.8 万kW,累计并网容量约3.4 亿kW,同比增长26%[1]。随着光伏并网容量规模的增加,光伏发电的随机性、周期性对电网会产生更大的冲击。准确的光伏功率预测有利于光伏电站及电网合理调度,增加电网消纳光电能力,提高电网稳定性[2]。

光伏功率预测实际上是对非平稳数据流的预判,预测方法可以根据不同的尺度进行分类[3]。如按照预测过程、预测空间尺度、预测时间尺度,若按照不同的预测形式,可分为点预测、区间预测和概率预测。本研究属于点预测,主要分为物理法、统计法、元启发式学习法等。物理法虽不需详细的历史数据训练模型,但依赖详细的电站地理信息和准确气象数据,且物理公式存在一定的误差,模型抗干扰能力差,鲁棒性不强。统计法相较于物理法,具有建模简单等优势,但该方法由于对早期和近期数据重要性不加区分,所以不能较好地反映特征当前发展趋势,且当有新的数据点出现时,所建模型需要重新确定,不能自行延续。元启发式学习法采用算法对样本数据进行训练得到输入量与输出量的关系,属于人工智能的范畴。常见的元启发式法有深度学习及机器学习法等。许多学者利用经典的循环神经网络(Recurrent Neural Networks,RNN)[4-6]、长短期记忆网络(Long Short-Term Memory,LSTM)[7-9]和门控循环单元(Gated Recurrent Unit,GRU)[10-12]取得了大量成果,这些预测模型能够有效提取深层次的数据特征,体现时间序列前后的关联性,被认为是功率预测的首要选择。而Bai 等[13]提出了基于卷积神经网络(Convolutional Neural Networks,CNN)的时间卷积神经网络(Temporal Convolutional Networks,TCN),表明了卷积架构在多种任务和数据集上的表现优于典型的循环网络,灵活的感受野展现更长的有效记忆,得出了如今应同时将卷积神经网络作为序列建模任务自然起点的结论,因此,近年来越来越多的学者在时间序列预测任务中使用卷积神经网络及其变体作为首要预测模型。

为克服TCN 在多步预测输出与固定输入之间的不同非线性映射关系难以建立[14]的不足,本研究基于TCN 建立了深度学习混合模型对日前短期光伏功率进行预测。首先,对数据进行处理,包括数据清洗、数据转换及特征选择;然后对TCN 和MHA 进行相关介绍,并对所提深度学习混合模型TCN-MHA 及预测步骤进行阐述;最后通过算例分析将所提模型与CNN、TCN 及CNN-LSTM 进行对比,验证所提模型的有效性。

1 数据处理

1.1 数据预处理

本研究数据集为DKASC 澳大利亚中部爱丽丝温泉光伏系统2 号站点2012—2015 年数据[15],场站装机容量为26.52 kW,采样周期为1 h,共35 064 组数据。首先,对光伏数据中的异常值及缺失值进行处理。通过箱型图检测异常值,采用前值填充法填充异常值及缺失值;数据集中90%为训练集,10%为测试集,训练集中的20%为验证集;由于不同特征的量纲不同,为了方便模型训练,使用Tensorflow 中MinMaxScaler 方法对数据进行归一化处理,其数学式见式(1)。

式中:Xnorm为归一化结果;X为输入值;Xmax为数据集中对应特征的最大值;Xmin为数据集中对应特征的最小值。

1.2 数据转换

深度学习网络输入数据需要三维,对于光伏数据这类时间序列数据,需要将数据经过滑动窗口。一来可以将数据划分为输入特征和目标特征,转换为有监督学习;二来可以将输入数据转化为三维,实现动态预测。本研究对经滑动窗口的数据进一步遍历筛选,对输入输出数据进行每24 个样本重新采样,拉长相邻样本数据的间隔,得到无重复的输出数据,方便后续日前功率预测及评估。图1 为经过滑动窗口前后的数据。

图1 滑动窗口处理前后数据变化

图2 为遍历筛选前后的数据,处理后输出数据(Y)可以获得1 311 d 独立数据。

图2 筛选前后数据变化

1.3 特征选择

由于深度学习算法会挖掘数据潜在特征,本研究结合相关性分析及预测实验进行特征选择。表1 为各特征与光伏功率的Pearson 及Spearman 相关性分析结果。

表1 相关性分析结果(保留4 位小数)

根据相关性分析可以看出两种相关性有相似的趋势,结合以上结果创建3 组特征,分别为:①电流相位平均值、有功功率、全球水平辐射和扩散水平辐射。②电流相位平均值、有功功率、全球水平辐射、扩散水平辐射、风速、温度和相对湿度。③电流相位平均值、有功功率、全球水平辐射、扩散水平辐射、风速、温度、相对湿度、风向和日降雨量。

下面基于3 组特征使用TCN-MHA 模型进行实验,实验结果见表2。

表2 各特征组合实验结果

结合表2 可以看出组合3 的预测效果最好,因此最终选择电流相位平均值、有功功率、全球水平辐射、扩散水平辐射、风速、温度、相对湿度、风向和日降雨量作为输入特征,将特征进行筛选有利于提升模型预测精度和训练速度。

2 预测模型

2.1 时间卷积神经网络(TCN)

TCN 由因果卷积、膨胀卷积及残差连接组成,不仅具有并行性、因果性等特点,还具有灵活的感受野,所以适合处理时间序列数据。图3 为TCN 中因果膨胀卷积示意图。

图3 TCN 中因果膨胀卷积

对于输入序列X=(x1,x2,…,xn),其中xi为列向量,i∈[1,n];过滤器F=(f1,f2,…,fK);下式给出x在t时刻的膨胀卷积计算公式

式中:d为膨胀系数;k为过滤器个数。卷积运算过程多数据可同时与卷积核做内积,加快模型处理数据的速度。TCN 感受野可以灵活调整,其大小可以根据卷积核尺寸Ksize、膨胀系数d及残差块数量Nstack进行调整。下式给出感受野的计算过程

式中:Σdi为残差块中堆叠的卷积层数。由于TCN 可灵活调整感受野,因此深层TCN 训练稳定性需要重视。深层网络容易出现梯度消失和梯度爆炸的问题而残差连接被证明是训练深层网络的有效方法。因此,研究者设计TCN 模型时,使用了一个残差块来代替一层卷积。一个残差块为经过一系列变换F的输出与块的输入相加,如式(4)

式中:O为残差块输出;Activation 为激活函数;x为残差块的输入;F为非线性变换。

综上所述TCN 网络适合处理时间序列数据,但TCN 在提取输入序列的多尺度时空特征及挖掘多步预测输出和固定输入之间的不同非线性映射关系方面面临困难[14],因此,基于TCN 构建深度学习混合模型可能会使预测精度进一步提升。

2.2 多头注意力机制(MHA)

给定相同的查询、键和值的集合时,若想要模型能基于相同注意力机制学习到不同的行为,然后将不同的行为组合起来,例如捕获序列内各种范围的依赖关系,那么允许注意力机制组合使用查询、键和值的不同的子空间表示是一种有效的方法。MHA 与使用单独的一个注意力池化不同,其可以独立学习得到h组不同的线性投影来变换查询、键和值;然后,h组变换后的查询、键和值将并行地进行注意力池化;最后,将这h个注意力池化的输出拼接在一起,通过另一个可学习线性投影进行变换,以产生最终输出。h个注意力池化输出中每一个输出都被称作一个头。图4 为多头注意力模型。

图4 多头注意力机制模型

用数学语言描述该模型:给定查询q∈Rdq,键k∈Rdk和值v∈Rdv,每个注意力头hi,i∈[1,…,h]的计算方法为

式中:wi(q),wi(k),wi(v)为可学习参数;f为注意力池化函数。多头注意力的输出需要经过另一个线性转换,对应h个头拼接结果,如式(6),其可学习参数是wo。基于这种设计,每个头可能会关注输入的不同部分,因此,MHA可表示比简单加权平均更复杂的函数。

2.3 所提模型TCN-MHA

所提模型由TCN、MHA 及全连接等部分组成。首先TCN 接收光伏数据后进行第一次的特征提取,调整感受野,以提取当前时刻光伏功率对多特征长期历史数据的依赖关系,同时TCN 中的残差块解决了梯度消失及梯度爆炸等问题。经过RepeatVector 层将TCN 提取到的特征信息进行复制以进行升维。之后输入MHA中,找寻不同维度下的相互依赖关系,使用缩放点积公式计算注意力,对特征信息赋权。经过Flatten 层融合特征信息进行降维。最后经过两层全连接,第一层结合以上信息,进行第二次特征提取,而后输入到第二层,经过第二层训练得到光伏功率预测序列。图5 为所提模型结构框图。

图5 TCN-MHA 模型结构框图

3 算例分析

3.1 算例介绍

本研究使用Tensorflow 深度学习框架。为验证所提模型的有效性,本研究将CNN、TCN 及CNN-LSTM作为对比模型。历史窗口长度为72,预测窗口长度为24,即用过去3 d 数据预测未来1 d 光伏功率。经调参确定各模型参数,具体见表3(未列出参数为默认值)。

表3 各模型参数设置

3.2 评估指标

为评估各模型预测性能,使用均方根误差(RMSE)和平均绝对误差(MAE)两种评估指标。其表达式见式(7)及式(8)

式中:yi为光伏功率实际值为光伏功率预测值,n为样本数量。两种评价指标均为回归任务中常用的评价指标。RMSE 放大了误差之间的差距,易受到极端值的影响,MAE 对异常值的敏感度较低,能较好地反映预测值与真实值之间误差的实际情况。

3.3 预测结果分析

各模型预测评价结果见表4。

表4 各模型评价结果

从表4 可以看出所提模型具有最佳预测精度,TCN的预测精度优于CNN。具体来讲所提模型相较于CNN,MAE 和RMSE 指标分别提升了8.79%及6.52%;相较于TCN,分别提升了3.95%及5.29%;相较于CNN-LSTM 分别提升了1.25%及2.05%。TCN 作为基于CNN 的模型,预测表现优于CNN,而深度学习混合模型CNN-LSTM 优于TCN,TCN-MHA 优于其他模型,可以看出合理的模型组合有利于提升模型预测精度。

各模型连续3 天功率预测曲线见如图6 所示。

图6 预测曲线

从图6 可以看出所提模型对光伏功率真实值曲线的拟合最优,其次是CNN-LSTM,TCN 优于CNN,该图直观地体现了各模型的预测效果。

4 结束语

本研究针对日前短期光伏功率预测建立了深度学习混合模型TCN-MHA。将数据通过滑动窗口后进行筛选;结合实验及相关性分析进行特征选择;使用TCN及MHA 提取数据特征并将输入的特征信息进行不同维度的空间映射,找寻不同维度下的相互依赖关系,进而使用全连接层充分学习,建立多特征输入与光伏功率的非线性映射,从而实现日前短期光伏功率的动态预测。最终通过实验证明了所提模型在本数据集中预测精度相较于CNN、TCN 及CNN-LSTM 均有提升。

猜你喜欢
残差注意力卷积
基于双向GRU与残差拟合的车辆跟驰建模
让注意力“飞”回来
基于3D-Winograd的快速卷积算法设计及FPGA实现
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
“扬眼”APP:让注意力“变现”
A Beautiful Way Of Looking At Things
平稳自相关过程的残差累积和控制图