风电功率预测的数据预处理研究

2021-09-29 14:45沈阳工程学院寇金驰许傲然刘宝良
电子世界 2021年14期
关键词:电功率风向风电场

沈阳工程学院 寇金驰 高 阳 许傲然 刘宝良

天气是风电等可再生能源的主要驱动器,但同时也让预测风电功率值、运营、交易和平衡可再生能源面临最大的不确定性风险。根据在风电预测过程中需要的各类数据的箱线图可以分析出风速、风向、温度、湿度、气压等数据的数值区间和变化范围,可以得出风电场所在地是否处在风口位置,此处是否时常发生强对流天气等信息。同时,在箱线图中也会观察到一些数据的异常值,比如在温度的箱线图中,有的数据显示为-273K,达到了绝对零度,这是绝对不可能的现象,同样的还有在高海拔地区收集到接近于0Pa的气压值,这些数据表明,在风电功率预测数据收集过程中存在一定数量的异常值,类似的NWP数据的异常值可能由于仪器故障或者偶发的气旋等因素产生。考虑到NWP气象数据、测风塔收集到的数据和风电场的实际功率数据往往质量不高,给风电功率预测带来了极大的难度。因此分别对NWP数据、测风塔数据和实际功率数据首先进行“去重处理”,然后进行数据的完整性检验和处理及合理性的检验和处理,进而通过对比(以风速数据为例)处理后的数据与功率值的关系散点图和处理前数据的关系散点图得出,处理后的数据精度大大提高,为风电功率预测提供了良好的数据支持。

1 原始数据的重复行检验和处理

对原始数据根据时间进行重复数据检验,主要检验行的重复,即去重处理;保证处理后无重复行数据。

2 NWP数据的预处理

2.1 缺失数据的检验和处理

数据的时间顺序应符合预期的开始、结束时间,中间应连续。检验和处理方案:通过配置文件读取开始时间和结束时间,将所有时间数据按这个区间排序,设置当时间不连续时,对时间数据进行插补的时间间隔为15min,用下一时刻和上一时刻的时间相减,若超过设置的时间间隔(15min),则对时间进行插补,否则不用插补。在进行时间数据插补时,首先检验待插补的时间间隔是否是15min的倍数,如果是15min的倍数,则按每15min一个插值进行插补;反之,则计算时间差的余数,若余数小于3min,使用上一时刻的时间值,若余数大于等于3min,使用下一时刻的时间值。比如:时间差为0:17:0,对15取余数,余数为2,故将该条数据的时间变为0:15:0,然后再进行插补。在对时间数据进行插补后,将插补的部分和不需插补的部分进行合并,保证在时间上是连续完整的一份数据。

在保证时间数据是完整连续的前提下,对其他缺失数据的字段主要关注:温度、10m风向、30m风向、100m风向、170m风向、地表风向、10m风速、30m风速、100m风速、170m风速、地表风速、湿度、地表气压针对于时间插补过的如上这些字段的数据,要进行插补。

若数据缺失,缺失数据应以前后相邻15min的数据进行插补,具体规则为:

(1)若同时拥有前后相邻15min的数据,取前后两点数据的平均值进行插补。

(2)若只有前面/后面相邻15min的数据,则用前面/后面相邻的数据进行插补。

(3)若同时没有前,后相邻15min的数据,则用前一天同一时刻的数据进行插补。

2.2 数据的合理性检验和处理

对风电功率预测的NWP数据的离群值采用“四分位法”进行检验和处理。

四分位法:将一组数据从小到大排列并平均分成4份,其中每份数据各占总数据的25%。将Q1称为下四分位数;Q2称为中位数;Q3称为上四分位数,其中:总数据中的1/4数据的值小于Q1,1/4的数据大于Q3,Q1与Q3之差为四分位数间距IQR。

由间距IQR能得出数据异常值的范围,其中超出异常值内限[D1,Du]的数据将被剔除,内限范围的计算式如下:

所有不在[Q1-1.5IQR,Q3+1.5IQR]区间内的值为离群值。

对NWP的温度、风向、风速、湿度和气压数据分别进行离群值的检验和处理,如果数据为离群值,处理方法如下:

(1)小于等于Q1-1.5IQR的值,用Q1-1.5IQR的值进行替换。

(2)大于等于Q3+1.5IQR的值,用Q3+1.5IQR替换。

2.3 NWP数据的越限值处理

对于NWP的越限数据应以前后相邻15min的数据进行插补,插补规则为:

如果前后相邻15min的数据都有,取前后两点的平均值,进行插补;如果有前面相邻15min的数据,用前面相邻的数据进行插补;如果有后面相邻15min的数据,用后面相邻的数据进行插补。如果(1)不满足条件,用下面的方式处理:

用前一天同时刻的数据进行插补

用上一年同时刻的数据进行插补

对清洗后的NWP数据基于时间进行整体排序,确保每15min的数据是完整的连续值。

3 对测风塔的数据进行预处理

在对测风塔的数据进行预处理时,要先对测风塔的数据基于时间的完整排列进行数据的插补,与NWP数据的处理方式类似,只是对时间的分辨率设置为5min,首先将测风塔测出的风速和风向数据按时间进行排序,下一时刻与上一时刻进行相减,如果超过设置时间(5min),计算时间差的余数,若余数小于3min,按照上一时刻的数据进行插补,若余数大于3min,则按照下一时刻的数据进行插补。

然后对测风塔的风速及风向等数据进行缺失值的检验和处理,以风速数据为例:首先,计算不同高度风速值之间的斯皮尔曼相关性系数,具体计算公式如下:

继而结合不同高度处风速数据的箱线图对风速缺失值进行处理,由箱线图可知,测风塔的风速数据随着高度的升高,风速值增大,因此具体的处理方式如下:

(1)当低处的风速数据缺失时,在高处的风速数据中,查找与低处的风速数据相关系数最大的位置的风速数据乘以相关性系数,作为低处风速数据的替代值。

(2)当高处的风速数据缺失时,在低处的风速数据中,查找与高处的风速数据相关性系数最大的未知的风速数据除以相关性系数,作为高处风速数据的替代值。

对测风塔测到的风向数据的缺失值处理方法与风速数据的处理方法类似,结合不同高度处风向数据的箱线图可知,不同高度处风向数据的变化范围不大,因此,具体处理方式如下为:只需查找与缺失高度处的风向值相关性系数最大的高度处的风向值,将此风向数据乘以相关性系数,作为缺失风向值的替代值。

4 风电场实际功率数据的预处理

对风电场实际功率同样用“四分位法”进行数据的异常值检验和处理,对实际功率限值检验和处理的方式是依据风电场装机容量的限值来处理,具体方法为:小于实际功率的最小值(即0值),用0值进行替换;大于实际功率的上限值,用风电场的装机容量值进行替换。

5 数据预处理后的检验

将东北地区该风电场一年的NWP数据、测风塔数据及实际功率数据进行预处理后,与处理前的数据进行对比,以风速数据为例,数据处理前的风速-功率散点图如图1所示。

图1 数据处理前的风速-功率关系散点图

由图1可知,风速数据预处理前存在着大量的异常值和缺失值,为准确的风电功率预测增加了极大地难度。对风速数据处理之后,风速-功率关系的散点图如图2所示。

图2 数据处理后的风速-功率关系散点图

通过对比散点图1和图2,可以清晰地看出,经过数据预处理后,风速的缺失值和异常值大量的减少,风速-功率关系呈现的比较清晰。说明此时经处理过后的数据质量较好,可以为风电功率的准确预测提供很好的前期数据支持。

结论:本文为了实现风电功率的准确预测,分别对NWP数据、测风塔数据及风电场的实际功率数据进行数据预处理,通过处理前后的数据(以风速数据为例),验证了经数据预处理后获得的数据质量较好,可以为风电功率的精准预测提供较好的数据支持。

猜你喜欢
电功率风向风电场
基于PCC-CNN-GRU的短期风电功率预测
轻松上手电功率
你会计算电功率吗
解读电功率
逆风歌
基于PSS/E的风电场建模与动态分析
CeMAT Asia 2017:聚焦“智慧物流”引领行业风向
含风电场电力系统的潮流计算
行业统计带来哪些风向?
含大型风电场的弱同步电网协调控制策略