风电功率超短期预测误差的非参数估计分布研究

2018-01-26 07:59茂,张
东北电力大学学报 2018年1期
关键词:电功率参数估计风电场

杨 茂,张 强

(东北电力大学 电气工程学院,吉林 吉林 132012)

随着风力发电的迅猛发展,全球装机容量逐年增加,大规模风电并网对电力系统的运行带来很大的影响[1].虽然风力发电具有波动性、不确定性等,但缩短时间尺度后,风电功率会有很强的规律性[2~4].

因此,有效地利用超短期风电预测可以减轻风电波动对大规模风电并网带来的影响.而风电功率预测误差的评价是风电功率预测的一项重要内容,风电功率预测误差的准确描述有助于提高系统运行的安全性和经济性[5].

近年来,国内很多学者开始研究预测误差的问题,其中正态分布的应用是最早的,它的峰度是固定的.大量的统计结果表明虽然风速的误差服从高斯分布,但是功率的曲线是非线性的,导致功率的误差不服从高斯分布,有一定的偏斜度,不关于坐标原点对称.文献[6]提出了混合偏态模型估计误差的分布,分析了实际风电功率预测的误差,得出不同出力时,误差分布呈现重尾、多峰等情况.文献[7]总结了超短期风电功率预测误差的存在形式,包括横向误差、纵向误差、影响因子等评价方法.文献[8]提出了预测误差的分段指数分布模型,通过曲线的拟合指标得出分段指数分布模型比传统误差分布模型的拟合精度高.文献[9]提出了一种基于预测误差分布特性的非参数不确定性区间的估计方法,对各功率区间内的预测误差概率密度函数进行建模,从而得出风电功率的预测值.

针对风电功率预测误差的问题,该文对风电功率进行超短期预测后,分析了风电功率超短期预测误差的概率密度拟合分布,同时研究了风电功率预测误差的非参数估计与预测方法、预测时间间隔、预测误差概率密度分布形态、风电场装机容量等关系.

1 预测误差的定量刻画

由于风电功率受到地形、地貌、天气及风电场运行状态等情形的影响,同时预测方法也很难完全准确的反映出风电场的输出功率,因此一定会有误差的存在[10].风电功率的预测误差可以分为纵向误差和横向误差,其中纵向误差描述了某一时刻预测结果在竖直方向与实际结果的差别,可能会出现偏大或者偏小的情形,横向误差描述了某一时刻预测结果在水平方向与实际结果的差别,可能会出现超前或者滞后的情形.纵向误差的单位是预测结果本身,横向误差的单位是时间[11].

通常将纵向误差的评价指标选为绝对值平均误差(Mean Absolute Error,MAE)eMAE和均方根误差(Root Mean Squared Error,RMSE)eRMSE,横向误差的评价指标选为皮尔逊积矩相关系数(Peaarson Product-Moment Correlation Coefficient,PPMCC)ICC.其中,纵向误差越小,拟合效果越好,横向误差越大,拟合效果越好[12].

(1)eMAE,该指标是对预测误差平均幅值的评价,定义式如下:

(1)

(2)eRMSE,该指标用来衡量误差的分散程度,定义式如下:

(2)

(3)ICC,该指标描述了数据间的相关程度,定义式如下:

(3)

式中:Y1为实测功率的随机变量;Y2为预测功率的随机变量;D为方差.

2 非参数估计分布

非参数估计是一种对假设检验和预测的有效手段,该方法克服了模型界定和参数估计有误带来的影响[13].非参数估计不需要提前假设方程的形式,而是基于数据结构来推测被测样本的回归曲线,以更灵活的方式估计被测样本[14].Cleveland和Devlin[15]提出了局部加权回归法,该方法利用非参数估计进行方程模拟和假设检验,其主要描述的是以周边点的属性对当前的点进行估计,在进行回归时,与被估计点的距离较近的点被赋予较大的权重.

假设,x1,x2,…,xm为风电功率预测误差的m个样本,那么风电功率预测误差的概率密度非参数核密度估计函数为:

(4)

式中:h为带宽,也称为平滑系数;K(·)为核函数.核函数需要满足以下条件:

(5)

式中:C为常数.

本文选择高斯核函数(Gaussian)作为风电功率预测误差概率密度估计的核函数,该函数表达式为:

(6)

3 数据预处理

风在流动的过程中会具有一定的惯性,不会骤然加快或减慢,但是在测出的风电功率中往往会存在与实际不相符的“坏点”,如果不及时将其剔除就会对预测模型的建立以及预测精度有很大影响.所以,建立预测模型之前先要对数据进行预处理.数据预处理的方法一般有:去除含有停机状态的点,把该组数据剔除,采用相邻风机正常数据的平均值进行替代;修改功率为负值的数据,当出现负值的情况时,将负值直接赋为零;去除高风速下低功率状态的点,当风速较大,输出功率较低时,可能是因为测量系统的误差,或者风机的尾流效应,一般将正常运行状态下的额定值代替该点的输出功率[16~19].

4 算例验证

本文以吉林省某风电场2015年7月的实测数据为例进行分析.该风电场装机容量为400.5 MW,风机为20台UP82/1500双馈型号风力发电机组,单台风机的额定容量为1 500 kW,数据采样间隔为15 min.整个风场7月份的实际风电功率如图1所示,横坐标代表每15 min采样一次,连续采样2976次,即31天,纵坐标代表对应时刻的输出功率,单位MW.

图1 某风电场7月份的实际功率图2 预测误差的拟合分布图

4.1 预测误差的拟合分布

由于大多数风电场的规模不是很大,误差的分布模型可能具有多种分布特征.实际误差序列及对应的概率密度分布如图2所示,三种分布模型的评价指标计算结果如表1所示.由图2可以看出,该分布属于不对称分布,有一定的偏度.由表1可以看出,采用非参数分布的拟合精度最高,误差偏差最小.因此,当误差分布不对称时,采用对称的误差拟合会降低拟合的精度,而非参数估计分布可以准确地描述实际误差分布.

表1 不同分布模型的拟合误差评价指标

4.2 不同预测方法的误差拟合分布

持续法是最简单的预测方法,在短期预测时准确率很高,所以将它作为参考和比较的对象.基于持续法、SVM、RVM三种预测方法下的三种误差拟合曲线的分布如图3(a)、图3(b)、图3(c)所示,三个不同风电场的三种拟合曲线的评价指标如表2a、表2b、表2c所示.其中,风电场1的装机容量为49.5 MW,风机数量为33台,海拔高程在172 m~190 m之间,占地面积100.3 km2;风电场2的装机容量为265.5 MW,风机数量为177台,海拔高程在124 m~145 m之间,占地面积126 km2;风电场3的装机容量为400.5 MW,风机数量为267台,海拔高程在143 m~151 m之间,占地面积152.3 km2.综合分析可以看出,不同预测方法的预测精度是不同的,RVM的准确率最高,SVM的准确率最低.将三种预测方法得到的预测误差分别采用非参数估计分布、正态分布以及t分布拟合后,都显示出非参数估计分布的拟合精度是最高的,能更好地描述出误差的分布特性.

图3 不同方法的预测误差的拟合分布图

预测方法准确率/%non-parametric相关系数/%normal相关系数/%t-location-scale相关系数/%持续法92.5899.2891.4293.76svm90.9398.1674.8374.82rvm93.1699.2997.2297.46

表2b 风电场2不同预测方法的拟合误差评价指标

表2c 风电场3不同预测方法的拟合误差评价指标

图4 时间间隔与拟合相关系数的关系

4.3 不同时间间隔的预测误差分布

时间间隔(15 min到120 min)与拟合相关系数的关系,如图4所示.时间间隔的分布模型拟合误差的评价指标,如表3所示.由图4可以看出,时间间隔在15 min到60 min之间时,拟合相关系数下降平缓,当时间间隔大于60 min时,拟合相关系数呈指数下降.由表3可以看出,随着时间间隔增加,拟合精度降低,平均绝对值误差和均方根误差增加.因此,当时间间隔越短时,拟合的效果越好.

表3 不同时间间隔的分布模型拟合误差评价指标

4.4 预测误差概率分布形态

为了研究所采用的分布模型能否较好地适用不同规模风电预测误差的分布特性,分别选取了不同风电场的预测误差为研究对象.风电场1、2、3的单峰有偏分布预测误差分布拟合如图5(a)、 图5(c)、 图5(e)所示,双峰有偏分布预测误差分布拟合如图5(b)、 图5(d)、 图5(f)所示,6种情况的评价指标计算结果如表4所示.6种情况形成以下两组对比:

(1)单峰分布与双峰分布对比

对比组为{a、b}、{c、d}、{e、f}.由对比曲线和表4的误差数据可以看出,单峰比双峰的拟合效果好.

(2)不同规模的分析对象对比

对比组为{a、c、e}、{b、d、f}.由对比曲线和表4的误差数据可以看出,该分布模型与风电场的规模联系不紧密.

根据以上对比分析可以得出,非参数估计分布模型对不同概率分布形态(单峰和双峰)、不同规模的风电场均能较好的拟合,其中概率分布为单峰时拟合效果更好.

图5 不同风电场的拟合误差分布图

风电场相关系数/%eMAE/%eRMAE/%a97.627.1317.03b95.2411.3122.45c99.601.851.53d98.965.474.37e98.066.2110.05f97.737.3517.74

5 结 论

本文提出了超短期风电功率预测误差的分布模型,该模型对风电功率预测误差提供了很大价值.以吉林省某风电场的实测数据为例进行了算例分析,得出到以下结论:

(1)当分布为不对称分布,有一定偏度时,采用非参数估计分布模型可以很好的拟合误差;

(2)预测方法对误差的拟合精度影响较小;

(3)预测的时间间隔对拟合效果有影响,当时间间隔越短时,误差的拟合效果越好;

(4)非参数估计分布模型对不同概率分布形态、不同规模的风电场均能较好的拟合,概率密度分布为单峰时拟合效果更好.

[1] 杨茂,季本明.基于局域一阶加权法的风电功率超短期预测研究[J].东北电力大学学报,2015,35(5):6-10.

[2] 杨茂,孙涌,孙兆键,等.风电场大规模数据管理系统设计与研发[J].东北电力大学学报,2014,34(2):27-31.

[3] 杨德友,蔡国伟.基于因散经验模式分解与最小二乘支持向量机的风电场短期风速预测[J].东北电力大学学报,2015,35(3):44-49.

[4] 杨茂,吕天峰,季本明.混沌理论在电力系统负荷预测中应用综述[J].东北电力大学学报,2015,35(3):18-21.

[5] 王彩霞,鲁宗相.风电功率预测信息在日前机组组合中的应用[J].电力系统自动化,2011,35(7):13-18.

[6] 刘燕华,李伟花,刘冲,等.短期风电功率预测误差的混合偏态分布模型[J].中国电机工程学报,2015,35(10):2375-2382.

[7] 徐曼,乔颖,鲁宗相.短期风电功率预测误差综合评价方法[J].电力系统自动化,2011,35(12):20-26.

[8] 刘芳,潘毅,刘辉,等.风电功率预测误差分段指数分布模型[J].电力系统自动化,2013,37(18):14-19.

[9] 周松林,茆美琴,苏建徽.风电功率短期预测及非参数区间估计[J].中国电机工程学报,2011,31(25):10-16.

[10] The state-of-the-art in short-term prediction of local wind conditions[J].Journal of Wind Engineering and Industrial Aerodynamics,2001,89(3/4):235-245.

[11] 刘立阳,吴军基,孟绍良.短期风电功率预测误差分布研究[J].电力系统保护与控制,2013,41(12):65-70.

[12] 叶林,任成,赵永宁,等.超短期风电功率预测误差数值特性分层分析方法[J].中国电机工程学报,2016,36(3):692-700.

[13] 牛君.基于非参数密度估计点样本分析建模的应用研究[D].济南:山东大学,2007.

[14] 任荣荣,郑思齐,王铁军.基于非参数估计方法的土地价格空间分布拟合与分析[J].清华大学学报,2009,49(3):325-328.

[15] W.S.Cleveland,S.J.Devlin.Locally weighted regression:An approach to regression analysis by local fitting[J].Journal of the American Statistical Association,1988,83(403):596-610.

[16] 宋薇.大规模风电场超短期风电功率预测的误差分析与评价[D].吉林:东北电力大学,2013.

[17] 刘波,贺志佳,金昊.风力发电现状与发展趋势[J].东北电力大学学报,2016,36(2):7-13.

[18] 杨茂,黄宾阳,江博,.基于卡尔曼滤波和支持向量机的风电功率实时预测研究[J].东北电力大学学报,2017,37(2):45-51.

[19] 杨茂,杨春霖.基于模糊粒计算的风电功率实时预测研究[J].东北电力大学学报,2017,35(5):1-7.

猜你喜欢
电功率参数估计风电场
基于PCC-CNN-GRU的短期风电功率预测
基于新型DFrFT的LFM信号参数估计算法
轻松上手电功率
你会计算电功率吗
解读电功率
基于PSS/E的风电场建模与动态分析
Logistic回归模型的几乎无偏两参数估计
基于向前方程的平稳分布参数估计
基于竞争失效数据的Lindley分布参数估计
含风电场电力系统的潮流计算