风电机组功率曲线建模方法对比研究

2021-11-17 04:31李宗琪
计算机仿真 2021年2期
关键词:曲线拟合风速风机

梁 涛,崔 洁,石 欢,李宗琪

(河北工业大学,天津 300131)

1 引言

在过去十几年里,人们对可再生能源的利用给予了高度的重视,其中风能的装机容量最大,成为占比最高的可再生能源[1]。风电机组功率曲线可以为风电机组故障诊断、功率预测等工作提供一定的理论依据。然而由于制作商提供的功率曲线都是在特定的测试环境下给出的,不同风电场所处的地理环境不同,即使是同一风场内的风机也会因为风机的分布位置不同和尾流效应等因素而使每台风机的功率曲线都不尽相同[2]。为了更实际的了解风机性能,需要对风电机组功率曲线进行拟合。

在风机实测数据中,往往含有大量异常数据点,若不将这些异常点剔除将严重影响曲线拟合效果。剔除异常点通常采用的方法包括:四分位数法、k-means聚类法和基于密度聚类[3]的方法。其中,四分位数法检测异常点的效果不稳定,会出现漏检的现象;k-means聚类算法初始值的确定对聚类结果有很大影响且只适用于凸数据集;基于密度聚类的方法对样本分布不均匀的数据集通常不能得到很好的效果。

曲线拟合方法主要分为两类:参数法和非参数法。参数法是以数学模型为基础的,求出模型的各个参数就能确定该模型,如:分段线性回归拟合法、多项式回归拟合法[4]、基于概率分布模型的曲线拟合法等。参数模型的优点是推理过程易于理解,便于计算。但在数据结构复杂的情况下,参数模型的拟合效果往往不如非参数模型。非参数化方法不会预先指定函数模型,而是从数据本身获得所需要的信息,适应能力强,效果较稳定。常用的非参数模型主要包括:神经网络、模糊逻辑方法等。

本文大体分为异常点剔除、曲线拟合和效果评估三个步骤。由于本研究的数据是稠密均匀的,采用带噪声应用的密度空间聚类 (Density-Based Spatial Clustering of Applications with Noise,DBSCAN)算法对原始数据集进行聚类分析,剔除异常数据点,然后以多项式回归曲线拟合法作为基准模型,对其余三种回归模型展开了讨论分析,并将它们应用于SCADA系统记录的实测数据中,最后从拟合精度方面对四种模型的拟合效果进行评价。

2 异常数据点的筛选与剔除

图1为河北某风电场SCADA系统记录的16号风机从2018年1月1日至2018年1月30日期间共4320对数据的风速-功率散点图,由图可见,从风电场采集到的数据中含有很多异常点,这些异常点会对功率曲线的建模精度产生很大影响。

图1 风速-功率散点数据图

DBSCAN是一种基于密度的聚类算法,数据点密集的区域代表了风机运行的基准状态。DBSCAN通过半径参数Eps和邻域密度阈值MinPts来描述样本分布的紧密程度。采用文献[5]中的经验数值,取邻域密度阈值为4,半径参数的值通过绘制k-距离曲线方法得到,k-距离曲线图明显拐点位置为对应的较好参数。剔除异常点之后的散点图如图2。

图2 剔除异常点后的散点图

3 功率曲线建模

曲线建模方法主要分为参数法和非参数法,到目前为止,没有哪一种建模方法能够在任何数据情况下都表现出最优的拟合效果[6]。研究不同的功率曲线建模方法,并确定一种可以为该种类型的数据集带来最好建模效果的方法是十分有必要的。

3.1 多项式曲线拟合法

多项式曲线拟合已被广泛应用于风力发电机组功率曲线建模技术中,其原理是用多项式函数的形式来描绘一个区域内所有观测点散点分布的大致走向,展开系数由最小二乘法确定。设函数的k阶多项式为

P=Vβ+ε

(1)

其中

P=(p1,p2,…,pN)T,β=(β1,β2,…,βk)T,

(2)

应用最小二乘法确定多项式系数得:

β=(VTV)-1VTP

(3)

采用经验法确定的多项式阶数会严重影响拟合精度,为了获得最佳拟合效果,通过误差评价指标来确定拟合阶数。由图3的运行结果可知,当阶数为12时获得的拟合效果最好。多项式拟合功率曲线散点图的效果如图4。

图3 阶数选择结果图

图4 多项式拟合风速-功率曲线

3.2 局部加权多项式拟合

多项式曲线拟合法受异常点的影响较大,尤其是在切入风速和切出风速附近,拟合效果欠佳。为了减弱异常点对拟合效果的影响,采用局部加权多项式方法对散点进行拟合。局部加权多项式法属于非参数法,对于每一个需要预测的点,都要重新根据整个数据集计算模型,使得数据本身适应性较好,拟合精度更高,但计算量较大,训练时间较长。

局部加权多项式拟合在特定目标点v0建立模型:

J(β)=arg min(P-Vβ)TWs(v0)(P-Vβ)

(4)

得系数矩阵为:

β=(VTWs(v0)V)-1VTWs(v0)P

(5)

其中Ws(v0)是权值系数矩阵,采用高斯核函数作为平滑核函数计算权值系数阵。局部加权多项式法拟合的功率曲线如图5。

图5 局部加权多项式拟合风速-功率曲线

通过对比图4和图5的拟合曲线可以发现,在切入风速和切出风速附近,局部加权多项式拟合法比多项式拟合法表现出了更好的性能。

3.3 三次样条拟合

虽然局部加权多项式拟合法能拟合出功率曲线模型的大致形状,但从图5可以看出,局部加权多项式法在拐点处的拟合效果欠佳,从而无法得到风速与功率之间非线性关系的理想近似值。样条拟合实际是采用分段拟合的原则,在邻近的两个节点之间用低阶多项式来拟合该段散点,并且要在这些节点两端保证一定的连续性使曲线光滑,从而用低阶的样条插值产生和高阶多项式拟合类似的效果,在曲线拐点附近拟合效果良好。

最常用的样条拟合法是三次样条曲线拟合法,假设在区间[a,b]上有a=x0

1)B(x)在区间[a,b]上有连续的一阶和二阶连续导数;

2)B(x)在每一个小区间[xi,xi+1] (i=0,…,n-1)上都是不高于三次的多项式。则称B(x)是以x为节点的三次样条函数。B(x)在某一节点处的函数为

Bi(x)=ai+bi(x-xi)+ci(x-xi)2+di(x-xi)3

(6)

由定义的约束条件可得

(7)

计算出

(8)

其中

hi=xi+1-xi,Di=B″(xi)(i=1,2,…,n)

(9)

在自由边界条件下,即D0=Dn=0时,将(8)带入式(7)得式(10)

(10)

解矩阵方程可得D0=D1=Dn,即可得B(x)函数表达式。图6显示了在使用5个和10个等距节点时,由16号风机数据建立的三次样条拟合模型。由于样条拟合通过增加节数而引入了灵活性,所以三次样条拟合在平稳性和适应性方面优于多项式拟合。

图6 三次样条法拟合风速-功率曲线

3.4 三次B样条

由图6可以看出,三次样条拟合法在曲线弯曲部分可以提供良好的拟合效果,保证了曲线的光滑性,但对于直线段的拟合效果不好,在三次样条拟合的基础上引入B样条函数。B样条函数的最大优点就是具有局部性,即改变某一个控制点的位置只会对相邻曲线段的拟合效果产生影响而不会影响整条曲线,因此采用三次B样条拟合可以对曲线进行小范围调整以提高拟合精度。

p次B样条曲线方程为:

(11)

其中Pi(i=0,1,…,n)为可以改变曲线形状的控制点,u=[u0,u1,…,um]为节点矢量,Ni,p(u) (i=0,1,…,n)为p次B样条基函数,通常由节点矢量根据Cox-deBoor递推式(12)得出:

(12)

由此,三次B样条曲线方程为

(13)

在计算准均匀三次B样条曲线时会使曲线的首末端点与首末型值点相对应,内部型值点依序作为拟合曲线的分段点,则由型值点qi(i=0,1,…,n)拟合出来的曲线共有n段,需要的控制点Pj(j=0,1,…,n+2)共有n+3个,节点矢量为u=[u0,u1,…,un+6],为确定型值点对应的三次B样条基函数,采用向心参数化方法计算各段所对应的节点为

u0=u1=u2=u3=0,

un+3=un+4=un+5=un+6=1

(14)

将式(14)带入式(12)即可得出三次B样条基函数。

由位于曲线上的的型值点和三次B样条基函数即可反求出所需的各个控制点,由(13)即可拟合出所需的风速功率曲线。

准均匀三次B样条拟合法通过10个型值点拟合出的风速-功率曲线如图7。

图7 三次B样条曲线拟合

4 模型性能评估

图8为四种曲线拟合方法得到的风速-功率曲线。

图8 四种功率曲线对比

由于风电机组风速-功率的散点图呈带状分布,各个散点与拟合出的曲线之间存在一定的距离[7],为了评估各个模型拟合曲线的能力,本文选用MAE(平均绝对误差)、RMSE(均方根误差)和R2(R平方)来评价模型精度。

(15)

(16)

(17)

为了更准确的反映各种方法的曲线拟合能力,根据风电场风机位置分布图分别选取距离16号风机近的23号风机和距离较远的7号风机对拟合效果进行验证,对两台风机同样选取从2018年1月1日至2018年1月30日期间共4320对数据进行散点图的拟合。各建模方法的误差计算结果见表1。

表1 各建模方法误差计算结果

5 结论

考虑到风电机组功率曲线的精确建模对于风电机组状态监测及功率预测有着重要的意义,本文提出了四种估算风电机组功率曲线的参数和非参数模型,以多项式拟合法为基准展开讨论。多项式拟合法受异常点影响较大,若想获得较高的拟合精度必须采用高阶多项式进行拟合,但阶数过高容易产生过拟合的现象,由此,引入了局部加权拟合法。局部加权拟合法受异常点的影响较小,可以大致拟合出曲线轮廓,但在曲线拐点处拟合效果欠佳。三次样条拟合法通过增加一系列节点来引入灵活性,克服了局部加权拟合法的缺点而对直线段的拟合容易产生较大波动。最后,提出了三次B样条曲线拟合法,它即保留了三次样条的优点又克服了其缺点。

本文选取三台风力发电机对所提出的方法进行了性能分析,使用四种误差评价指标来评估每种方法的准确性。研究结果表明,与其它分析方法相比,三次B样条拟合法具有更好的性能。

猜你喜欢
曲线拟合风速风机
轴流冷却风机电机频繁烧毁的处理过程及原因分析
基于自升式平台的某海上风电场风机安装施工方案
船舶风机选型研究分析
2006—2016年平凉市风速变化特征分析
原州区近30年风的气候变化特征分析
曲线拟合的方法
风速概率分布对风电齿轮
基于车道投影特征的弯道识别算法研究
《函数》测试题
应用曲线拟合法优化油井合理沉没度