一种滑动窗口检验的稳态检测方法

2021-11-19 11:12李劲松
计算机仿真 2021年10期
关键词:稳态滑动分量

李劲松,董 泽,马 宁,3

(1.河北国华定州发电有限责任公司,河北 定州 073000;2.华北电力大学河北省发电过程仿真与优化控制技术创新中心,河北 保定 071003;3.华北电力科学研究院有限责任公司,北京 100045)

1 引言

近年来,随着大数据和人工智能等信息化技术在工业领域得以实现。在火力发电领域,基于数据驱动的系统建模[1],过程监测[2]和性能评估[3]被广泛研究与应用,这些方法的基础是获取电站稳态工况下的数据。然而,由于自动发电控制(AGC)调度指令和电站燃煤质量变化的影响,电站很多系统经常处于波动状态,这使得电站存储的历史数据中含有大量的非稳态数据,因此,研究如何从海量数据中快速、有效地筛选出稳态数据具有重要的理论与应用价值。

基于电站历史数据的稳态筛选方法可不需考虑过程变量的机理特性,也避免了由传统正交试验获得稳态数据导致时间和财力的消耗。目前,国内外诸多学者对稳态检测方法进行了研究。Cao[4]等人提出了利用数据滤波前后的估计方差的比值判断当前数据是否处于稳态的R检验法,并分析了不同滤波系数和判定阈值之间的关系。针对R检验法,近年来一些学者提出了不同的改进策略[5-6],然而,R检验法容易受到滤波参数和判定阈值的影响,且只适用于幅度变化缓慢的数据,难以对电站中参数变量幅值变化较快的数据进行稳态检测。Korbel等[7]利用小波变换对数据进行异常值检测及去噪处理,并通过小波变换后的数据确定稳定数据段的起止点,为数据稳态检测提供了一个新思路。陈世和等人[8]通过计算单一变量数据变化的速度以及加速度来获得稳态指数,再对多个变量加权得到综合稳态指标判断电站锅炉是否处于稳态。此外,还有基于趋势判断[9],多项式拟合[10],聚类[11]等稳态检测方法。以上检测方法在丰富稳态检测方法理论的同时,也取得了良好的实际应用效果,但是也存在着参数难以确定等局限性。

基于以上的研究,考虑到电站数据因仪表安装环境和位置因素影响导致含有大量噪声,干扰稳态检测精度,本文将基于信号分解与能量结合的去噪算法引入到电站数据稳态检测中,并提出一种自适应确定滑动窗口长度和检测阈值策略,并用于火电厂历史数据稳态检测。

2 信号分解去噪算法

2.1 经验模态分解原理

经验模态分解(EMD)[12]理论思想是认为信号都是由若干独立的固有模态函数(IMF)序列组成,经验模态分解步骤如下:

1)根据极大值点和极小值点获得其上下包络线p(t)和q(t),并计算均值

(1)

2)计算差值f1(t)

f1(t)=x(t)-m(t)

(2)

3)计算为第一阶固态分量IMF1

c1(t)=f1(t)

(3)

计算一阶残余项r1(t)

r1(t)=x(t)-c1(t)

(4)

4)通过对r1(t)进行重复分解,得到若干固态分量,最终的分解结果为

(5)

虽然EMD在很多领域得到应用,但其也存在着容易产生模态混叠问题,对此,Wu等[13]人提出了集合经验模态分解(EEMD)方法,该方法通过引入高斯白噪声扰动并对经过多次EMD分解的模态函数求取平均值,避免了模态混叠问题。

2.2 能量去噪理论

Frandrin提出了一种能量去噪法与EMD相结合的滤波算法[14],其核心思想为,对于信号中的白噪声,若将分解后的首个模态分量作为噪声信号,则第i个噪声模态分量的功率频谱呈自相似性,即第i个噪声分量能量的半对数log2W[i]随着i的增大而减少,能量W[i]的估计值为

W[k]=Cρ-i(i≥2)

(6)

式中

C=W[1]/β

(7)

ρ=2.01+0.2(H-0.5)+0.12(H-0.5)2

(8)

其中,H为判断时间序列是否为随机游走的指标。当估计的相对应的模态分量在置信区间95%至99%,时,即95%Wi

(9)

通常在95%置信区间内β为0.719,ρ为2.449;在99%置信区间内β为0.719,ρ为1.919。

2.3 EEMD能量去噪算法步骤

为了将噪声信号D(n)从原始信号X(n)中去除,选择分解后第一个固有模态分量作为估计的第一个噪声IMF分量,其能量E1[n]等于W[1],并基于此估计其它噪声分量的能量值W[k],若W[k]与各模态分量能量Ei[n]满足一定关系,则可认为该模态分量仅含有噪声成分。基于以上理论,EEMD与能量结合的去噪算法步骤如下:

1)对原始信号X(n)进行EEMD分解,得到k个模态分量IMF1-IMFk,并根据式(9)计算各模态分量能量Ei[n],(i=1,2,…,k);

2)令W[1]=E1[n],参数按95%置信区间和99%置信区间相关参数计算得到噪声分量95%Wk和99%Wk。

4)对噪声信号求和

(10)

5)获得去噪后的信号x(n)=X(n)-D(n).

3 滑动窗口稳态检测算法

3.1 滑动窗口原理

提出一种基于滑动窗口快速筛选大规模数据稳态工况的数据筛选方法,该方法以包括一段数据的滑动窗口作为对稳态数据判断的最小单元,此窗口每向前滑动一次,都会有一个新的数据进入到滑动窗口内,同时有一个旧数据滑出,计算窗口内数据的标准差并与给定阈值比较,若小于阈值,则将窗口内数据记为稳态数据,假设窗口的长度为p,则窗口数据平均值、方差和标准差的表达式为

(11)

(12)

(13)

(14)

k时刻的滑动窗口内的数据方差值为

(15)

展开得

(16)

k+1时刻,方差为

(17)

方差递推公式为

(18)

标准差递推公式为

(19)

3.2 参数选择

窗口长度和阈值是影响该算法性能的两个主要因素,当窗口长度太小,则在滑动过程中窗口的平均值,标准差受新数据影响较大,不利于判断数据整体趋势;当窗口长度太大,则会导致算法对数据点的变化不敏感;标准差阈值Sd是判断数据是否处于稳态的关键参数,为此,利用一段具有稳态与非稳态标签的历史数据作为辨识样本对窗口长度和标准差阈值进行辨识,辨识原理如图1所示,图中的目标函数为滑动窗口法筛选出的稳态数据、非稳态数据与标记数据的误差值,每当筛选结果与标记结果不同,最终选取目标值最小时的窗口长度和阈值。

图1 滑动窗口参数辨识原理示意图

4 电站历史数据稳态检测

为了检验所提稳态数据筛选方法的有效性,本文利用某火电厂1000MW超超临界机组的总风量历史数据进行稳态筛选验证。选取5000个历史数据点,由于总风量数据不可避免地存在着一定程度的噪声,这些噪声会对以统计理论为基础的稳态检测方法造成干扰,所以需要采用EEMD与能量去噪结合的方法对历史总风量数据进行去噪处理,去噪后的数据如图2所示。

图2 去噪后的1000MW机组总风量历史数据

选取去噪后的前1000个数据作为参数辨识样本,并人为标注该段数据的状态,即稳态或是非稳态数据。图3(a)为1000个辨识样本,图6(b)表示的是样本状态,当状态标志量为1时,则所对应的数据为稳态数据,当标志量为0时,所对应的数据为非稳态数据。

图3 辨识样本及样本状态标识

利用滑动窗口法对1000个辨识样本进行稳态筛选。设每个样本的状态标记量为Si(i=1,2,…,1000),即Si=1时,表示为稳态,Si=0时,为非稳态。滑动窗口法检测的结果为Si’,则参数辨识的目标函数为,

(20)

由上式可以看出,目标值J越小,检测结果越接近于标记值,当J达到最小时其对应的滑动窗口参数即为最优滑动窗口参数。通过网格搜索方法寻优,当滑动窗口长度p为35阈值Sd为9时,目标值J最小,所以此组参数为稳态数据筛选的最优参数。

图4为1000MW机组总风量数据稳态筛选结果,其中(a)图为总风量经过EEMD与能量结合去噪后的数据和筛选出的稳态数据;(b)图为每个采样点经稳态检测算法确定的状态标志量。从图中可以看到,本文提出的稳态检测算法可以有效地检测出总风量历史数据中的稳态部分。算法对于稳态数据与非稳态数据边界点识别的准确程度也可从图中多处数据突变的检测结果得以证实。以上实验结果验证了本文提出的稳态检测方法的有效性和高效性。

5 结论

1)针对电站数据存在较大噪声干扰的问题,利用集合经验模态分解与能量结合的去噪算法进行数据去噪处理,并采用滑动窗口法进行稳态检测,其中,通过标记数据状态的辨识样本确定滑动窗口的长度以及阈值大小。

2)以某电站1000MW机组总风量历史数据为测试对象,利用所提算法进行稳态数据筛选,实验结果表明,该稳态检测算法可以从数据波动幅度较大数据中准确筛选出稳态数据,且具有耗时小的特点,可用于在电站海量历史数据中快速筛选出用于数据建模及控制的稳态数据。

3)所提出的稳态检测方法主要针对与电站单一变量的稳态数据筛选,而对于电站某个特定系统多变量稳态筛选往往会涉及到各变量之间的相关性以及系统的整体特性,因此系统的稳态检测会更加复杂,这也是进一步的研究方向。

猜你喜欢
稳态滑动分量
组蛋白甲基化修饰复合物COMPASS成员Ash2l通过调控神经祖细胞稳态影响小鼠大脑皮层发育
直冷双馈风力发电机稳态温度场分析
隔舌安放角对旋流泵内非稳态流动特性的影响
一维有界区域上单稳态方程多重正解的存在性
画里有话
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
论《哈姆雷特》中良心的分量
一种动态足球射门训练器
关于滑动变阻器的规格问题