IGMM结合区间统计的机械故障预警方法研究

2024-01-26 09:18苏方健刘文才
机械设计与制造 2024年1期
关键词:高维区间预警

苏方健,刘文才,马 波,3

(1.北京化工大学机电工程学院,北京 100029;2.中国石油天然气股份有限公司安全环保技术研究院,北京 102206;3.北京化工大学高端机械装备健康监控及自愈化北京市重点实验室,北京 100029)

1 引言

机械日渐趋向大型化和复杂化发展,一旦出现故障,将给企业带来巨大的经济损失[1]。企业为保障生产安全,通常采用单特征门限报警法进行机械故障预警[2],由于机械通常处于恶劣的工作环境且连续运转,单特征指标难以全面、准确表征机械的运行状态,误、漏报警事件时有发生[3]。

为解决上述问题,文献[4]利用机械振动的频域信号训练人工神经网络,实现自适应提取机械的状态特征并基此实现及故障预警;文献[5]将支持向量机应用于风电机组故障预警。以上两方法的有效性需大量故障样本作支撑,然而实际故障样本稀缺。针对该问题,文献[6]提出一种机械故障深度迁移方法,通过将试验累计的故障知识迁移用于工程实际,降低了对实际故障样本的需求量,但该方法在现阶段对机械运行状态的识别精度较低。文献[7]将变分自编码器应用于机械故障预警,该方法在预警时须用实时样本不断训练变分编码器,由于训练过程计算复杂,存在预警时效性较差的问题。如何在脱离故障样本的条件下进一步提高预警的准确率、时效性,具有重要研究意义。

无限高斯混合模型(IGMM,Infinite Gaussian Mixture Model)作为一种概率统计建模工具,能够根据样本自适应调整自身模型参数的数量,具备较强的表征能力[8]。在机械故障早期,激励信号在其叠加形成的振动信号中异常体现不明显,利用IGMM表征机械健康状态下各激励信号的统计特性,进而为识别机械的早期故障提供有效手段。

基于上述分析,将IGMM、区间统计应用于机械故障预警中,其先将机械振动信号映射至高维特征空间,通过利用IGMM对高维特征空间建立概率统计模型,实现对机械健康状态的准确表征。为保障预警时效性,对高维特征空间进行区间划分,统计出机械实时状态下高维特征空间在各区间的频数分布,并与机械在健康状态下的频数分布计算距离,将该距离与自学习得出的预警阈值作比较,以实现机械故障预警。

2 理论基础

2.1 无限高斯混合模型

当高斯混合模型的参数集具有先验分布且这些先验分布是从狄利克雷过程(DP,Dirichlet Process)中产生时,则称该高斯混合模型为IGMM。IGMM概率密度函数,如式(1)所示。

这里采用截棍式构造法间接构造DP,基此生成参数集Θ、π[9]。IGMM 依据式(2)确定自身模型参数的数量并生成各子成分。

式中:Mult(⋅)—多项式分布;Z-Z=,训练IGMM时z中zn互不重复的数量即IGMM依据X产生子成分的数量。

2.2 无限高斯混合模型的参数估计方法

变分贝叶斯推断是一种求解快速并具有较高计算精度的参数估计方法[10],故采用该方法实现IGMM的训练。变分贝叶斯推断方法的计算原理如下所述。将IGMM的概率密度函数记作P,其变分近似分布记作Q,有式(3)恒成立。

其中,Q中各参数独立,如式(4)所示:

式中:F—ln(P(X))的变分下界;KL(⋅)—KL散度。

由式(3)可知,变分下界F越大,则KL(Q||P)越小,即P和Q越接近。因此,令F最大化,可得到的参数迭代式,如式(5)所示。

式中:Φj—{z,Θ}内的任意参数(Φj)—对qj(Φj)更新。IGMM的基本求参步骤如下:

(1)确定样本数据集X、基分布、变分分布Q内各参数的先验分布。(2)利用式(5)求得qj(Φj)并覆盖原qj(Φj)。(3)设定求解精度参数ε。步骤(2)不断迭代进行,记当前迭代步数为t,如果满足Ft-Ft-1<ε,则完成求解,输出Q。

3 基于无限高斯混合模型区间统计的机械故障预警方法

机械内部各激励源及其至测点传递路径与测点处振动信号关系[7],如式(6)所示:

式中:Y(t)—t时刻测点处的振幅;Fi(t)—t时刻第i个激励源激发的激励力;Hi(t)—t时刻第i个激励源至测点的传递路径对应传递函数;N′—激励源数量。

从统计学角度来看,机械在健康状态下激励信号的变化认为服从某种统计分布,由式(6)可知,机械振动信号的统计分布即多个激励信号对应统计分布的叠加。IGMM 根据振动信号自适应确定自身模型参数的数量并生成子成分,其构造与振动信号、激励信号统计分布间关系的关联较密切,故能够较准确地表征机械的健康状态;若机械运行状态改变,对应高维特征空间的统计特性必然发生变化[11]。

基于上述原理,将IGMM、区间统计应用于机械故障预警。为确保较高的预警准确率,利用IGMM对机械健康状态下振动信号的高维特征空间建立概率统计模型,并围绕该模型对机械健康状态不断地进行学习,以获取机械健康状态的界限,基此实现对机械异常状态的识别;为保障预警的时效性,采用以区间为基本单位识别实时振动信号对应高维特征空间统计特性变化的方法,使得预警的计算过程简便。提出方法包括构建高维特征空间、划分区间及统计区间频数、预警阈值自学习等3部分内容,如图1所示。

图1 基于IGMM区间统计的机械故障预警方法流程Fig.1 Mechanical Fault Early Warning Method Flow Based on IGMM Interval Statistics

3.1 构建高维特征空间

采用基于降噪自编码器的特征提取方法对机械振动信号提取特征(注:特征提取方法步骤详见参考文献[12])。为消除不同维度特征量纲不一产生的影响,按式(7)对所提特征按各维度分别进行归一化处理。考虑到实际预警时实时振动数据的更新导致各维度特征的最大值、最小值变化,故须人为定义其最大值、最小值的经验参数[13],对超出此区间范围的特征向量予以舍去,从而实现对特征的归一化。

式中:fi,j—第j维度的第i个特征;fmax,j—第j维度特征最大值的经验参数;fmin,j—第j维度特征最小值的经验参数。

利用特征向量构建出的高维特征空间F如下所示。

式中:—第j维度第i个特征;n—特征矩阵包含特征向量的数量;m—特征向量的维数。

3.2 划分区间及统计区间频数

机械同种状态下能够容许其各维特征在一定区间范围内波动[14],故可将区间作为基本单位对机械实时状态下高维特征空间的统计特性变化进行识别,提高预警的时效性。对高维特征空间划分区间步骤如下:

(1)对各维度特征的值域按等间距进行分割,并将每维特征的值域分割点组成列向量构建如式(9)所示的矩阵M。

(2)依据多维区间定义[15],生成区间。将M的前(k-1)行记作矩阵Mstart;将M的第2至k行记作矩阵Mend。对矩阵Mstart、Mend分别按式(10)、式(11)计算得出区间左边界集Istart、区间右边界集Iend。将划分出的区间集记作I,I={[Istart,i,Iend,i],i∈(k-1)m}。

式中:×—笛卡尔积;Mstart_i—Mstart的第i列向量;Mend_i—Mend的第i列向量。

利用累计计数法对某一高维特征空间F统计区间频数(记为CountI,(F))方法步骤如下:对于F内的任一行向量Fi、I内的任一区间Ij,当Fi、Ij满足:Fi内的任一元素均大于其维度对应Ij左边界向量的元素,且均小于其维度对应Ij右边界向量的元素时,则认为该Fi落在Ij内。对F内的行向量进行遍历,判断出各个行向量落在的区间,并对落在各区间行向量的数量进行统计即得到频数分布。

利用前文的IGMM参数学习方法对机械健康状态下的高维特征空间构建概率统计模型mbase。为根据mbase估计机械健康状态下高维特征空间在各区间的频数分布,采用如下方法:

(1)计算mbase的累计分布函数CDF(mbase)。

(2)将Ij按式(12)的矩阵形式表示,对Ij内的列向量计算笛卡尔积,其结果记为R。

(3)将R中序列号为奇数的元素代入-CDF(mbase)计算;将R内序列号为偶数的元素代入CDF(mbase)计算,然后将上述结果按照序列顺序对应相加并形成新的向量。将该新向量进行如下重复步骤:将新向量拆分为由其序列号为奇数的元素的相反数形成的向量1,由其序列号为偶数的元素形成的向量2。并对向量1、向量2同序列的两元素相加。直至形成的新向量内的元素数为一,该元素即mbase在区间Ij的概率PIj(mbase)。

(4)对区间集I中的每个子集均按照式(2)、式(3)计算得到概率集PI。PI反映了机械健康状态下高维特征空间在各区间的频数分布。

3.3 预警阈值自学习

巴氏距离是一种计算精度较高且简便的差异性度量方法[16],这里采用该方法计算PI与CountI间的距离,计算方法见式(13):

预警阈值自学习步骤如下:计算PI与若干机械健康状态下的高维特征空间CountI(Fnormal_1),...,CountI(Fnormal_M)的巴氏距离,然后计算这一组距离的均值μ、标准差σ。由3σ准则[17]得知,机械健康状态的巴氏距离集中在(0,μ+3σ)区间内,故将预警阈值设定为μ+3σ。当PI与CountI(Freal-time)间的距离超过预警阈值时,认为机械在实时高维特征空间Freal-time对应时间处于异常状态,触发预警。

4 应用验证

4.1 案例数据介绍

从预警准确率、预警时长两方面对提出方法预警效果进行验证。往复式压缩机结构复杂,内部振动激励源多,测点处的振动信号相对包含更多激励信号成分,由故障引起些许激励信号的变化在振动信号中较难以体现,且该装备易损件多、故障样本易于获取。因此采用往复式压缩机的案例数据验证提出方法的有效性。

利用石化企业中往复式压缩机出现的三种典型故障案例提出方法进行测试,振动波形案例数据介绍,如表1所示。传感器的采样频率设定为10240Hz,采样时长为往复式压缩机运转的2个周期,安装于十字头上,如图2所示。应用提出方法时参数设定如下:特征提取相关参数设定参考文献[13];区间数量控制参数k设定为3;每60个特征向量组建成一个高维特征矩阵;高维特征矩阵用于训练IGMM。在报警阈值自学习步骤中,第2 个至第31 个高维特征空间用于计算预警阈值,余下高维特征矩阵用于验证。

表1 故障案例数据详情Tab.1 Fault Case Data Detailed Information

图2 往复式压缩机传感器布置示意图Fig.2 Layout of Sensors for Reciprocating Compressor

4.2 应用结果及分析

为验证提出方法中对机械实时状态表征方式的可行性,应用验证时引入了对照方法。对照方法利用IGMM对机械健康、实时状态下高维特征空间分别建立概率统计模型,并通过计算机械健康、实时状态下概率统计模型的距离实现故障预警。此外,将单特征门限报警法(简称SF 方法)的报警时刻视为故障发生时间点,以此评估提出方法和对照方法预警时长。

提出方法、对照方法的结果统计,如表2所示。从预警时长角度考量,可明显看到提出方法和对照方法的预警效果从整体上均优于SF 方法。但对于不同结构往复式压缩机出现的活塞磨损、气阀泄露和液击故障,提出方法均能够实现预警,而对照方法对于气阀泄露故障出现了一次漏报警事件。

表2 提出方法和对照方法的预警结果统计Tab.2 The Statistics of the Early Warning Results of the Proposed Method and the Control Method

对照方法、提出方法分别对活塞磨损故障的预警结果,如图3所示。其作为一种渐发性故障,故障的严重程度与时间呈正比且故障征兆较明显,两种方法的预警距离曲线随时间的变化整体较符合活塞组件磨损故障劣化规律。

图3 活塞组件磨损故障预警结果Fig.3 Early Warning Results of Piston Component Wear Failure

另外,对照方法预警时间点虽更为提前,但出现反复穿越预警阈值线的状况。提出方法并无此现象,其报警准确率相对较高。

对照方法、提出方法对气阀泄露故障的预警结果,如图4所示。往复式压缩机在发生气阀泄露故障时振动会具有明显异常,两种方法均在第85个时间点左右预警距离曲线骤然升高,其较符合气阀泄露故障的劣化规律。

图4 气阀泄露故障预警结果Fig.4 Early Warning Results of Air Valve Leakage

对照方法、提出方法对轻微液击故障的预警结果,如图5所示。提出方法相比对照方法能较早地识别出异常,且预警距离曲线波动更小。对照方法的预警距离曲线出现了反复穿越线的状况,提出方法的报警准确率相对较高。

由上分析可知,提出方法、对照方法利用IGMM实现了对机械实时状态下各激励信号统计特性变化的识别,相比SF方法均大幅提前了预警时间点。另外,由图3至图5可看到,对照方法预警距离曲线的波动性随着机械劣化逐渐增大。分析认为,这是由于IGMM 虽能够对机械的健康状态较好的表征,但随着机械劣化,振动信号中的非线性、非平稳成分的逐渐凸显,使得其非高斯性随之增强,致使IGMM对其表征准确度降低。提出方法在实时预警时以分区统计频数的方式获取到机械振动信号统计特性并以此表征机械实时状态,避免了此类问题,且应用中预警距离曲线未发生反复穿越预警阈值线的事件,使得提出方法预警准确率相对较高。

5 结论

将无限高斯混合模型、区间统计应用于机械故障预警中,通过应用验证得到了如下结论:

(1)在无故障样本条件下,提出方法能够以较高的准确率、时效性实现对往复式压缩机的故障预警,具有一定的工程应用价值。(2)研究分析了机械振动信号与各激励信号间的关系,并提出利用IGMM表征出机械正常状态下内部各激励信号统计特性。(3)在实时预警过程中,以分区统计高维特征空间频数的方式表征机械实时状态是可行有效的。

猜你喜欢
高维区间预警
解两类含参数的复合不等式有解与恒成立问题
你学会“区间测速”了吗
法国发布高温预警 严阵以待备战“史上最热周”
一种改进的GP-CLIQUE自适应高维子空间聚类算法
园林有害生物预警与可持续控制
基于加权自学习散列的高维数据最近邻查询算法
区间对象族的可镇定性分析
机载预警雷达对IFF 的干扰分析
一般非齐次非线性扩散方程的等价变换和高维不变子空间
高维Kramers系统离出点的分布问题