结合振动特征优选和GWOA-XGBoost的电机轴承故障诊断

2023-06-10 07:08樊清川
国防科技大学学报 2023年3期
关键词:故障诊断轴承个体

于 飞,樊清川,宣 敏

(海军工程大学 电气工程学院, 湖北 武汉 430033)

轴承在电机的运行中起着支撑和引导旋转的作用,据统计,电机故障有40%左右是由轴承故障引发[1]。轴承是电机健康监测的重要对象,直接影响到电机运转的整体性能。因此,开展电机轴承的故障诊断研究意义重大。

目前基于振动信号的轴承故障诊断是最为常见的方法,当电机轴承出现故障时振动信号会出现明显的冲击波动,若对振动信号的时频信号进行有效的提取,就能为电机轴承的故障诊断提供有利的数据基础。文献[2]利用经验模态分解获得振动信号的固有模态函数(intrinsic mode function, IMF),再提取IMF分量的奇异值以获得降维后的新特征向量,最后利用模糊神经网络有效地评估了电机轴承的运行状况。文献[3]提取了振动信号的能量特征,然后利用隐马尔可夫模型建立分类模型,能够有效区分不同类型故障的序列。文献[4]将卷积神经网络(convolutional neural networks, CNN)应用于电机轴承的故障诊断中,同时还使用了传统的快速傅里叶变换进行振动信号特征提取,但无法充分发挥CNN的特征提取优势,从而造成诊断效果欠佳。文献[5]利用集成经验模态分解(ensemble empirical mode decomposition,EEMD)提取IMF分量,并通过Hilbert变换获得包络谱,最后利用优化过的深度信念网络(deep belief network, DBN)进行故障分类,结果较好,但在识别滚动体故障时准确率较低。文献[6]采用连续小波变换将振动信号转换为二维灰度图像,将CNN从灰度图像中提取的特征输入射频,有效诊断滚动轴承故障。文献[7]提出了一种广义多尺度动态时间弯曲算法,用于从风力发电机组齿轮箱振动信号中提取故障特征,采用拉普拉斯评分法选择敏感特征构造特征向量,采用随机森林进行故障状态分类。结果表明,该方法不仅能准确、高效地识别出不同的故障状态,而且与其他故障状态分类方法相比,准确性更高。

针对电机轴承振动信号,本文提出利用变分模态分解(variational mode decomposition, VMD)获得振动信号的IMF分量,并计算各IMF分量的多尺度熵重构特征向量,再利用改进的WOA算法对XGBoost模型进行超参数寻优,最后利用GWOA-XGBoost模型对重构的特征向量进行故障诊断,并通过实验案例证明所提模型的可行性。

1 基于优化VMD的特征提取基本原理

1.1 VMD分解

VMD是在维纳滤波、Hilbert变换以及外差调解的基础上建立的一种新的非线性信号分解方法,避免了EMD在处理信号时可能出现端点效应或模态混跌的情况。VMD算法预先确定模态分量个数K,保证它们的带宽之和最小,每个IMF分量被新定义成一个调幅-调频信号,表示如下:

uk(t)=Ak(t)cos(φk(t))

(1)

其中:Ak(t)为cos(φk(t))的幅值;φk(t)为uk(t)的相位,ωk(t)=φ′k(t)为uk(t)的瞬时频率。具体分解步骤如下:

1)利用Hilbert变换求出每个IMF分量的解析信号,其单边频谱表示如下:

(2)

2)估算K个IMF分量的中心频率,引入指数项e-jωkt,调制各IMF分量的频谱到其所属基频带:

(3)

3)求出调节信号的梯度平方范数,估算每个IMF分量的带宽。最后基于约束条件,得到变分约束模型:

(4)

4)将二次罚参数α和Lagrange乘数λ引入,使变分约束模型转换成变分非约束模型:

L({uk(t)},{ωk(t)},{λ(t)})=

(5)

1.2 VMD的参数优化方法

在使用VMD进行分解时,分解层数K和惩罚因子α决定着信号处理的效果。当K值较小时,会存在分解不完全造成原始信号信息丢失的情况;当K值较大时,相邻IMF分量的频率中心间距较小,可能出现模态混叠的现象。惩罚因子α影响着分解过程的降噪性能以及细节保留度。本文利用粒子群优化算法(particle swarm optimization, PSO)获得最优K与α的组合。

局部极小熵的值反映了概率分布特性,可将其作为判断信号稀疏度的标准。引入局部极小熵作为PSO的适应度函数,迭代寻优步骤如下:

步骤1:确定PSO的适应度函数并初始化其关键参数。

步骤2:将待优化参数(K,α)作为个体位子坐标,随机生成每个个体的初始坐标与初始速度。

步骤3:每次迭代更新,使用VMD对每个个体进行分解,计算其对应的局部极小熵值,将所有个体进行比较,更新局部极值以及全局极值。

步骤4:更新个体的速度和位置,跳至步骤3,当迭代进行到预设最大次数或满足预设适应度值条件时停止,最优个体即为所需最佳VMD参数。

1.3 多尺度熵理论

基于样本熵概念Costa等[9]提出了多尺度熵(multi scale entropy,MSE)理论,从不同的尺度定义了时间序列的不规则变化,对原始信号进行粗粒化计算,得到样本序列在多个尺度下的样本熵。样本熵反映了信号在不同尺度下的复杂特性,进而可区分信号间的差异性,计算方法如下:

步骤1:设一组数据X={X1,X2,X3,…,Xn},对其进行粗粒化加工,目的在于改变原始数据的尺度,组成新的向量,即:

(6)

步骤2:设置相似限度r以及嵌入维度m,粗粒化生成m维矢量:

Y(i)={Yi,Yi+1,Yi+2,…,Yi+m-1}

(7)

其中,i=1,2,3,…,n-m。

步骤3:Y(i)与Y(j)两个样本之间最大距离的绝对值记为D(i,j):

D(i,j)=|Y(i)-Y(j)|=max|X(i+k)-X(i-k)|

(8)

其中:i,j=1,2,3,…,n-m;k=1,2,3,…,m-1。

(9)

步骤5:若重构数据有m+1个时,重复步骤1~4得到Bm+1(r)。则数列X={X1,X2,X3,…,Xn}的样本熵为:

(10)

当N为有限数时,样本熵表示为:

(11)

步骤6:不同尺度τ的样本熵共同表示多尺度熵:

(12)

计算多尺度熵时需预先设置嵌入维度m、相似限度r以及尺度因子τ,基于经验设置m=2,r为0.1δ~0.25δ(δ表示数据序列标准差),τ≤20[10]。本文选择m=2,r=0.2δ,τ=15。

2 基于优化XGBoost的故障诊断

2.1 XGBoost模型介绍

XGBoost模型是基于树模型集成的一种新型机器学习算法,它主要是将多个分类精度不高的分类回归树(classification and regression tree, CART)模型结合,搭建出一个精度较高的模型。模型精度迭代增加,每一轮迭代使用一个新的CART树模型去拟合前一个树模型的残差,该过程叫作梯度提升。XGBoost模型构建如下。

对于某一数据集D={(xi,yi)}(xi∈Rm,yi∈R)包含n个样本、m维特征,K棵树模型最终输出为:

(13)

F={f(x)=ωq(x)},q:Rm→T,ω∈RT

(14)

其中:每个fk对应着一个单独的树模型;q表示一个从样本指向对应叶子标签的结构;ω表示树模型的权重,即第i个节点的权重为ωi;T表示叶子节点的数量;F表示树模型组成的集合;ωq(x)表示对样本x的打分,即模型输出值。

XGBoost的目标函数正则化可以表示为:

(15)

(16)

2.2 改进的WOA算法

WOA[11]是在2016年提出的一种元启发式群体智能优化算法,该算法是受鲸鱼的气泡网摄食行为启发而来的。如图1(a)所示,鲸鱼在猎物的正下方,沿着螺旋状路径,使用收缩包围的方法逐步逼近猎物,在逼近的同时,不断向上喷吐气泡,猎物无法游过气泡网,与此同时鲸鱼加速上升,吃掉猎物,完成狩猎。WOA的参数优化如图1(b)所示,包含三个机制:环绕包围、螺旋更新和全局搜索。

(a) 捕食行为(a) Predation

2.2.1 环绕收缩

在该阶段,设定种群中的最优单位作为目标,其他个体更新自己的位置并向目标猎物逼近,其数学模型为:

X(t+1)=Xp(t)-A·D

(17)

D=|B·XP(t)-X(t)|

(18)

其中:X(t)是鲸鱼个体的位置向量;t为当前的迭代次数;Xp(t)是猎物的位置向量[12];A和B表示系数向量,表达式如式(19)所示。

(19)

其中:r1和r2是[0,1]内的随机向量;a表示调控参数,随着迭代的进行,a从2递减至0,即

(20)

其中,tmax是最大迭代次数。

2.2.2 螺旋更新

螺旋更新机制的数学模型为:

X(t+1)=Xp(t)+D′·ebl·cos(2πl)

(21)

D′=|XP(t)-X(t)|

(22)

其中:D′表示搜索目标和搜索个体之间的距离;b是形状参数用来辅助定义图1(b)中的对数螺旋线,l是[-1,1]之间的随机数。

但要注意,捕猎过程中,鲸鱼收缩环形路径的过程与鲸鱼沿环形路径前进的过程是同步进行的,因此,在优化时,群体进行环绕包围和螺旋更新的概率p是相同的,均为0.5,如下所示:

(23)

其中,p是[0,1]之间随机生成的一个数。

2.2.3 全局搜索

在该阶段,对鲸鱼搜寻猎物的行为进行建模。搜索个体的位置是根据种群中随机选取的一个搜索个体进行更新,而非当前的最优个体。该阶段其他个体将远离随机选取的搜索个体,以执行全局搜索:

X(t+1)=Xrand(t)-A·|B·Xrand(t)-X(t)|

(24)

其中,Xrand(t)为种群中随机选取的寻优个体位置。

WOA往往存在过早陷入局部最优解的现象,于是在WOA中引入GA的选择、交叉、变异操作(获得GWOA算法),能够使得个体跳出局部最优解而获得全局最优解,其基本模型参见文献[13]。

在进行选择操作时常用“轮盘赌法”,该操作能够增加种群的平均适应度,但难以产生更优的个体,会导致种群多样性下降,造成部分有意义的点丢失,所以在进行选择时增加一定的选择比例既可提高平均适应度,又可保证种群基因的多样性。对于选择操作,在整个迭代过程的早期,使用较大的交叉概率尽可能获得更优的个体;在算法迭代的后期,个体间的差异较小,为避免优秀个体被破坏,需降低交叉概率。同理,当进行变异操作时,前期使用较小的变异概率促进种群前期的进化,后期增加变异概率,避免陷入局部最优。改进的WOA算法流程如图2所示。借用Srinivas等[14]所提自适应遗传算法里的思想得到的自适应交叉概率和变异概率的计算如下:

图2 改进WOA算法流程Fig.2 Improved WOA algorithm flow

(25)

(26)

2.3 GWOA优化的XGBoost模型

利用XGBoost模型进行分类训练时,迭代次数n过少存在欠拟合现象,导致模型无法充分训练,当n过大,则存在过拟合现象,导致模型对数据训练过于极限而泛化能力下降;学习率η过小时,模型训练过慢,过大时可能忽略全局最优解;决策树最大深度dmax、随机样本比rsubsample、特征占比rcolsample以及决策树分裂点指标γsplit等共同影响模型的分类能力和预测精度。利用改进的WOA算法对这6个参数进行迭代寻优,以增强模型的故障诊断性能。基于GWOA优化的XGBoost电机轴承故障诊断流程如图3所示。

图3 电机轴承故障诊断流程Fig.3 Motor bearing fault diagnosis process

3 算例分析

本文所使用的实验数据来源于美国凯斯西储大学[15],数据集包含电机轴承的内圈、外圈、滚动体的轻微故障以及严重故障再加上正常运行状态共七类数据。样本运行状态编码如表1所示。

选择电机运行工况为735 W、转速1 772 r/min、采样频率12 kHz的电机轴承故障数据集,将数据集切分成长度为1 200个点的700组数据来验证所提模型的可行性,不同故障状态的时频波形如图4所示。

(a) 时域(a) Time domain

3.1 基于优化VMD分解的特征提取

利用PSO算法训练VMD以获得最优超参数组合,将局部极小熵值作为适应度,适应度变化曲线如图5所示。

图5 适应度变化曲线Fig.5 Fitness curve

由图5看出,在8次迭代后适应度值基本不变,进行10次计算取其平均值,获得最优超参数组合(K,α)=(4,134 7),此时的局部最小包络熵值最小。使用优化后的VMD对轴承故障数据进行分解,由于篇幅有限,此处仅列出外圈严重故障分解的时频波形,如图6所示。

(a) 时域(a) Time domain

正交性指数(index of orthogonality, IO)可以用来表征各IMF分量的整体正交性,IO值越小,则各IMF分量的正交性越强;能量保存度(index of energy conservation, IEC)表示分解前后能量对比量,IEC的值与1越接近,则分解时保留下的能量越多,分解稳定性越好[16]。优化前后VMD分解效果对比见表2,可以看出优化后的VMD分解正交性与稳定性都更优异。

表2 VMD优化前后效果对比

使用优化后的VMD对电机轴承振动信号分解后获得多个IMF分量,由于MSE能够反映信号的复杂性,于是再进行MSE计算重构特征向量。

3.2 基于GWOA-XGBoost模型的故障诊断

将处理好的700组数据随机抽取90%作为训练集,剩下10%作为测试集。利用改进WOA算法优化XGBoost参数,设置WOA寻优个体数量为20,维数为7,最大迭代次数为100,将训练集数据输入GWOA-XGBoost模型训练,得最优超参数如表3所示。

表3 最优超参数

将训练好的XGBoost分类器应用于测试集,故障诊断结果如图7所示。为验证GWOA-XGBoost模型对电机轴承故障诊断的提升效果,分别利用WOA-XGBoost、PSO-XGBoost、GA-XGBoost、XGBoost对相同的训练集和测试集进行故障诊断,故障诊断结果如图8~11所示。可以看出,未经优化的XGBoost模型的故障诊断效果是很差的,而GWOA-XGBoost模型的故障诊断效果极好,仅在滚动体严重故障中出现了2处错误诊断,诊断准确率高达97.14%,完全满足工程需求。出现误诊的原因是采集振动信号时,传感器离内圈和外圈更近,能够更清晰地采集到内外圈的振动特性,同时滚动体在运转时除了随着内外圈进行公转还存在自传现象,这也为振动信号的采集造成了干扰,因此滚动体的故障诊断更容易出现误诊现象。

图7 GWOA-XGBoost故障诊断结果Fig.7 GWOA-XGBoost fault diagnosis results

图8 WOA-XGBoost故障诊断结果Fig.8 WOA-XGBoost fault diagnosis results

图9 PSO-XGBoost故障诊断结果Fig.9 PSO-XGBoost fault diagnosis results

图10 GA-XGBoost故障诊断结构Fig.10 GA-XGBoost fault diagnosis results

图11 XGBoost故障诊断结构Fig.11 XGBoost fault diagnosis results

为了进一步说明本文建立的电机轴承故障诊断模型的可靠性与准确性,将所建模型与常用的故障诊断模型如BP神经网络、支持向量机(support vector machine,SVM)、极限学习机[17-19](extreme learning machine,ELM)进行对比,结果如表4所示。从表中可以看出,本文建立的GWOA-XGBoost模型的故障诊断准确率均高于其他算法,准确率高达97.14%。

表4 不同模型的故障诊断准确率

4 结论

针对电机轴承故障的多样性和模糊性造成诊断精度较低的问题,建立了一种基于XGBoost的

电机轴承故障诊断模型,结合算例分析,所得结论如下:

1)针对轴承振动信号的非线性和非平稳性特点,利用优化的VMD算法对振动信号进行预处理,结合多尺度熵理论提高信号特征提取的能力,有助于深度挖掘振动信号与故障状态的内在联系。

2)在WOA算法中引入遗传算法的选择、交叉、变异操作,有效地帮助WOA跳出局部最优解,再利用改进后的WOA算法优化XGBoost模型。所提模型与传统算法相比在电机轴承的故障诊断中具有更高的诊断精度。

猜你喜欢
故障诊断轴承个体
轴承知识
轴承知识
轴承知识
轴承知识
关注个体防护装备
因果图定性分析法及其在故障诊断中的应用
个体反思机制的缺失与救赎
How Cats See the World
基于LCD和排列熵的滚动轴承故障诊断
基于WPD-HHT的滚动轴承故障诊断