DCGAN结合CNN诊断不均衡小样本的滚动轴承故障

2022-12-20 15:43胡益嘉张溟晨张毅杰
噪声与振动控制 2022年6期
关键词:类间训练样本轴承

施 杰,胡益嘉,王 森,张溟晨,张毅杰

(1.云南农业大学 机电工程学院,昆明 650201;2.昆明理工大学 机电工程学院,昆明 650500)

近年来,我国机械化水平不断提高,轴承作为旋转机械设备中的关键零件,存在易损害、故障率高等问题[1-2]。在实际工程应用中,采集到的轴承非平稳振动信号含有大量故障信息,但这些样本存在着数量较少且类间数量不均衡的问题,极大影响了轴承故障诊断效果[3]。因此,在小训练样本和故障类间数据不均衡的情况下,研究滚动轴承故障智能诊断问题具有重要意义。

一般非平稳信号应该首先进行预处理以提高其诊断效果。小波变换(Wavelet Transform,WT)、集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)和变分模态分解(Variational Mode Decomposition,VMD)等,是学者们针对非平稳信号预处理所提出的方法。WT是通过将时间信号变换为时频信号,来对信号的局部特性进行分析,但存在信号冗余的问题[4]。Wu等[5]提出的EEMD算法是在信号中加入定量均匀高斯白噪声以消除模态混叠现象,但加入白噪声的大小和次数是依靠经验来决定,因此缺乏自适应性。随后,Dragomiretskiy等[6]又提出了VMD算法,将信号放入变分模型中进行自适应分解,从而达到降噪的效果。VMD具有严密的数学理论基础,相比EEMD、WT 等能有效避免模态混叠现象的产生[7-10],但VMD 算法也存在参数无法自适应设置的问题。

在故障诊断方法上,目前大多采用支持向量机(Support Vector Machine,SVM)[11]、BP 神经网络[12]、卷积神经网络(Convolution Neural Network,CNN)等机器学习模型。但这类模型会因训练样本数据量过少或故障类间数据不均衡,而影响诊断精度和鲁棒性。针对这一问题,通常采用几何变换的方式扩充训练样本,但这会使得样本缺乏多样化,不能表征全部样本特征。Goodfellow等[13]为消除传统扩充方式的弊端,于2014年提出了一种无监督学习模型即生成对抗网络(Generative Adversarial Network,GAN)。GAN通过生成网络与判别网络的相互博弈来学习样本特征并生成辅助样本。随后,又提出了深度卷积生成对抗网络(Deep Convolution Generative Adversarial Network,DCGAN)。DCGAN与GAN 不同之处在于采用了深层卷积网络来代替多层感知机,以增强模型对样本特征的挖掘能力,同时稳定了模型训练过程。

综上,本文针对小训练样本且故障类间数据不均衡的情况,研究了基于DCGAN 与GA-CNN 的轴承故障诊断方法。首先,在信号预处理方面采用遗传算法(Genetic Algorithm,GA)来改进VMD。以信息熵作为适应度函数,通过GA寻优来解决VMD中本征模态分解个数k和二次惩罚因子a难以自适应确定的问题。再根据平均峭度指标对经VMD 分解后的本征模态分量(Intrinsic Mode Function,IMF)进行重构,采用连续小波变换将重构信号转换为二维时频信号。然后,构建DCGAN 网络将通过预处理获取的小批量时频信号作为训练样本,通过对抗生成辅助样本。同样采用GA 算法对CNN 进行优化(Convolution Neural Nnetwork Optimized by Genetic Algorithm,GA-CNN),即将交叉熵损失函数作为GA寻优的适应度函数,从而解决学习率和批量大小等超参数相互影响导致模型难以收敛的问题。最后,再将对抗生成的样本放入GA-CNN 中进行训练,构造轴承故障智能诊断方法。采用美国西储大学轴承试验数据(Case Western Reserve University,CWRU)和XJTU-SY轴承试验数据来验证该方法的有效性。

1 变分模态分解改进算法

1.1 变分模态分解

VMD 算法先要将解析信号经过Hilbert 变换混合得到预估频率中心,再把每个模态的频谱调制到相应的基频带。计算基频带中解调信号梯度的平方L2范数,得到k个固有模态分量以及各模态分量的频率中心,估计各固有模态分量的带宽,得到约束变分模型如式(1)所示。最后,引入惩罚因子a构造Lagrange函数对变分模型进行求解,得到最优解,完成VMD分解。

式中:f(x)为原始信号;k为IMF 分解个数;{μk}={μ1,μ2,…,μk}为VMD 分解后的k个IMF 分量;{ωk}={ω1,ω2,…,ωk}为各IMF频率中心。

VMD具体步骤:

2)根据VMD算法公式更新μk和ωk;

3)根据λn+1(ω)=λn(ω)+τ(f(ω)-)更新λn+1;

1.2 遗传算法

在处理复杂的非线性问题时,GA因能模拟生物界的选择和遗传机制,并且具有良好的全局寻优能力而被广泛应用[14]。相比其他优化算法,GA成熟的收敛性分析方法及信息传递机制更适合处理噪声信号,所以选择GA 作为VMD 算法的寻优算法。在GA运算过程中,以选择和交叉方式对种群进行全局化搜索,通过变异算子产生接近最优解的新个体。根据种群内个体适应程度评价个体优劣,在不断迭代的过程中寻找到最优染色体。

1.3 信息熵适应度函数

信息熵反映了系统的复杂程度,在采用GA 算法对VMD进行参数寻优时,如果分解后的IMF分量中含有与故障相关的周期性冲击特征,则信号中包含信息有效性越大,信息熵越小。因此,将寻找最小信息熵作为GA算法寻优目标。

式中:H(x)为信息熵;xi(i=1,2,3,…,n)为信源的n个状态;Pi(i=1,2,3,…,n)为各状态的概率。

1.4 基于GA改进的VMD算法

VMD 需要预先设定IMF 分解个数k以及二次惩罚因子a,若参数选择过小,会出现模态混叠的现象。反之,则会造成过分解以及运算量变大[15]。若仅通过人为经验来设定两个参数,分析结果将存在很大的偶然性和随机性。因此本文采用遗传算法对变分模态分解(Optimization of Variational Mode Decomposition by Genetic Algorithm,GA-VMD)的关键参数进行寻优,把最小信息熵作为GA 的适应度函数,以种群中每个个体适应度大小评价其优劣程度。通过选择、交叉和变异操作,将适应度较高的[k,a]组合遗传到下一代,最终自适应地筛选出参数的最优组合。GA-VMD 特征提取方法具体实现步骤如下:

(1)获取原始振动信号;

(2)初始化GA 算法基本参数:种群个数Np、最大遗传代数N、交叉概率Px、变异概率Pm等;

(3)建立最小信息熵适应度函数;

(4)利用GA 算法寻优VMD 中的分解个数k和惩罚因子a;

(5)将GA确定的最优k和a值用于VMD分解,即实现GA-VMD算法。

2 智能故障诊断模型

2.1 基于GA优化的CNN模型

CNN 是带有卷积结构的深层前馈式神经网络模型,其采用局部感受野和权值共享的方式使网络具有一定的稳定性[16]。本文以AlexNet 网络为基础进行优化。首先,由于训练样本较少,所以将C1层、C3层、C5至C7层卷积核都缩小一倍。然后,为了防止过拟合现象的出现,在全连接层引入DropOut 对神经元进行随机失活。最后,通过Softmax 诊断出故障类型。同时,CNN模型对学习率和批处理大小这两个参数十分敏感,设置不当会导致模型训练时间过长且不易收敛。目前,两参数大多依靠经验或遍历算法来设定[17]。因此,本文采用GA 算法用于CNN模型中两参数的寻优,将最小交叉熵损失作为寻优目标,以实现GA-CNN 算法,改进后的模型结构如表1所示。

表1 GA-CNN模型参数

2.2 深度卷积对抗生成网络模型

DCGAN 是通过判别网络和生成网络之间相互博弈,从而最终达到“纳什均衡”的无监督深度学习模型[18]。模型由生成网络和判别网络组成,生成网络将随机噪声通过反卷积变为具有故障特征的样本;判别网络通过与真实样本进行比对得到最优生成网络;再将多维随机噪声放入网络中获取生成样本。DCGAN 模型在生成和判别网络中均采用深度卷积网络结构,并对每层网络采用批归一化操作,增强了模型对局部特征的提取能力。同时,为了解决训练过程中生成网络梯度消失的问题,分别使用LeakRelu函数和Tanh函数来代替Relu函数,以提高训练过程的稳定性[19]。DCGAN 生成和判别网络模型如式(3)。因此,本文采用DCGAN 模型来解决小训练样本及故障类间不均衡所造成诊断效果不佳的问题。

式中:z为生成网络的输入噪声;x为真实样本;G(z)为生成网络的辅助样本;D(G(z))为判别样本真实程度的概率。

2.3 基于DCGAN 与GA-CNN 的轴承故障诊断方法

首先,该方法采用GA-VMD 和CWT 对故障信号进行特征提取,将一维振动信号转换为二维时频信号。然后,将时频信号作为DCGAN 模型的训练样本,通过对抗生成辅助样本。最后,利用GA 对CNN模型中的学习率和批处理大小进行寻优,找到最优超参数组合。从而建立起适应小训练样本及故障类间不均衡条件下的故障诊断模型。具体步骤如下:

(1)获取轴承振动信号;

(2)按照1.4 小节设置GA-VMD 算法参数。通过最小信息熵目标函数来对选择、交叉、变异操作后的个体进行评估,获得VMD最优参数组合[k,a],再进行GA-VMD分解;

(3)根据峭度准则选择大于平均峭度的IMF分量进行信号重构,并通过CWT把重构信号变换为二维时频信号;

(4)构建DCGAN模型的生成和判别网络,将时频信号作为真实样本放入模型中,并根据判别网络结果提取出最优生成网络,得到辅助样本;

(5)设置GA-CNN的遗传参数,通过GA算法寻优找到CNN 模型中学习率和批处理大小的最优组合;

(6)通过辅助样本对GA-CNN模型进行训练和验证。

3 试验验证

3.1 试验平台与数据

本文采用CWRU[20]和XJTU-SY[21]滚动轴承数据集进行试验验证。CWRU数据集是通过电火花加工的方式在SKF6205-2RS 轴承的外圈、内圈和滚动体上分别加工出不同故障程度的凹槽来模拟故障。数据集是在12 kHz的采样频率、1 730 r/min转速、2 HP载荷下采集了4 种轴承状态数据。通过252C33 加速度传感器获取到LDK UER204 轴承在2 250 r/min 转速,11 kN 径向力下的全寿命振动周期信号组成XJTU-SY数据集。在25.6 kHz的采样频率下,对滚动轴承状态数据进行采集。CWRU 和XJTUSY 滚动轴承数据集的理论故障特征频率如表2所示。

表2 2种数据集故障特征频率/Hz

3.2 GA-VMD算法实现

试验中以CWRU 数据集中内圈故障信号为例来说明GA-VMD算法的有效性,其余故障信号分析方法相同。首先,在GA 算法中建立最小信息熵适应度函数,利用GA 对VMD 算法中的参数k和a进行优化。根据文献[22]初始化GA算法参数:Np=40、N=500、Px=0.7、Pm=0.5;根据文献[23]设置k取值范围在[2,15]之间,a取值范围在[200,2 000]之间。GAVMD 进化过程如图1 所示,当进化到第234 代时即可获得最小信息熵适应度函数值,其对应的最优[k,a]组合为[7,185 0]。然后,对故障信号进行VMD分解,并计算各阶IMF分量峭度值如表3所示,得到平均峭度为3.117 2。将大于平均峭度的IMF进行信号重构[24],随后对其进行包络谱分析。GA-VMD 重构信号包络谱如图2 所示,主要频率成分包括29 Hz、157 Hz 及其2 倍频和3 倍频,这分别与理论转频29.17 Hz 和内圈故障频率157.94 Hz 相接近。由此可证明依据GA-VMD 算法能有效判断出是内圈故障。

图2 GA-VMD重构信号包络谱

表3 经VMD分解后各阶IMF分量峭度值

图1 GA-VMD进化过程图

为进一步验证GA-VMD 在特征提取方面的优势,将其与EEMD 方法进行比较。把相同的轴承内圈故障信号采用EEMD进行特征提取。首先,设置EEMD 中总体平均次数NE=50,加入的高斯白噪声幅值Nsted=0.5。然后,故障信号经过EEMD分解得到13 阶IMF 分量,计算出各阶IMF 分量峭度值如表4所示。其平均峭度为3.480 1。将大于平均峭度的IMF 分量进行信号重构和包络分析,EEMD 重构信号的包络谱如图3 所示。与GA-VMD 重构信号的包络谱相比较,虽然可以找到一些故障相关频率成分,但谱图中的高频特征频率不突出,而且谱线干扰过多,降噪效果较差。

图3 EEMD重构信号包络谱

表4 经EEMD分解后各阶IMF分量峭度值

同时,GA-VMD与EEMD相比不会出现模态混叠的现象,经EEMD 分解后的内圈故障信号前3 阶IMF 幅值谱如图4 所示。从图4(a)和图4(b)中可以看到,经EEMD分解后IMF1和IMF2分量间模态混叠现象严重。在图4(a)和图4(c)中,IMF1和IMF3之间也存在模态混叠现象。图5为内圈故障信号经GAVMD 分解后的前3 阶IMF 幅值谱。可以看到各模态之间故障频率不同,相互不存在模态混叠现象。综上所述,GA-VMD算法优于EEMD方法。

图4 经EEMD分解后前3阶分量幅值谱

图5 经GA-VMD分解后前3阶分量幅值谱

3.3 基于DCGAN与GA-CNN的故障诊断方法

首先,通过GA-VMD 方法和CWT 获取轴承振动信号的二维时频图。其次,构建DCGAN 模型并初始化参数:批处理大小Batch_size=16;最大迭代次数N=400;学习率LG=0.001、LD=0.002;噪声维度NZ=100;判别网络和生成网络的更新步长Step=1:5。将二维时频图作为真实样本放入DCGAN 中,通过对抗生成故障辅助样本。

然后,根据表1构建GA-CNN模型并初始化GA参数:设Np=50、N=200、Px=0.7、Pm=0.1;学习率Lr范围在[0.001,1]之间;批处理大小Batch_size 在[20,100]之间。最后,以最小交叉熵作为GA适应度函数的寻优目标对CNN 模型进行改进。DCGAN 与GA-CNN 故障诊断方法流程图如图6 所示。

图6 DCGAN与GA-CNN故障诊断方法流程图

3.3.1 GA-CNN模型有效性验证

为了验证GA-CNN 模型的有效性,根据CWRU 数据集(故障直径0.177 8 mm,负载2 Hp,转速1 750 r/min)、XJTU-SY 数据集(转速2250 r/min,径向力11 kN)中的信号对滚动轴承进行分析。首先,分别将信号采用GA-VMD 分解并重构。然后,对重构信号进行CWT,得到4种健康状态下各200个样本,按照7:3的比例将其划分训练集和测试集。最后,分别把训练样本放入CNN、VGG19 和GA-CNN 模型中进行训练,通过测试样本来检验模型精度。如图7(a)所示,在CWRU 数据集下3 种模型平均诊断精度分别为93.97 %、70.67 %和97.95%。由于利用GA对CNN模型进行全局寻优,得到学习率Lr和批处理Batch_size 的最优组合为[0.001,32]。所以,GA-CNN 模型精度相比CNN 和VGG19 模型分别提高了3.98 %和27.78 %。如图7(b)所示,在CWRU数据集下3种模型平均诊断精度分别为80.81 %、73.05 %和97.12 %。因为基于GA找到CNN模型中学习率Lr和批处理Batch_size的最优组合为[0.002,23],所以GA-CNN 模型精度相比CNN和VGG19模型分别提高了16.31%和24.07%。两组试验验证了GA-CNN 模型具有良好的鲁棒性和泛化能力,减少了参数设置对人为经验的依赖。

图7 CNN、VGG19与GA-CNN模型诊断精度对比

3.3.2 小样本下模型有效性验证

目前,对小样本定义尚未有统一标准[25]。本文尝试将3.3.1 小节中数据量的10 分之一定义为小样本数据量。由于VGG19 模型在原始数据量下不仅故障诊断精度均低于CNN和GA-CNN模型,而且训练时间较长。因此,试验仅在CWRU 数据集下对DCGAN+GA-CNN 模型进行小样本数据有效性验证。试验中采用3.3.1小节中相同的轴承信号,同样得到4种健康状态下共80个样本,按照7:3的比例将其划分为训练集和测试集。将训练集分别放入GACNN 和DCGAN+GA-CNN 模型进行训练。如图8所示,GA-CNN和DCGAN+GA-CNN模型的平均诊断精度分别为67.54%和95.30%。在小训练样本条件下,由于DCGAN+GA-CNN模型是通过对抗生成辅助样本来进行训练,所以其诊断精度比GA-CNN模型大幅领先27.76%。由此可证明,在训练小样本情况下,DCGAN+GA-CNN 模型可以有效提升诊断精度,且训练过程稳定。

图8 小样本下GA-CNN与DCGAN+GA-CNN模型诊断精度对比

3.3.3 故障类间不均衡、小样本下模型有效性验证

为验证在小样本及故障类间不均衡样本下DCGAN+GA-CNN 模型的有效性,需要构建类间不均衡样本。试验中采用与3.3.2 小节中相同处理方法产生试验信号,取出由20 个内圈故障样本、30 个外圈故障样本、40个滚动体故障样本及50个正常状态样本构成的故障类间不均衡样本,按照7:3的比例将其划分训练集和测试集。试验中将训练集分别放入GA-CNN和DCGAN+GA-CNN模型中进行训练。如图9所示。GA-CNN和DCGAN+GA-CNN模型的平均诊断精度分别为69.13%和95.22%。在小样本及故障类间不均衡样本下,由于DCGAN+GA-CNN模型通过DCGAN方法对故障类间不均衡样本进行扩增,有效增强了模型诊断能力,避免了模型误诊现象的发生。所以其诊断精度比GA-CNN 模型大幅领先26.09%。

图9 小样本及故障类间不均衡下GA-CNN与DCGAN+GA-CNN模型诊断精度对比

4 结语

本文针对滚动轴承训练样本数据较少且故障类间样本不均衡导致诊断效果不佳的问题,将信号处理方法、寻优算法与深度学习模型相结合提出了一种GA-VMD+DCGAN+GA-CNN 的智能故障诊断方法。

(1)GA-VMD 方法实现了VMD 中IMF 分解个数k和惩罚因子a的自适应确定。经过GA-VMD处理后的轴承故障信号与经EEMD 处理后的信号相比,避免了模态混叠现象且降噪效果明显。

(2)GA-VMD+DCGAN+GA-CNN 方法可以有效解决由于小训练样本及故障类间不均衡而导致模型诊断效果不佳的问题。与传统样本扩增方式相比,DCGAN 的辅助样本不仅能够表征真实样本特征且更具多样性。通过GA对CNN模型中超参数进行组合寻优,可以有效提高模型诊断精度,减少对人为经验的依赖。

(3)本文是在实验室环境中采集试验数据,这与实际生产环境中采集的数据相比存在一定差异。同时,GA算法中种群个数NP、最大遗传代数N、交叉概率Px和变异概率Pm等参数还需要根据先验知识或者人为经验设定,这些问题还需要进一步研究。

猜你喜欢
类间训练样本轴承
轴承知识
轴承知识
轴承知识
轴承知识
基于OTSU改进的布匹检测算法研究
基于贝叶斯估计的多类间方差目标提取*
人工智能
基于类间区分度的属性约简方法*
基于改进最大类间方差法的手势分割方法研究
宽带光谱成像系统最优训练样本选择方法研究