非均衡小样本条件下基于SAE-ACGANs的复杂供输机构故障诊断方法

2023-01-31 08:16闫啸家梁伟阁田福庆

振动与冲击 2023年2期

闫啸家，梁伟阁，张钢，佘博，田福庆

(1. 海军工程大学兵器工程学院，武汉 430033； 2. 大连舰艇学院导弹与舰炮系，辽宁大连 116000)

复杂供输机构是特种装备的重要组成部分，其可靠性和稳定性直接影响特种装备功能的发挥，如火炮供输机构，直接影响弹药的运动状态[1]，且其运动过程伴随有猛烈的冲击、振动等，力学环境十分复杂。因此，开展复杂供输机构故障诊断对提高工作效率与可靠性、减少维护时间与费用等方面具有重要意义[2]。

复杂的力学环境、独特的机械结构使供输机构的振动信号具有非线性、非平稳性等特点。时频分析方法可在时间和频率两个维度反映信号的能量强度变化，有效描述信号的细微故障特征，是分析处理非平稳信号的重要方法之一[3]。传统的短时傅里叶变换(short-time Fourier transform, STFT)能够将一维故障振动信号变换成为二维矩阵，从而获得包含时域和频域信息的特征图[4]。但STFT时间窗的大小、形状相对固定，无法同时满足时间分辨率和频率分辨率的需求。而尺度变换连续的连续小波变换(continuous wavelet transform,CWT)能够克服STFT的缺陷，采用与特征分布波形相似的小波基对不同频率的取样步长是可调节的，在信号低频处频率分辨率较高，同时在高频处时间分辨率较高。因此，CWT能够在时频特征图中细致刻画信号的局部形态，具有良好的时频窗口特性和局部分辨能力，是处理非平稳信号突变部分的有力工具[5]。

因此，基于小波时频图和深度学习的智能算法广泛应用于复杂机械系统的特征提取和故障诊断。与传统方法相比，深度学习可以自适应提取时频图的故障特征，实现端对端的故障诊断。袁建虎等将压缩后的小波时频图输入至卷积神经网络，能够有效识别滚动轴承的故障类型；Cheng等[6]提出一种基于CWT和局部二进制卷积神经网络模型的数据驱动旋转机械故障诊断方法，试验表明该方法具有更稳定、更可靠的预测精度。然而，在复杂供输机构的故障诊断中，运用深度学习存在两方面困难：①样本数据不足，受制于供输机构机械结构和工作机制的复杂性，通常难以获取足量的样本，由于小样本条件下深度学习模型容易过拟合，导致模型故障诊断效果较差；②样本数据非均衡，为适应特种装备工作使用环境，供输机构必须长期处于正常运行状态，关键部件在预设寿命范围内更换频繁，因此故障样本数量十分匮乏，实际数据集中正负样本比例极为悬殊，进而导致模型分类结果偏向多数类，对少数类别识别性能不佳[7]。

解决以上问题的传统方法是基于几何变换、噪声扰动和灰度变换等来对训练数据进行数据增强。虽然上述方法操作简单，但产生的数据分布过于单一，数据非均衡问题本质上没有解决，在小样本条件下易导致模型在目标数据集上过拟合。Goodfellow等[8]于2014年提出了生成对抗网络(generative adversarial networks, GANs)，通过生成器和判别器的互相对抗和学习来达到“纳什均衡”，最终使得生成器从简单隐变量中产生的数据分布接近于真实数据分布，解决了样本数据不足的问题。但是GANs网络仅应用于计算机图像领域，无法对标签数据进行分类识别。直到Odena等[9]于2016年提出辅助分类生成式对抗网络(auxiliary classifier generative adversarial networks， ACGANs)，创造性地认为判别器具有识别类标签的能力，且把损失函数分为真伪判别损失和样本分类损失，使得生成器可根据标签生成对应的样本，判别器在二分类的同时实现多分类的功能。随着研究的深入，许多学者对ACGANs进行优化，以期获得更好的分类效果。孙灿飞等[10]采用堆栈收缩自动编码网络作为ACGANs的判别器，提高了网络的故障诊断性能；牛伟宇等[11]在判别器中引入池化层，加快其在多分类任务中的计算速度，防止模型过拟合；朱克凡等[12]在ACGANs损失函数的判别概率中引入权值系数，根据权值大小选择高质量的生成样本以进一步优化识别网络。在这些ACGANs框架中可以根据标签学习图像信息，但在样本数据特征不明显的情况下，无法有效学习图像分布特征，同时没有考虑生成器的输入隐变量对于生成数据的可解释性。

为了进一步提高ACGANs的特征学习能力，更好地解决非均衡小样本条件下复杂供输机构的故障识别问题，本文将稀疏自动编码器(sparse autoencoder, SAE)与ACGANs相结合，提出一种基于SAE-ACGANs 的故障诊断方法。SAE可以对高维散射数据特征进行更深层次地压缩提取，在ACGANs框架中添加一个SAE结构作为图像特征的提取器，对原始数据进行编码，并通过标准正态分布为编码向量添加噪声以共同构成包含真实图像特征信息的隐变量，再将其与所属类别信息共同输入生成器，以强化隐变量表征与图像所属类别相关特征的能力，使得图像类别特征在模型训练和识别阶段都能够得到有效保持，从而提高判别器的性能。因此，SAE-ACGANs可以捕捉小波时频图的内在分布，优化模型的特征学习能力，提高生成数据的质量和故障识别精度，同时有效改善多数类分类偏好的影响，最终在非均衡小样本条件下实现复杂供输机构的故障识别。

1 理论基础

1.1 连续小波变换

小波基的选取是CWT的关键，由于复Morlet(complex Morlet, cmor)小波与供输机构振动信号波形相似，均为带冲击的有阻尼自由衰减信号，其自适应能力更好，因此选择cmor小波作为振动信号进行CWT的小波基。

利用cmor小波φ(t)对供输机构振动信号f(t)进行连续小波变换，其表达式如下

(1)

式中：α为尺度因子；τ为平移因子。当α增大时，时间窗伸展，带宽变窄，中心频率降低而频率分辨率升高，有利于提取信号的低频特征；当α减小时，时间窗收缩，带宽增加，中心频率升高而频率分辨率降低，有利于提取信号的高频特征。φ(t)为复Morlet小波基函数，其表达式为

(2)

式中：fc为小波的中心频率，决定小波振荡快慢；fb为带宽参数，决定小波衰减速度。通过调整中心频率和带宽参数，便可获得适用于分析复杂供输机构振动信号的cmor小波基。

1.2 稀疏自编码器

单层自动编码器(autoencoder，AE)是一种由编码器和解码器构成的对称型神经网络。通过反向传播算法由编码器函数与解码器函数进行循环训练，在实现输出层z对输入层x重构的同时，隐含层h对输入层x的特征进行抽取表达。

(3)

(4)

解码器将隐含层hm反向输出为输入层xm的重构表达zm，其表达式为

(5)

通过反向传播训练学习编码和解码参数集{θh,θz}，使得输入层xm与重构输出层zm之间的损失函数LAE(x,z)最小化

(6)

为提高编码学习的抗噪声能力，并实现输入数据特征的深层挖掘，稀疏自编码器[13]在AE的损失函数中引入一种额外的稀疏性约束，以期控制隐藏神经元的激活程度。对于隐含层的第j个神经元，其平均输出激活程度ρj为

(7)

KL散度[14]可以用来度量两个非对称性概率分布的差别，因此引入KL散度作为惩罚项来约束ρj，因此稀疏惩罚项Ω的表达式为

(8)

式中：D为隐含层神经元的个数；ρ为稀疏参数。当ρj=ρ时，稀疏惩罚项Ω的值为零；当ρj≠ρ时，Ω会随着偏离的程度而增大，因此，SAE可以通过限制稀疏参数ρ来控制网络的平均激活度ρj，以此来实现网络的稀疏惩罚方式。

LSAE(x,z)=AE(x,z)+βΩ(ρ)

(9)

式中，β为稀疏惩罚项的权值系数。

在SAE的训练过程中，通过梯度的反向传播，使得损失函数最小化，从而更新网络中权值矩阵和偏置向量的

(10)

式中，ε为学习率。

若隐含层的维度小于输入层的维度，训练完成后就可以得到输入数据较好的隐含层稀疏表示，输入数据经编码后可有效学习输入数据中复杂的内在特征。

1.3 辅助分类生成式对抗网络

GANs由生成器G和判别器D组成，结构框架如图1(a)所示，其核心思想基于博弈论中双人零和博弈。将随机隐变量z输入至G中以尽可能产生服从真实数据分布Pdata的生成样本G(z)，G尽可能地将随机隐变量z的分布空间Pz映射到真实数据分布空间Pdata，从而产生生成样本G(z)，而D用于判断输入样本是真实样本x还是生成样本G(z)。

在GANs的训练过程中，通过最大化真实样本x和生成样本G(z)数据分布的差异来训练D，最小化这个差异来训练生成器。采用基于对抗的机制，使G和D不断优化自身的性能，最终达到“纳什均衡”，即生成样本G(z)成功误导D，从而使G实现对Pdata的近似估计。所以，GANs的损失函数为

(11)

式中， E[·]为对应分布的期望。

GANs属于无监督学习，无法区分样本的不同类别，产生的样本不可控。而ACGANs在GANs的基础上进行了改进，其结构如图1(b)所示。ACGANs的改进主要有两点：将隐变量z和类别标签c一同输入G,从而引导G产生类条件样本G(c,z)；其次，在D中添加一个softmax分类器，使其在判断输入样本是否为真实数据的同时还能计算出类别标签的概率分布。所以，ACGANs的损失函数由判别损失LS和分类损失LC构成

图1 GANs与ACGANs的结构框图Fig.1 Block diagram of GANs and ACGANs

(12)

式中：LS为判断数据真伪的损失函数；LC为数据类别标签概率分布的损失函数；DS(x)为D判断x是真实样本的概率；DS(G(c,z))为D判断生成样本G(c,z)是真实样本的概率；LD(cx|x)为D对x的分类损失，cx为x的真实类别；LD(c|G(c,z))为D对生成样本G(c,z)的分类损失；c为G(c,z)的标签。

由于D应尽可能区分生成样本和真实样本，并有效对其进行分类；G应尽可能模拟真实样本的内在分布，且同样被有效分类。

所以D的损失函数为

(13)

G的损失函数如下所示

(14)

2 稀疏编码辅助生成对抗网络故障诊断方法

基于ACGANs的传统改进框架可根据标签类别隐性学习图像信息的分布结构，但实际应用中数据扰动较大，无法直接从图像中有效学习特征，同时没有考虑生成器的输入隐变量与生成数据的联系。为利用ACGANs的特征学习能力，提高图像识别准确率，本文在ACGANs框架中添加一个稀疏编码器(sparse encoder, SE)结构，提出基于小波时频图和SAE-ACGANs 的复杂供输机构故障诊断方法。其创新点在于：①将ACGANs框架应用到故障诊断领域中，经过训练后的判别器能够直接识别输入时频特征图的真假及所属故障状态的类别，无需将生成数据和真实数据混合后，另外添加一个模型进行训练和识别；②从增加对隐变量进行图像特征约束的角度，通过预训练一个SE，对原始数据进行编码，并通过标准正态分布为编码向量添加噪声以共同构成包含真实图像特征信息的隐变量，再将之与所属类别共同输入生成器，以强化隐变量表征与图像所属类别相关特征的能力，缩小生成器学习真实样本特征空间的范围，使得图像类别特征在模型训练和识别阶段都能够得到有效保持，从而进一步提高判别器的性能。

2.1 方法原理

图2 基于小波时频图和SAE-ACGANs的故障诊断方法原理图Fig.2 Schematic diagram of fault diagnosis method based on wavelet time-frequency diagram and SAE-ACGANs

(15)

(16)

(17)

式中：Pdata(x)为原始图像的真实分布；qφ(zr|x)为编码映射分布；φ为D的参数集；Dφs(·)和Dφc(·)分别为D对输入样本真假及所属类别的概率输出；loss(·)为D预测的样本类别与真实类别之间的分类损失，本文采取交叉熵损失函数。

因此，SE和G的损失函数为

(18)

D的损失函数为

(19)

2.2 方法流程

基于小波时频图和SAE-ACGANs的复杂供输机构故障诊断方法的实现流程如图3所示，具体步骤如下：

图3 基于小波时频图和SAE-ACGANs的故障诊断方法流程图Fig.3 Flow chart of fault diagnosis method based on wavelet time-frequency diagram and SAE-ACGANs

步骤2将训练样本输入SE，编码生成隐变量zr；

步骤5基于对抗学习的方式，不断重复步骤2～步骤4，直至网络收敛，完成SAE-ACGANs的训练；

步骤6取出判别器D作为供输机构故障识别网络，将测试样本输入其中以实现故障诊断，输出诊断结果。

3 试验验证

3.1 试验设计与信号采集

某型供输机构试验平台结构如图4所示，其基本组成包括动力装置、试验台架体、控制装置、摆动机构及测试系统。试验平台采用移动式液压站为动力，待人工后座油缸返回到位后，扳机释放尾部铁块快速向后移动，尾部铁块在复进过程中为摆动机构储能。

图4 供输机构试验平台Fig.4 Bench test platform for bomb supply system

尾部铁块在滑板带动下以滚轮为支撑向后移动，用来模拟机构复进过程，之后摆动机构带动摆臂由竖直方向摆动到水平方向，用来模拟机构摆动过程。尾部铁块的滑动范围为530～770 mm，在滑板上每分钟大约滑动9次，滚轮转速约为400 r/min。工作过程中滑板和滚轮的运行状态直接影响尾部铁块移动能否到位，进而影响摆臂能否正常摆动到位，所以滑板和滚轮是决定供输机构能够正常工作的关键部件。由于滑板和滚轮无法直接安装传感器，试验在台架装置的摆动机附近和位于滚轮上方的压板机附近布置了6个振动加速度传感器，编号A1～A6，其安装位置如图5所示。传感器类型为ICP加速度传感器，采样频率为10 kHz，采用32通道的LMS信号采集系统。通过反复试验表明，滚轮正上方的测点A1所采集的数据能够有效反映供输机构的运行状态，因此选取测点A1的振动信号作为分析对象。

图5 传感器布置图Fig.5 Chart of sensor layout

为模拟供输机构关键部件故障，分别对滑板和滚轮进行人工处理，形成磨损和裂纹损伤，其最大损伤尺寸如表1所示，正常状态下的滑板和滚轮、磨损的滑板和带有裂纹的滚轮如图6所示。由此可形成三种运行状态：①状态1—正常状态(normal, NM)，所有关键零件无损伤；②状态2—滑板磨损(skateboard wear, SW)，只有一个滑板出现长带状磨损；③状态3—滚轮裂纹(roller crack, RC)，只有一个滚轮出现多条裂纹。

表1 关键部件最大损伤尺寸Tab.1 Maximum damage size of key components 单位：mm

图6 正常和损伤零件Fig.6 Normal and damaged parts

将控制装置调整至循环工作模式，对上述三种状态下分别采集振动加速度信号，其时域波形如图7所示。由于试验成本较高、周期较长，且实际生产过程中关键部件在预设寿命内更换频繁，不易进入故障状态，因此试验共采集80个NM样本、50个RC和SW样本，其中随机选取40个NM样本、10个RC和10个SW样本作为训练数据，NM、RC和SW样本各40个作为测试数据。训练集中正常样本和故障样本比例为4∶1∶1，正负样本比例悬殊且数目较小，属于典型的非均衡小样本数据集。

3.2 信号分析与参数选择

由图7可知，供输机构测得的振动加速度信号中有较大的冲击振动，仅根据振动信号时域波形难以有效区分各故障类型。另外，试验平台采用自动控制系统控制每个动作的运行时间，一个完整的动作循环时间大约为6.8 s。该动作循环主要包括4个动作：储能—复进—起摆—回摆，机构完成4个动作后各个部件回到初始位置，因此将一个动作循环称为“单位周期”，而在此期间传感器所测振动加速度信号称之为“单位周期信号”。提取RC状态下单位周期信号，其时域波形和频域波形如图8所示。通过图8(b)可知，供输机构的振动加速度信号属于典型的非平稳信号，传统的频谱分析难以提取机构故障类别的特征。

图7 振动信号时域波形图Fig.7 Time-domain waveform of vibration signal

图8 RC单位周期信号时频域波形图Fig.8 Time-frequency domain waveform diagram of RC unit period signal

选取适用于分析冲击信号的cmor3-3小波来获取时频图，其中心频率和带宽参数均为3。对三种状态下的单位周期振动信号进行CWT，所得小波时频图图像清晰且分辨率较高，时频聚焦性好，能够揭示信号冲击能量值高的区域，如图9所示。

图9 不同状态的单位周期信号时频图Fig.9 Time-frequency diagram of unit period signal in different states

由图9可知，供输机构振动信号的能量几乎分布在所有频段，且中低频段内的能量高于高频段内的能量。在一个单位周期内，随着时间变化信号出现明显的能量波动，且信号的瞬变特征明显。对比NM和RC、SW状态的时频图可知，虽然故障状态信号的能量略高于正常状态，但是无法准确根据信号瞬变过程中的差异来判断供输机构的故障状态。

采用SAE-ACGANs方法研究时，所涉及的网络超参数主要是迭代次数、批量大小和网络结构等，不恰当的超参数会使故障识别泛化能力不足而导致模型过拟合。综合考虑输入时频图的尺寸和样本量大小，采取单因素分析法[15]分析和选择使得模型故障诊断准确率最高的参数，如表2所示。

表2 模型参数表Tab.2 Model parameters table

3.3 诊断结果分析

3.3.1 特征可视化分析

为验证SAE-ACGANs方法从输入小样本中提取深度特征的优越性，利用主成分分析(principal component analysis，PCA)从判别器输出层中提取两个主成分，并与原始时频图和ACGANs判别器输出层提取的两个主成分进行可视化对比，形成的散点图如图10所示。由图10可知，原始信号三种状态下的时频图第1主成分分量均分布在-50～50，第2主成分分量均分布在-60～60，特征分布范围广且互相交叉重叠；利用ACGANs对时频图进行特征提取，其SW状态的第1主成分分量分布在-20～20，第2主成分分量分布在-3～-10，可以有效区分SW状态，但是NM和RC特征分布较为分散且互相交叉重叠；相比于ACGANs方法，SAE-ACGANs能够充分学习输入样本的类别信息，三种状态的特征分布更为集中，具有更好的聚类性能，验证了SAE-ACGANs提取深度特征的优越性。

图10 提取特征的PCA可视化对比图Fig.10 PCA visualization comparison chart of extracted features

3.3.2 诊断准确率分析

依据表2设置模型参数进行试验，并与采用相同参数和网络结构的原ACGANs框架形成对比，记录模型性能，结果如图11所示。

图11分别表示SAE-ACGANs和原ACGANs学习真实样本内在分布和预测输入样本类别的能力，生成器损失表示生成样本能够欺骗判别器的概率损耗，判别器损失表示判断输入样本是否是生成样本的损耗。由图11(a)和图11(b)可见，SAE-ACGANs因加入稀疏编码器，强化隐变量表征与图像所属类别相关特征的能力，生成器与编码器组成自编码器，能够更快地学习真实样本的特征分布(图11(a)箭头所示);随着迭代次数的增加，ACGANs的生成和分类损失接近于SAE-ACGANs，但变化幅度相对较大，不能趋于稳定，从而导致判别器进行故障诊断时性能波动较大。

图11(c)为两种框架在测试集上分类精度的对比图，在迭代次数接近160次、350次的位置，ACGANs出现较大幅度波动(图11(c)箭头所指)，同样反映出ACGANs性能的不稳定。此外，在训练后期，生成器学习到真实样本的深度特征，SAE-ACGANs的分类精度能够略微提升。

图11 SAE-ACGANs与ACGANs的性能对比Fig.11 Performance comparison chart between SAE-ACGANs and ACGANs

综上，SAE-ACGANs框架对生成器的输入隐变量进行图像特征约束，模型能够以更快的速度实现收敛，同时分类精度和稳定性都优于原ACGANs框架。

3.3.3 样本非均衡性分析

面向非均衡数据集的供输机构故障诊断问题需要更加注重对于少数类样本的识别性能，因此需要计算预测类别的查准率Pi和查全率Ri，计算公式如式(20)和式(21)所示[16]。

(20)

(21)

式中：L为数据集的类别个数；nii为第i类样本被正确预测为类别i的个数；nij为第i类样本被错误预测为类别j的个数。

查准率是分类准确性的度量，查全率是分类全面性的度量，衡量处理非均衡数据集模型的性能评价标准需要考虑二者的综合表现，从而做到兼顾多数类和少数类的识别效果。因此，为了能够在类别失衡的情况下全面、有效地评估模型的分类性能，选用分类准确率λacc、F1度量λF1和G-mean指标λG-mean作为模型综合分类性能的评价指标，计算公式如式(22)～式(24)所示[17]。

(22)

(23)

(24)

为进一步验证SAE-ACGANs框架处理非均衡数据的优越性，选取随机过采样(random over-sampling,ROS)[18]、随机欠采样(random under-sampling,RUS)[19]、合成少数类过采样(synthetic minority oversampling technique, SMOTE)[20]、自适应样本合成(adaptive synthetic, ADASYN)[21]和ACGANs五种处理非均衡样本算法进行对比分析。利用上述方法生成使得训练集中类别分布达到完全均衡的数据，即使得训练集中NM，RC和SW状态下样本数目的比例为1∶1∶1。之后对均衡数据集进行CWT，将时频图作为训练集训练与判别器网络结构和超参数设置相同的CNN，再将测试集输入其中，所得故障诊断结果如表3所示。

表3 不同算法下故障诊断结果对比Tab.3 Comparison table of fault diagnosis results under different algorithms

由表3可知，相较于原始数据集，经过六种算法优化后模型的诊断性能都有所提升。ROS算法较RUS算法结合CNN模型的诊断性能提升较小，说明相较于欠采样造成的信息缺失，过采样导致模型过拟合对于诊断性能的影响更大。而SMOTE和其衍生算法ADASYN可以根据少数样本人工合成新样本，一定程度地解决了样本非均衡问题，但增加了不同类别样本之间分布重叠的可能，故障诊断效果略逊于ACGANs和SAE-ACGANs。SAE-ACGANs算法的λacc，λF1，λG-mean指标较ADASYN分别提高9.17%，0.107 6和0.108 7，较ACGANs分别提高3.69%，0.043 8和0.052 9，因此与其他非均衡数据处理算法相比，本文提出的方法能够学习故障样本的实际分布特性，有效解决训练集样本类别分布不均衡的问题，通过稀疏编码器进一步提升判别器的综合分类能力，降低供输机构故障的漏判率。

4 结论

针对复杂供输机构智能故障诊断中存在故障样本少且类别之间存在严重非均衡的问题，本文提出了一种基于小波时频图和SAE-ACGANs的供输机构故障诊断方法，并进行了试验验证，结果表明：

(1) SAE-ACGANs可以充分学习输入样本的内在分布，有效区分不同故障类型的深度特征，具有更好的聚合性能。

(2) 相较于原ACGANs框架，SAE-ACGANs在ACGANs中添加了一个SE结构，与生成器共同组成SAE，从而对输入隐变量施加图像特征约束，进一步提升了判别器的性能，实现了模型收敛速度、训练精度和稳定性的提升。

(3) 相较于ROS，RUS等其他非均衡数据处理算法，SAE-ACGANs框架能够更有效地改善诊断模型对于多数类别样本的分类偏好问题，模型对于少数类故障样本的识别能力大幅提升。