变工况下轴承故障的残差对抗网络诊断方法*

2022-05-10 08:58洪晓翠段礼祥徐继威付强

石油机械 2022年5期

洪晓翠段礼祥徐继威付强

(1.中国石油大学(北京)安全与海洋工程学院 2.中国石油塔里木油田分公司)

0 引言

在实际工程中，机械设备(如齿轮箱和滚动轴承等)常在变工况(变速或变载)下运行[1-3]，监测信号呈现非平稳、异分布的特点，故障特征频率及其幅值也将随转速和负载而变化，具有时变特点，因此传统的以恒定转速和平稳信号为前提的故障诊断方法(如时域分析和频域分析等)难以有效提取故障特征[4]。

近年来，对变工况下机械设备故障诊断方法的研究受到了学者们的广泛关注。一些学者从降低故障特征对工况敏感度的角度展开研究，采用同步线性调频[5]、角域重采样[6]及阶比跟踪[7]等技术进行信号处理和特征提取，在一定程度上实现了变工况机械设备的故障诊断。但此类方法依赖专业的信号处理知识，且过程繁琐复杂，难以满足“工业大数据”背景下对高维、复杂及海量监测数据进行诊断分析的需求。随着人工智能技术的不断发展，机器学习逐渐被应用于机械设备的跨工况诊断。常用的方法有浅层机器学习方法(如支持向量机[8]和K-近邻算法[9]等)以及深度学习算法(如卷积神经网络(Convolutional neural network，CNN)[10]、深度置信网络(Deep Belief Network，DBN)[11]及自动编码器(Auto-encoder，AE)[12]等)。其中，深度学习算法通过复杂、非线性的映射关系学习原始数据深层次的抽象表示，能够自动从数据中提取敏感特征，成为了领域研究热点[13]。但是，上述机器学习方法建立在独立同分布假设之上，即假设训练数据和测试数据满足相同分布，它是通过训练数据获得的模型能够在测试集取得良好效果的基本保障。设备只有在平稳工况下才满足该假设，而在变工况下设备监测信号不稳定、异分布，这将导致稳定工况下训练的模型难以应用于新工况，使泛化性能大大下降。

迁移学习理论的提出为解决上述问题提供了新思路，它打破了机器学习对测试样本与训练样本同分布的局限，是一种跨领域、跨任务的学习方法[14]。对于变工况机械故障诊断，源域(训练数据)和目标域(测试数据)共享相同的特征和类别，但特征分布不同，属于跨域问题。此类问题的解决方法为领域自适应，即将源域和目标域映射到同一个公共特征空间以消除领域差异，重新形成具有相同分布的特征集[15]。不少学者从迁移学习角度出发，提出了基于迁移成分分析[16]、迁移因子分析[17]和最大平均偏差[18]等技术的领域自适应方法，但上述浅层迁移方法的特征提取能力有限，难以挖掘对所有故障敏感的域不变特征。

为解决上述问题，本文将深度学习中的残差网络(Residual Network，ResNet)与迁移学习中的领域对抗网络(Domain Adversarial Neural Network，DANN)相结合，提出一种深度迁移方法——残差对抗网络(Residual Adversarial Neural Network，RANN)，并用于变工况滚动轴承的故障诊断。首先采用滑窗取样策略从原始振动信号中截取故障样本，以此增加样本数量。接着构建包含特征提取器、故障分类器和领域判别器的残差对抗网络。其中，特征提取器采用双通道ResNet以实现多源信号的融合以及故障特征的自适应挖掘，同时通过最大化领域判别器损失和最小化故障分类器损失来实现变工况机械设备的故障诊断。最后采用美国凯斯西储大学[19]的滚动轴承故障数据集对该方法的可行性和优越性进行了验证。相比于现有基于上述数据集开展的研究[20-22]，本文提出的RANN通过采用双通道输入融合不同位置的数据可获取更加全面的故障信息。本文采用3个工况下的滚动轴承数据，共开展6组迁移诊断试验，且直接采用原始振动信号实现端到端的迁移诊断，更加简洁高效。该研究所得结论可以为变工况机械设备的故障诊断提供参考。

1 理论分析

1.1 领域对抗网络

2016年，G.YAROSLAV等[23]借鉴生成对抗网络中生成器与判别器的对抗训练策略，提出了领域对抗网络。该网络(见图1)首次将对抗学习的思想引入到迁移学习中，主要由3部分组成，包括基于CNN的特征提取器、标签预测器和领域判别器，其输出分别为：

Gf(x；p,q)=Hf(px+q)

(1)

Gy(Gf(x)；v,c)=Hy(vGf(x)+c)

(2)

Gd(Gf(x)；u,z)=Hd(uTGf(x)+z)

(3)

式中：x为输入变量，Gf、Gy及Gd分别为特征提取器、标签预测器及领域判别器的输出，Hf、Hy、Hd分别为Gf、Gy、Gd的激活函数，p、v、u分别为特征提取器、标签预测器及领域判别器的权重，uT为u的转置，q、c、z分别为特征提取器、标签预测器及领域判别器的偏置。

图1 标准域对抗网络结构示意图Fig.1 Schematic structure of a standard DANN

特征提取器将源域数据和目标域数据进行映射和混合，提取后续网络完成任务所需要的特征，使标签预测器能够准确区分数据类别(例如能将故障数据准确分为故障1、故障2、……、故障n)，同时使领域判别器无法分辨数据来自目标域或源域，以学习出具备不受领域变化影响的特征。标签预测器利用特征提取器提取的信息对源域数据进行分类，尽可能分出正确的标签。领域判别器对特征空间的数据进行分类，尽可能分出数据来自哪个域。DANN通过特征提取器与领域判别器的对抗训练来消除领域差异，提取域不变特征。它是深度学习与迁移学习的完美结合，在情感分析[24]和文本分类[25]等领域均得到了成功应用。

具体而言，特征提取器提取的特征信息传入领域判别器，领域判别器判断信息来自源域还是目标域，并计算损失Ld。在反向传播过程中，领域判别器和特征提取器中间有一个梯度反转层，即领域判别器的训练目标是尽可能正确判断特征信息所属的域类别，而特征提取器的训练目标是使领域判别器不能正确判断出信息来自哪个域，从而形成一种对抗关系。

在领域对抗模型中，前向传播时梯度反转层与普通全连接层作用相同，则有：

a=wx+b

(4)

而在误差反向传播过程中梯度方向自动取反，可得：

(5)

式中：w为梯度反转层的权重，b为梯度反转层的偏置，a为梯度反转层的输出，I为单位矩阵，x为网络输入的变量。

(6)

式中：xi为第i(i=1,2,3,……,n)个样本变量，yi表示相应标签类别，di表示领域类别，θf为Gf参数，θy为Gy参数，θd为Gd参数，DS表示源域数据集，DT表示目标域数据集，N为中间参变量，N=NS+NT，其中NS为输入的源域样本数，NT为输入的目标域样本数。

1.2 残差网络

2006年，深度学习理论[26]的提出使得CNN成为各领域研究热点。2012年，A.KRIZHEVSKY等[27]构建的8层网络包括5个卷积层和3个全连接层，在ILSVRC竞赛上取得了优异的成绩。2014年，VGGNet首次将网络的深度增加到了19层，在ILSVRC竞赛上取得了24.7%的Top-1错误率和7.3%的Top-5错误率[28]。但是，网络的性能并不会随着网络层数的增加而不断提升。研究发现，20层以上的深度网络，继续增加网络层数，分类的精度反而会降低，50层网络的测试错误率大概是20层网络的两倍[29]。

为了解决增加网络深度带来的网络性能退化问题，HE K.M.等[30]在残差学习的启发下对CNN进行改进，提出了残差网络(ResNet)。ResNet引入了恒等映射的设计，巧妙地缓解了由于深度增加带来的梯度弥散以及网络退化问题，增加了信息传递路径的数量，使网络的深度可以由几十层推至上千层[31]。

假定某神经网络的输入为x(如图像、文本、振动信号等)，期望输出为H(x)，传统神经网络直接优化H(x)，难度较大。在ResNet中，定义残差函数F(x)，并将其设为网络学习的目标，可得：

F(x)=H(x)-x

(7)

研究人员通过试验证明优化残差函数F(x)比优化原始函数映射H(x)容易得多。在残差学习模块中，左侧分支对应残差函数F(x)，右侧分支为输入x的恒等映射，两分支对应元素相加再经过ReLU激活函数，从而形成整个残差模块(见图2)。通过堆叠多个残差模块形成深度残差网络。

图2 残差学习模块Fig.2 Residual learning module

ResNet的特点是容易优化，并且能够通过增加网络深度来提高准确率。其创新点在于引入了残差学习“快捷连接(shortcut connection)”的思想，整个网络只需要学习输入、输出差别的那一部分，降低了学习难度，缓解了在深度神经网络中增加深度带来的梯度问题。目前，常用的ResNet结构有ResNet-34、ResNet-50、ResNet-101等，如表1所示。

表1 经典残差网络结构Table 1 Structure of classical residual network

从表1可见，ResNet-34中残差学习模块使用2个卷积核大小为3×3的卷积层进行运算；而ResNet-50和ResNet-101则采用3层残差学习模块，即第一个卷积层采用1×1的卷积核对数据进行降维，第二层采用3×3的卷积核进行卷积运算，最后再经过一个1×1的卷积核还原。采用这种方式既能保证网络精度，又大大减少了网络计算量[32]。

以表1中Conv1为例，“7×7”为卷积核尺寸，“64”为卷积核个数，步长为2；“3×3”为池化核尺寸，池化方法为“最大池化”，步长为2。

本文将ResNet与DANN相结合，构建残差对抗网络，在解决深度网络梯度弥散问题的同时进行领域对抗训练，实现机械设备的跨工况迁移诊断。

2 基于RANN的故障诊断方法

2.1 双通道信号融合

RGB色彩模式是工业界的一种颜色标准，通过对红(R)、绿(G)、蓝(B)3个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色。RGB图像所含信息更加丰富，更有利于进行图像识别[33]。类似地，在机械故障诊断领域，采用多通道输入进行多源信号融合可以收集更加全面的故障信息，从而提升故障诊断的准确率。

本文采用双通道输入，输入信号为1×1 024×2的双通道一维信号，为了更加直观地展示双通道信号与单通道信号的不同，将各通道信号映射到同一幅图中，如图3所示(以凯斯西储大学轴承故障数据中735 W(1 hp)负载下故障直径为0.18 mm的内圈故障为例)。从图3可以看到，双通道信号融合了各通道信号的频率和幅值等信息，突出了多通道信号输入的特点。

图3 融合信号的波形与频谱示例Fig.3 Fused signal waveform and spectrum samples

2.2 残差对抗网络构建

本文引入残差学习的思想对标准DANN进行改进，提出残差对抗网络，由基于双通道ResNet的特征提取器、故障分类器以及领域判别器3部分组成，如图4所示。

图4 残差对抗网络结构图Fig.4 Schematic structure of RANN

对于特征提取器，采用ResNet可以提取复杂数据的深层特征，解决网络深度增加引起的梯度弥散及性能退化问题，但现有的ResNet模型结构复杂、参数量大、训练时间长，计算效率不高。因此，本文以ResNet-50为基础网络框架构建双通道ResNet提取故障特征，主要修改如下：原网络结构中的Conv1、Conv2_x层数保持不变、Conv3_x和Conv4_x层各保留一个残差块，去除Conv5_x层，网络层数从50层缩减为16(1+3×3+3×1+3×1)层，如表2所示。以Conv1为例，表2中“1×7”为卷积核尺寸，“64”为卷积核个数，“stride2”为步长。

表2 双通道残差网络结构Table 2 Structure of dual-channel residual networks

此外，为获取全面的故障信息，采用双通道输入进行信号融合。相应地，在特征提取器中设置双通道卷积核进行卷积操作，如图5所示。在各通道分别进行一维卷积操作，为了将各自独立的信号联通在一起以达到信号融合的目的，将各通道在同一位置上的结果求和，则可以得到该位置的一维卷积输出[34]：

(8)

图5 双通道卷积操作Fig.5 Dual-channel convolution operation

故障分类器由输入层、两个全连接层及输出层构成，采用交叉熵[35]作为损失函数，通过最小化损失函数实现故障准确分类。交叉熵是一种常用的损失函数，计算式为：

(9)

式中：M为类别数量，x表示输入的样本，pi(x)与qi(x)分别表示输入样本属于第i类的实际概率和模型预测概率。

领域判别器由输入层、一个全连接层和输出层组成。同时，在特征提取器与领域判别器之间添加“梯度反转层”，最大化领域判别器的损失函数使其难以实现工况的准确分类，使得特征提取器提取到对工况信息低敏感度的特征，这也是“域对抗”的内涵所在[36]。

2.3 RANN迁移诊断方法操作步骤

本文构建RANN进行变工况机械设备的迁移诊断，主要步骤如下。

(1)采集设备多通道振动信号，并采用滑窗取样策略从原始振动信号中截取故障样本，以增加样本数量。

(2)按照一定比例划分训练集和测试集，用于模型的训练和测试。

(3)构建残差对抗网络，采用Adam优化算法进行模型训练，并设置学习率为0.001、批量尺寸为50，迭代次数为150。

(4)初始化网络权重和偏置，以批量方式将训练样本输入模型，逐层进行前向传播提取样本特征，计算期望输出与实际输出之间的误差；利用反向传播算法将误差进行反向传播，逐层更新网络的权重和偏置。

(5)重复步骤(3)和步骤(4)，直到将训练样本全部训练完毕且网络误差小于允许值或者达到了迭代次数，此时得到理想的RANN模型。

(6)输入测试样本，输出诊断结果。

图6 基于RANN的故障诊断方法操作步骤Fig.6 Operation steps of the fault diagnosis method based on RANN

3 试验验证

3.1 试验数据

本文采用美国凯斯西储大学的滚动轴承故障数据集进行试验验证。试验系统由1台提供驱动力的感应电机(左侧)、1台产生额定负载的测力器(右侧)以及控制电路组成，如图7所示。2个加速度传感器分别安装在电机的风扇端和驱动端以采集振动信号。试验对象为驱动端轴承，型号为SKF6205，通过电火花加工在轴承上施加单点故障。

图7 试验装置示意图Fig.7 Diagram of the experimental device

本试验同时选用电机驱动端和风扇端加速度传感器监测的振动信号，采用双通道输入以实现信号融合，采样频率为12 kHz。轴承设置有内圈故障、滚动体故障和外圈故障3种故障类型，每种故障类型又设有0.18、0.36和0.53 mm 3种不同的损伤直径，加上正常轴承，一共设置10种故障状态。试验构建了3种不同转速及负载下的数据集，如表3所示。

表3 试验数据集详情Table 3 Details of the experimental data sets

为获取大量故障样本用于深度学习模型的训练，采用数据增强(滑窗取样)策略从原始振动信号中截取故障样本，以此增加样本数量，如图8所示。样本长度设为1 024点，每种状态生成故障样本500组，随机选择400组用于训练，剩余100组用于测试，则10种状态共有训练集4 000组，测试集1 000组。

图8 滑窗取样操作Fig.8 Sliding window sampling

3.2 试验结果

基于RANN的变工况轴承迁移诊断结果如表4所示。

表4 双通道RANN诊断准确率 %

从表4可以看出，模型在源域和目标域上都取得了很高的故障诊断准确率，表明本文方法能有效克服领域分布差异，实现不同工况下轴承故障的准确分类。

为进一步定量分析残差对抗网络的性能，以A→B、A→C试验为例，绘制10种故障状态的分类混淆矩阵，如图9所示。图9中，横坐标为预测标签，纵坐标为真实标签，对角线数据则表示分类正确率。从图9可以看出，基于RANN的变工况轴承故障诊断方法能准确识别正常、内/外圈故障及滚动体故障4种故障类型，对各类故障状态的分类正确率均在97%以上，充分证明了该方法能够有效克服领域差异，提取对所有故障敏感的域不变特征，实现轴承的跨工况诊断。

图9 混淆矩阵Fig.9 Confusion matrix

为更直观地展示本文方法在各组试验中的领域适应能力，以A→B、A→C试验为例，采用t-分布邻域嵌入算法[37]对故障分类器输出层的特征进行可视化，如图10所示。图10a为原始数据可视化结果，从图10a可以看出,所有样本最初呈混乱的状态，源域和目标域数据分布不同，且各类故障间重叠较多，可区分性差。而通过RANN学习得到的特征(见图10b、图10c)聚类效果良好，各类故障间界限明晰，来自同一故障但分属不同领域的故障样本彼此之间相互重叠，结果表明，源域和目标域的样本虽然采集自不同的工况条件，但经RANN处理后，已经具有了相似甚至相同的分布规律。

图10 特征可视化Fig.10 Feature-based visualization

3.3 不同方法对比

本文方法同时选用电机驱动端和风扇端加速度传感器监测的振动信号，采用双通道输入以实现信号融合。为充分体现双通道输入的优越性，仅选用电机驱动端的监测信号进行故障诊断试验，对比结果如图11所示。从图11可以看出，采用双通道输入的平均诊断准确率(98.58%)比单通道输入(97.25%)高约1.3百分点，证明了双通道融合信号所含故障信息更加全面，能有效改善故障诊断的效果。

图11 不同输入诊断结果对比Fig.11 Comparison of diagnosis results with different inputs

同时，将本文方法与标准DANN(特征提取器为CNN)模型[38]以及非深度迁移方法——迁移成分分析(Transfer Component Analysis，TCA)[39]进行对比，结果如表5所示。从表5可以看出，相比于浅层机器学习(TCA)方法，深度学习算法(RANN、DANN)在各组试验中虽运行时间较长，但诊断准确率具有明显的优势；本文提出的基于ResNet的RANN相比于常规DANN在轴承故障诊断试验中运行时间稍长，但平均准确率提高约2.5百分点，这在故障诊断中是更为重要的。因此，综合考虑诊断精度和时间成本两方面因素，本文方法具有更佳的诊断性能。

表5 不同方法诊断效果对比Table 5 Diagnostic effects of different methods

4 结论

本文针对变工况机械设备故障诊断中监测数据非平稳、非线性、异分布的特点以及单通道信号输入难以全面表达故障特征，从而导致稳定工况下训练的分类模型性能大大下降的问题，提出一种深度迁移方法——残差对抗网络(RANN)以实现机械设备的跨工况诊断。通过变工况滚动轴承迁移诊断试验证明了该方法的可行性和有效性，得出以下结论。

(1)将残差网络(ResNet)与领域对抗网络(DANN)相结合，可有效提取深层故障敏感特征，同时缓解深度网络面临的梯度弥散及性能下降问题。相比于标准DANN，特征提取及故障诊断效果均有所改善，平均准确率提升了约2.5百分点。

(2)相比于浅层迁移方法，如迁移成分分析(TCA)等，本文提出的残差对抗网络通过特征提取器与领域判别器的对抗训练可以自适应逐层提取对工况信息敏感度低的域不变特征，有效克服领域分布差异，具有更佳的诊断性能。

(3)采用双通道输入可有效融合多源信号，获取各通道信号的频率和幅值等信息，为故障诊断提供更加全面的信息基础。相比于单通道输入，采用双通道输入的平均故障诊断准确率提升约1.3百分点。