基于改进一维残差网络的轴承故障诊断

2021-09-15 00:59侯立群
仪器仪表用户 2021年9期
关键词:正确率残差故障诊断

刘 岚,侯立群

(华北电力大学 自动化系,河北 保定 071003)

0 引言

故障特征提取和故障分类是设备故障诊断的两个主要步骤。故障特征提取方法可分为时域法、频域法和时频分析法。时域法和频域法的统计参数很难充分反映设备运行状态的动态变化,而时频分析法获得的故障特征通常维度较高、数据量大。此外,设备运行环境和工况的变化也会增加故障特征的复杂性。这无疑增加了常用故障分类器(如支持向量机和人工神经网络)的训练难度[1]。

深度学习具有超强的学习能力。卷积神经网络(CNN)作为深度学习的重要模型之一,得到了广泛应用[2,3]。由于2D CNN在图像识别领域的成功应用,许多研究者利用2D CNN进行故障诊断[4,5]。也有文献发现,与单独使用CNN相比,利用组合方法,先对故障信号进行处理,再进行故障分类,能提高分类精度[6-8]。但是,振动信号是时域下的一维信号,上述方法可能会导致原始振动信号部分特征信息的丢失。此外,信号变换过程往往需要依赖专家经验,这可能造成原始特征的丢失。因此,适用于图像处理的2D CNN并不是最适合1D信号处理的网络模型。

一维卷积神经网络(1D CNN)的卷积核是一维的,振动信号无需复杂的信号处理就可直接输入1D CNN。近年来,研究者们开始尝试利用1D CNN进行故障诊断[9-12]。例如,Turker Ince等人[12]将电机电流信号输入1D CNN,同时实现故障特征提取与故障分类。

然而,上述网络也存在一些问题。1D CNN直接输入高维信号时,需要增加网络层数来增强对输入信号深层特征的提取能力,这明显增加了网络结构和参数量[13]、计算复杂度和计算资源消耗量,还容易导致梯度消失或梯度爆炸等问题[14]。Kaiming He等人提出的深度残差网络[15](ResNet)解决了上述问题,并成功地应用于图像处理领域。传统深度残差网络(ResNet)的卷积核是二维的,其残差块仅有一条残差连接通道,可通过残差学习训练网络权重,从而有效地解决了深度CNN梯度爆炸和性能下降问题,提高了网络训练效率,并成功地应用于故障诊断领域[16-18]。Li等人[18]提出用一维的卷积核代替传统残差网络卷积核的一维残差卷积神经网络(1D-RCNN)进行轴承故障诊断,以便直接从原始信号中提取特征。

虽然,残差网络展现了训练深层网络的优越性,但也存在一些问题。例如,需要倍增网络层来提高识别准确率[19]、参数量大。因此,如何减少特征重用,提高训练效率是训练深层网络需要解决的重要问题。针对上述问题,本文将一维卷积网络与改进的残差网络相结合,提出了一种基于改进一维残差网络的轴承故障诊断方法。该方法对传统残差网络的残差块连接方式进行了改进,通过添加一条残差连接通道的方式来增加残差网络宽度,减少网络层数,提高网络诊断准确率。该方法无需额外的信号处理和专家经验,便能有效提取轴承故障特征。

1 改进一维残差网络模型

一维卷积网络的卷积层能够从原始信号中提取特征,避免了信号处理算法带来的误差。但是,分类较长的原始信号往往需要更多的卷积层。为了提高故障特征提取效率,简化网络权值的训练过程,本文将一维卷积网络与改进的残差网络结合,提出了一种基于改进一维残差网络的轴承故障诊断方法。

本文所用CNN的网络结构如图1所示。

图1 本文所用CNN的网络结构Fig.1 Network structure of this paper

1.1 1D CNN

输入层:将不同工况下的一维振动信号作为输入信号,并采用滑动分割法,获得更多的实验样本。滑动分割法的基本原理如图2所示。该方法可保持信号的连续性,使模型具有更强的鲁棒性,并有效减少过拟合现象。其分段计算公式如下所示:

图2 滑动分割法Fig.2 Sliding segmentation method

其中,n为振动信号的采样点数;L0为重叠的数据点;L为每个样本所包含的数据点数;N为每类样本数量。

本文中L0为256,L为1024,N为150。本文共采用6种轴承状态,每种轴承状态150个样本,共900个样本。

卷积层:卷积层通过卷积核与其覆盖区域的数据进行点积运算来提取高维特征。一维卷积运算输出特征图的大小如下所示:

其中,H0是输出特征图大小;Hi是输入特征图大小;K是卷积核大小;P是补零层大小;S是卷积步长。本文所用网络的第一层卷积核大小为1×30,核数为24,步长为2。

全局平均池化层:由于全连接层参数量较大,在深度学习中常采用全局平均池化层代替全连接层,本文所用全局平均池化层大小为1×23,步长为1。

1.2 改进的残差网络

在训练深度学习网络时,由于其初始权值一般接近零,浅层参数可能无法更新,容易产生梯度消失问题。随着训练的加深,冗余的网络层学习了不是恒等映射的参数,就会产生退化现象。深度残差网络[15](ResNet)的提出可使网络的信息跨层流动,能减少因多层非线性变换造成的原始特征流失,充分发挥深层CNN强大的学习能力。残差网络将由多个非线性层拟合的复函数L(x)转化为残差函数(R(x)=L(x)-x),其中,x是这些层的输入。残差连接输出为:

其中,yl是残差连接的输出;xi是输入;F(xi,Wi)表示神经网络的非线性变换层;h(xi)表示旁路的传递函数。

传统残差网络(ResNet)的残差块如图3所示,输出Y由卷积层的输出与残差通道的输出相加求得。卷积层之后加入批量归一化(BN)规范化前一层输出,ReLu函数添加在卷积层之后。如果两层卷积层的输出与残差通道的输出维度相同,则只需要简单地线性相加,如图3(a)所示。若维度大小不相同,需要设置残差连接上1×1卷积核的步长,如图3(b)所示,来更改低层网络输出的维度大小。

图3 传统残差网络的残差块Fig.3 Residual blocks of traditional residual network

传统残差网络(ResNet)的残差块只有一个残差连接通道将低层网络的特征输入到高层网络。当误差反向传播时,残差块并没有足够的权重来学习特征,大部分残差块只能共享少量信息,这就造成了故障特征重用的减少[19]。

本文设计了一种加宽的一维残差块,其结构如图4所示,图4(a)适用于输入输出数据维度相同的情况,图4(b)适用于输入输出维度不同的情况。

和传统的残差块相比,该加宽一维残差块的卷积核都是一维的,并增加了一条残差连接通道。1×3卷积核的参数量仅为传统3×3卷积核的1/3。一个加宽一维残差块的参数量也仅为一个传统残差块的2/3。因此,该残差块能够有效减少网络参数量,提高网络训练效率。此外,加宽的网络结构能使每一层网络获得更加丰富的故障特征[20]。因此,无需增加残差块的数量便可提高故障分类的正确率。本文所提网络的4个宽残差块采用图4(b)所示的结构,残差块中每一个通道的卷积步长分别为2、1,1×1卷积核的步长为2。核数分别为24、12、6、n。其中,n是待分类的轴承状态数。本文是对6种轴承状态进行分类,因此残差单元核数为6。

图4 加宽的一维残差块Fig.4 Widened 1D residual blocks

2 实验验证

实验采用凯斯西储(CWRU)轴承数据中心[21]驱动端故障和风机端故障的数据。两种数据的轴承型号分别为SKF6205和SKF6203。安装在驱动端的加速度传感器负责采集振动数据,采样频率为12kHz。电机转速为1797r/min,载荷是0HP。

CNN在故障诊断方面的应用往往基于海量数据的训练学习,实际应用中可供网络训练的样本数往往较少。为了研究所提网络在不同训练样本与测试样本数量比下所能达到的分类正确率,将900个样本打乱并从中随机划分训练样本与测试样本。其比率设置为7:3,5:5,3:7,1:9。

2.1 驱动端故障实验

本实验对正常与故障尺寸为0.007英寸的驱动端故障和正常与故障尺寸为0.021英寸的驱动端故障进行诊断。每次实验选取6种轴承状态,具体见表1。

表1 轴承实验数据集Table 1 Experimental data set of bearing

每种轴承状态取150个样本,共900个样本。由于外圈故障是静止故障,因而故障相对于轴承负载区的位置直接影响轴承系统的振动响应。为了测试网络是否能明确区分外圈不同位置的故障,本实验选用了外圈6点、外圈3点和外圈12点,3种外圈故障。为了增强数据表现,提高网络训练效率,使用min-max标准化方法预处理正常与故障尺寸为0.007英寸的数据,将其映射到[-1,1]区间。采用Z-score标准化方法预处理正常与故障尺寸为0.021英寸的数据,使之均值为0,标准差为1。

实验结果见表2。可见,本文所提网络在4种训练与测试样本比率下的正确率均在99%以上,当训练样本数仅为总样本数的10%时(样本总数900,训练样本数90),两个数据集的错分样本数也不超过3个。上述结果表明,在分类正常和驱动端故障数据时,本文所提网络在样本数量较少时仍有不俗的表现。

表2 不同比率下两个轴承数据集的测试结果Table 2 Test results of two bearing datasets at different ratios

两次实验中,训练样本与测试样本为1:9的混叠矩阵如图5所示。

由于从打乱的900个样本中随机划分训练样本与测试样本,因而各种轴承状态的测试样本数量并不全是总测试样本数的1/6。例如,图5(a)中并不是每种轴承状态的测试样本个数都是135,其中NOR是137,DE-IR是135、DE-B是 141、DE-OR6是 127、DE-OR3是 138、DEOR12是 131。

图5 比率为1:9时两个数据集的混叠矩阵Fig.5 Confusion matrix of two datasets with ratios of 1:9

2.2 风机端故障实验

为了测试网络对风机端故障的分类效果,利用1797r/min转速下的正常状态(NOR)和故障尺寸为0.007英寸的风机端的内圈故障(FE-IR)、滚珠故障(FE-B)、外圈6点故障(FE-OR6)、外圈3点故障(FE-OR3)、外圈12点故障(FE-OR12)数据对网络进行测试,每种轴承状态取150个样本。使用min-max标准化方法预处理数据,将其映射到[-1,1]区间。实验结果见表3。

1:9比率下的混叠矩阵如图6所示。

图6 比率为1:9时正常和风机端故障的混叠矩阵Fig.6 Confusion matrix for normal and fan end failure at ratios of 1:9

由表3可知,当样本比率为1:9时故障诊断正确率为90.49%;但当训练样本数达到总样本数的30%以上时,分类正确率能达到97.3%以上。

表3 不同比率下正常和风机端故障的测试结果Table 3 Test results of normal and fan end failure under different ratios

2.3 5倍交叉验证

本节采用5倍交叉验证技术对网络泛化能力进行进一步评估,测试数据为上述2.1节、2.2节所用的测试数据。5倍交叉验证是将所有样本数据平均分为5份,每次取其中的4份用来训练网络剩下的1份进行测试。通过对5次不同数据分类结果取平均值的方法,避免了因随机划分训练样本与测试样本对网络分类正确率的影响,能够更好地评估网络在该组数据下的泛化能力。

经实验验证,网络在这3类测试数据下的5倍交叉验证的平均结果均能达到100%,说明所提网络在这3种测试数据下,能够正确区分各类轴承状态,有显著的泛化能力。

2.4 与其他网络的对比

为了进一步验证网络的优越性,将传统的一维卷积网络(1D CNN)、一维深度残差网络(1D ResNet)与本文提出的网络进行对比。测试数据为0.007英寸故障的驱动端和风机端数据,即2.1节中的数据集1和2.2节所用数据。1D ResNet的卷积核是一维的,每个残差块只有1个残差连接通道,参数与本文提出的网络参数相同。为了避免随机划分测试集和训练集的不均衡问题和初始化对实验结果的影响,比率为1:9时,取10次运行结果的平均值作为最终结果。实验结果见表4、表5。

表4 3种网络正常和驱动端故障的正确率Table 4 Correct rate of normal and drive end failure of three kinds of networks

表5 3种网络正常和风机端故障的正确率Table 5 Correct rate of normal and fan end failure of three kinds of networks

可见,虽然当样本比率为1:9时,3种网络的正确率均较低,但是本文所提网络的故障分类正确率高于1D CNN和1D ResNet的正确率。

3 结论

本文将一维卷积网络与改进的残差网络结合,提出了一种基于改进一维残差网络的轴承故障诊断方法,并利用6种轴承状态对所提方法进行了实验验证。实验结论如下:

1)该方法能从原始振动信号中直接提取有效故障特征,避免了依靠人工经验提取故障特征的影响。

2)加宽的残差网络改善了残差网络特征重用减少的问题,能够从较长的原始信号中学习更丰富的特征,提高了诊断精度,简化故障诊断过程。

3)利用6种轴承状态对所提方法进行了分类效果测试。当训练样本为90,测试样本为810(训练与测试样本比为1:9)时,驱动端故障诊断的正确率为99.6%;当训练样本为270,测试样本为630(训练与测试样本比为3:7)时,风机端故障的正确率为97.3%。本文所提网络的故障诊断正确率高于1D CNN和1D ResNet。此外,5倍交叉验证实验的结果,证明了所提网络具有较强的泛化能力。

猜你喜欢
正确率残差故障诊断
基于双向GRU与残差拟合的车辆跟驰建模
基于包络解调原理的低转速滚动轴承故障诊断
门诊分诊服务态度与正确率对护患关系的影响
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
数控机床电气系统的故障诊断与维修
生意
品管圈活动在提高介入手术安全核查正确率中的应用
生意
因果图定性分析法及其在故障诊断中的应用