基于轻量化卷积神经网络的滚动轴承快速故障诊断方法

2023-09-02 07:06王国新徐兴伟汝洪芳谢子殿
黑龙江科技大学学报 2023年4期
关键词:集上故障诊断准确率

王国新, 徐兴伟, 汝洪芳, 谢子殿

(黑龙江科技大学 电气与控制工程学院, 哈尔滨 150022)

0 引 言

滚动轴承是电机设备的重要元件,但同时也较容易受损伤而出现故障,影响整个电机设备的性能[1],因此,开发一种可用于工业环境的轴承故障识别方法具有重要意义。深度学习方法可以直接从原始数据中学习到具有代表性的特征,并将特征提取与故障诊断相结合[2],是一种端到端的模型。唐斯等[3]通过模型对比发现,在电机轴承故障诊断方面,与基于特征工程的方法相比,基于深度学习的方法更具优势。赖华友等[4]构建了基于dropout技术的一维卷积神经网络进行轴承故障诊断。王琦等[5]提出一种改进一维卷积神经网络(FRICNN-1D)的滚动轴承故障识别方法。彭成等[6]将正态分布与莱维飞行(NLF)相结合,并以此提出NLF-LSTM的滚动轴承故障诊断方法。郑直等[7]提出改进鲸鱼算法优化LSTM的滚动轴承故障诊断方法。黄晓玲等[8]采用了深度残差网络进行滚动轴承故障诊断。可以发现,现有方法多是将一维的信号直接输入长短时记忆网络或一维卷积神经网络进行训练,或者是通过参数量较大的残差网络实现故障诊断,但是现阶段提出的方法仅在固定的工况下有较高的准确率,在变工况下故障识别率低。由于深度学习模型本质上具有高度可复用性,因此它们可以与迁移学习相结合,利用现有数据实现新领域的分类。

笔者提出了利用轻量化卷积神经网络实现对滚动轴承快速故障诊断的方法,使用轻量化卷积神经网络对彩色时频图进行特征提取,并引入迁移学习,提高变工况下故障识别的准确性。

1 小波与神经网络

1.1 小波变换

小波变换[9]是时频法的一种,它使用的小波基是有限且衰减的,可以同时获得频率和时间信息。相比于短时傅里叶变换,小波变换在时间分辨率和频率分辨率方面具有更好的性能平衡。相比于离散小波变换,连续小波变换产生的小波系数能描述信号的整体特征,对于相似信号的识别和分析更有利。

对于函数f(t)∈L2(R),该函数的连续小波变换公式为

CWTf(a,τ)=[f(t),ψa,τ(t)]=

式中:ψa,τ(t)——小波基函数;

a——尺度因子;

τ——平移因子。

连续小波变换在选择小波基时应该相似于分析对象的特性,因此,文中选择cmor3-3作为小波基。

1.2 卷积神经网络

卷积神经网络具有强大的图像处理能力,是一种应用广泛的深度学习模型。传统的CNN由卷积层、池化层、全连接层和softmax分类器构成。由于卷积层学习的是局部模式并具有平移不变性,从而可以有效地利用数据进行感知任务。此外,CNN的多层结构能够从大量数据中提取深层次的关系,避免人工特征提取,从而实现特征工程的自动化[10]。

1.3 迁移学习

迁移学习(Transfer learning,TL)的定义[11]如下:给定源域Ds={Xs,P(Xs)}和学习任务Ts={Ys,fs(·)}、目标域Dt={Xt,Q(Xt)}和学习任务Tt={Yt,ft(·)},迁移学习的目的是获取源域Ds和学习任务Ts的知识,以改进目标域中预测函数ft(·)的学习,其中,Ds≠Dt或Ts≠Tt。

对于CNN模型,Yosinski等发现,低层特征具有很强的可迁移性,更高层次卷积层的特征是与特定任务相关的抽象特征,不适合迁移,需要在新数据集上重新训练。基于这一结论,文中采用冻结低层网络参数,使用轴承故障数据重新训练高层网络参数的迁移学习方法。

2 滚动轴承快速故障诊断方法

2.1 小波变换构建图像数据集

文中振动信号数据选自美国凯斯西储大学(Case Western Reserve University, CWRU)和渥太华大学轴承试验台,其中,凯斯西储大学数据集驱动端轴承型号为SKF6205,采样频率为12和48 kHz,风扇端轴承型号为SKF6203,采样频率为12 kHz,文中选取采样频率为12 kHz的驱动端轴承振动数据。该试验台用加速度传感器对振动信号进行采样,包含四种类型的样本:正常状态、内圈故障、滚动体故障和外圈故障。其中,转速有1 730、1 750、1 772和1 797 r/min四种,分别对应四种不同的工况。在各工况下,除正常状态外,滚动体、内圈、外圈分别引入直径为0.007、0.014和0.021 inch的单点故障,因此每个工况有10种类型,选取转速为1 797 r/min、单点故障直径为0.007 inch的内圈故障振动信号数据,数据点1~5的幅值分别为-0.083、-0.196、0.233、0.104和-0.181 m/s2。渥太华大学数据集包含在时变转速条件下收集不同健康状况的轴承振动信号,有两个试验设置,分别为轴承健康状况和转速条件,采样频率为200 kHz,采样时间为10 s,选取第一组数据进行试验。轴承的健康状况包括健康、内圈故障、外圈故障、滚动体故障,以及内圈、外圈和滚动体组合故障,转速条件包括增加速度、降低速度、增加然后降低速度和降低然后增加速度,如表1所示。其中,H-A-1、H-B-1、H-C-1等为数据文件的名称。在凯斯西储大学数据集中对转速为1 979 r/min工况下的振动信号进行连续小波变换,得到彩色时频图(大小为236×236),如图1所示。

图1 时频图Fig.1 Time-frequency diagram

表1 渥太华大学数据集轴承健康状况和转速条件

2.2 轻量化卷积神经网络

文中提出了利用轻量化卷积神经网络(Lightweight Convolutional Neural Network)实现对滚动轴承快速故障诊断的方法,其网络模型以下简称LCNN,设计主要包含卷积层、BN层、最大池化层以及全局平均池化层的网络结构,缓解复杂学习模型参数冗余的问题,将网络训练参数量降至148 362和145 797个,模型结构如图2所示。

图2 模型结构Fig.2 Model structure

前两个卷积层使用常规卷积,第三个卷积层使用深度可分离卷积(Depthwise seperable convolution),其包括逐通道卷积(Depthwise convolution)和逐点卷积(Pointwise convolution),深度可分离卷积的使用可有效降低网络训练参数量。卷积层的激活函数选择Relu函数,即为线性整流函数(Rectified linear unit),可以起到防止“梯度消失”的作用。卷积层后添加的BN层可以让网络模型的收敛速度更快,更有利于网络模型的训练,且可以抑制过拟合。池化层的池化方式选择最大池化,起到降低维度的功能。全局平均池化层没有训练参数,代替传统卷积神经网络所使用的全连接层后,可明显降低网络训练参数的数量。

对模型进行训练时,以不改变原图像大小进行输入,在训练集和测试集上均取得较好的效果。网络模型的具体参数为:前三个卷积层的滤波器分别为3×3×64、3×3×128、3×3×128和1×1×512,步长均为1,激活函数均使用“relu”,填充均设置为“same”。池化层大小均是2×2,步长均为2。

2.3 小样本迁移

在凯斯西储大学数据集中变工况下进行域适应方案设置。其中,源域是指训练数据,目标域是指测试数据。A、B、C、D分别指转数为1 797、1 772、1 750和1 730 r/min下的数据集。基于4种工况数据集的组合,有12种域适应方案。分别是源域为训练集A,目标域为测试集B、测试集C和测试集D,源域为训练集B,目标域为测试集A、测试集C和测试集D,源域为训练集C,目标域为测试集A、测试集B和测试集D,源域为训练集D,目标域为测试集A、测试集B和测试集C。

对于在变工况下的故障诊断问题,采用小样本迁移的方法对模型进行调整[12],具体操作是使用源域工况图像训练集训练生成的模型,冻结其前两个卷积层、BN层网络参数,第三个卷积层、BN层和SoftMax层网络参数使用目标域工况小样本图像训练集重新训练。

3 实例分析

3.1 试验验证与参数设置

试验在凯斯西储大学数据集和渥太华大学数据集中进行。在凯斯西储大学数据集中所使用样本的长度为1 024个采样点,使用重叠采样,重叠比例为0.5,通过连续小波变换,共得到8 000个样本。其中,每一种工况得到2 000个样本。在渥太华大学数据集中所使用样本的长度为1 024个采样点,通过连续小波变换,共得到32 000个样本。其中,每一种转速条件下得到8 000个样本。划分数据集时训练集、验证集与测试集的彩色时频图样本数量比例为6∶2∶2。在凯斯西储大学数据集上进行试验,分别绘制模型在工况B训练集与验证集上的损失函数和准确率曲线,如图3和图4所示。

图3 训练与验证损失函数曲线Fig.3 Training and validation loss function curve

图4 训练与验证准确率曲线Fig.4 Training and validation accuracy curve

验证在Ubuntu 20.04.4 LTS的操作系统下进行,处理器为Intel Xeon(R) Gold 6226R CPU @ 2.90 GHz×64。所用深度学习框架为TensorFlow和Keras,编程语言为Python 3.9。参数的设置有迭代次数为30,批处理样本数目为16,优化器为Adam,学习率为0.001,损失函数为Sparse_categorical_crossentropy。

3.2 单一工况对比

为了验证文中所提方法的优越性,将文中方法与WDCNN、TICNN、LSTM、LeNet-5[13]和Resnet-18网络在相同试验环境中进行单一工况、变工况对比分析,均重复10次试验。在凯斯西储大学数据集上进行试验,对文中模型在工况A测试集上的分类结果绘制混淆矩阵,如图5所示。其中,横坐标代表样本被预测的标签值,纵坐标代表样本真实的标签值。

不同模型在凯斯西储大学数据集上单一工况下的准确率对比,如表2所示。由表2可知,在单一工况下,各个模型的平均分类准确率都可达到95%以上,但是LCNN的平均分类准确率可达到99.99%,且在训练集上遍历一次仅需要2.5 s。

表2 CWRU单一工况准确率对比

在渥太华大学数据集上进行试验,不同模型在渥太华大学数据集上单一工况下的准确率对比,如表3所示。其中,A1、B1、C1和D1分别对应增加速度、降低速度、先增速后降速和先降速后增速的转速条件。由表3可知,在时变转速条件下,各个模型在渥太华大学数据集上的分类准确率都有所下降,LCNN的平均分类准确率为92.55%,在训练集上遍历一次仅需要9 s。

表3 渥太华大学数据集单一工况准确率对比

3.3 变工况对比分析

对比分析各模型在凯斯西储大学数据集中12种域适应方案下的故障诊断准确率结果,如表4所示。表中的域设置A→B表示将工况A下训练生成的模型,迁移应用到工况B下的轴承故障诊断。

表4 变工况准确率对比

变工况下选取源域工况数据集的60%样本作为训练集,选取目标域工况数据集的80%样本作为测试集。由表4可知,受变工况运行条件的影响,这些模型的准确率较单一工况下降了很多。而LCNN的平均准确率达到了92.50%,比WDCNN提高了46.54%,比TICNN提高了49.11%,比LSTM提高了55.07%,比LeNet-5提高了6.24%,比Resnet-18提高了9.58%,模型的域适应性明显提升,泛化能力提高。对于在变工况下的故障诊断问题,采用小样本迁移的方法对模型进行调整,为了较好平衡性能提升与小样本大小,将目标域工况数据集中20%的样本作为小样本训练集,剩下的目标域工况数据集样本作为测试集。采用小样本迁移(TL-LCNN)与直接应用的方法开展对比试验,当采用小样本迁移的方法时,模型的平均准确率达到了99.87%。

4 结 论

提出利用轻量化卷积神经网络实现对滚动轴承快速故障诊断的方法,分别用于诊断10类不同类别、不同损伤程度、不同转速量和5类不同类别、不同转速条件的轴承故障信号。结果表明,所提出的轻量化卷积神经网络模型训练参数量少,训练速度快,能够有效提取故障信号特征,对数据规模需求小,适用于现阶段工业轴承故障数据稀缺的实际情况。对变工况下的故障诊断问题,采用小样本迁移的方法提高诊断准确率,其方法有效提高了诊断模型的域适应性,可适用于变工况下的故障诊断。

猜你喜欢
集上故障诊断准确率
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
Cookie-Cutter集上的Gibbs测度
链完备偏序集上广义向量均衡问题解映射的保序性
高速公路车牌识别标识站准确率验证法
复扇形指标集上的分布混沌
因果图定性分析法及其在故障诊断中的应用
基于LCD和排列熵的滚动轴承故障诊断
基于WPD-HHT的滚动轴承故障诊断