基于WT-CNN 深度学习的轴承故障识别

2022-01-14 10:05杨广YANGGuang喻柄睿YUBingrui杨志慧YANGZhihui陈代俊CHENDaijun刘世林LIUShilin
价值工程 2022年2期
关键词:时频卷积轴承

杨广 YANG Guang;喻柄睿 YU Bing-rui;杨志慧 YANG Zhi-hui;陈代俊 CHEN Dai-jun;刘世林 LIU Shi-lin

(重庆交通大学机电与车辆工程学院,重庆400074)

0 引言

轴承作用于各种旋转机械设备中,其作用不言而喻。然而在工业中,轴承也是最易发生故障的零件之一。实现轴承故障快速检测和识别对提高设备寿命以及保障工人安全具有重要作用[1]。针对轴承数据将原始轴承信号数据转换为二维时频图像,使用卷积神经网络结构提取特征并自动实现故障分类。采用连续小波分解(CWT)将提取的信号转换为二维时频图像,准确重构和无冗余分解使得小波分解能够更好的表现时频特征和区分信号的频带。WTCNN 模型可以实现自动提取特征并分类,降低了计算复杂度以及耗时问题,并提高了识别精度。

1 原始信号转换时频图

连续小波变换对一维时间序列信号的处理结果可以用二维图的形式表示,即时频图。时频图是对一维时间序列信号的时间和频率的综合分析,与一维信号相比,时频图能更细致、全面地反映原始信号的特性。

给定一个基本函数ψ(t),将其进行平移和拉伸得到:

式中,τ,a 均为常数,且 a>0,当 τ,a 分别取不同值时,可得到一簇函数[2]。当函数 ψ(t)满足式(2)-(4)时,ψ(t)可称为小波母函数或基本小波,ψτ,a(t)称为小波基函数。

其中,L2(R)表示能量有限空间,a 是尺度因子,表示与频率相关的缩放,τ 是平移因子。a 和τ 是决定频域和时域中小波窗口的位置[3]。时域信号经过小波变换得到尺度域,然后获得信号尺度的频率分布图得到时频图,如式(6)。

其中,Fc为小波的中心频率,Fs为信号的采样频率;Fa为与尺度a 对应的实际频率。

本文的实验对象是轴承信号,由于Morlet 波形与轴承冲击振动特征接近[4],即基函数选择Morlet 波形。cmor 小波的表达式如式(7):

其中,Fb是带宽因子,Fc是中心频率因子。

2 WT-CNN 模型原理

2.1 VGG-16

VGG-16 是基于ImageNet 数据集得到的预训练卷积神经网络模型,如图1 所示是VGG-16 的网络结构,与传统的卷积神经网络相比使用的卷积滤波器尺寸较小(3×3),小尺寸滤波器有利于局部特征的提取,使得网络参数更少,决策函数区分更高,常被大量研究人员用于图像识别任务中的特征提取,并取得了不错的效果。

卷积操作、目标损失函数和网络结构参数的更新是卷积神经网络的重要组成部分。卷积层进行提取特征,权重共享降低参数计算,多个卷积核聚合了许多特征,形成特征图像。给定图像M 的大小为m 行和n 列,则卷积计算公式如式(8)。

式(8)中,β 是尺寸为(k,l)的卷积核。交叉熵函数作为目标损失函数,公式如式(9)。

其中,p(x)和 q(x)分别是样本集的实际概率分布和预测概率分布,交叉熵H(p,q)表示两个概率之间的差异[5]。在训练过程中,本文采用随机梯度下降法对全连接层中的权值和偏差进行更新,其更新公式如式(10)-(13)。

式(11)和式(13)中,η 表示学习速率。

“分布式特征表示”映射到标签空间的全连接层组成浅层神经网络的多层感知器,相邻全连接层之间的神经元直接相连,式(14)给出了这种关系的公式。

式(14)中ω 和b 分别表示相邻神经元的权值和阈值,x 和y 分别表示前层神经元和当前层神经元的输出结果,i 和j 分别表示前层和当前层的神经元个数[6]。在卷积神经网络全连接层最后连接分类器是softmax,softmax 层输出输出每个类别的概率分布,输出概率计算如式(15)。

本文所提出的WT-CNN 神经网络模型中,特征提取层采用的是VGG-16 模型中的卷积网络层进行特征的自动提取[7]。采用迁移学习方法[8],将VGG-16 预训练模型参数迁移到WT-CNN 模型中,并进行微调以适应本研究的轴承故障时频图。

2.2 迁移学习

包括 GoogleLenet、VGG16 和 AlexNet 等神经网络在内的卷积神经网络(CNN)都显示出了他们出色的分类能力,但他们在训练上需要花费大量的时间。此外,本文所使用的轴承数据集是小量的,不适合通过深层网络进行训练。正好迁移学习可以解决这个问题。它只需要替换CNN 原始结构的最后三个层,包括全连接层、Softmax 层和输出层,为了完成迁移学习,输出层的输出是每个类别的交叉的熵,迁移学习原理示意图如图1 所示。

图1 迁移学校原理示意图

2.3 基于WT-CNN 的轴承故障识别方法

本文所提出的基于WT-CNN 神经网络模型轴承故障识别方法流程如下:首先利用连续小波分解(CWT)将截取的信号转换成二维时频图,CWT 能够准确的表现时频特征和区分信号的频带;然后采用WT-CNN 模型的卷积层进行时频图的特征提取,有效的避免了人工干预的特征提取;最后将提取出的特征输入分类器,并完成故障识别任务。本文研究流程图如图2 所示,其具体步骤如下:①首先将每类一维原始数据进行数据截断处理,构造数据样本;②采用CWT 将截断信号进行二维时频图的生成,并制作成训练数据和测试数据;③将训练数据输入WT-CNN 模型进行特征提取,并完成模型的训练;④最后将测试数据输入到已经训练好的WT-CNN 神经网络模型中进行轴承故障的识别。

图2 WT-CNN 故障识别流程图

3 结果与分析

3.1 数据描述与预处理

本文采用的数据来源于Paderborn 大学实验室,对6203 型滚动轴承以高分辨率和采样率同步测量得到的轴承振动信号,数据样本总共分为三类:健康轴承、人为损坏的轴承和由加速寿命测试而造成损坏的轴承,其中人为损失由两种不同的方法造成:电火花加工(轧向槽长0.25mm,深度 1-2mm)和钻孔(直径:0.9mm,2mm,3mm),损伤部位为内圈和外圈;加速寿命损伤轴承失效部分出现在轴承的内圈外圈,选取健康轴承加速实验直至出现点蚀、压痕和塑性变形等即为损伤轴承。三类轴承每类轴承均包含四种采样条件,每种条件采样10 次,其中四种采样条件分别为:转数900rpm、转矩0.7Nm 和径向力1000N 的采样条件;转数1500rpm、转矩0.1Nm 和径向力1000N 的采样条件;转数1500rpm、转矩0.7Nm 和径向力400N 的采样条件;转数1500rpm、转矩0.7Nm 和径向力1000N 的采样条件;本文采用前三种采样条件下的数据来预测第四种采样条件下的轴承类型;图3 是三类轴承的原始信号图。

图3 原始轴承信号

本文对于原始信号首先采取的是数据截断处理,将一维原始信号依次截成每个样本信号为2048 个点的新样本信号。每个原始信号样本点数都达到了25 万个点,样本长度过大,采取截断操作,既对样本长度进行了缩减,又对样本数量进行了扩充。

3.2 实验结果及分析

本文模型的训练参数设置如下:权值学习率影响因素为12、偏差学习率影响因素为10、最小批次的样本数为16、最大完整训练次数为2、训练的初始学习率为0.0001。将3类轴承数据的训练集和验证集输入到WT-CNN 模型中进行训练,测试集输入到训练完成的WT-CNN 模型中进行测试[9],得到混淆矩阵结果图如图4 所示。将本文方法以及数据与Alexnet 和VGG-16 等深度学习模型进行对比实验。

图4 的横向坐标表示实际标签,纵向坐标表示预测标签,标签‘1’、‘2’和‘3’分别表示了健康标签、人为损坏标签和加速寿命测试损坏标签,矩阵的右下角表示预测结果的准确率。本文方法在轴承故障分类识别中,具有良好的分类效果,其准确率达到了100%。

图4 WT-CNN 混淆矩阵

4 结论

针对传统的轴承故障识别方法中,信号数据从单一的时域或频域中提取故障特征对原始信号表达不完全的问题,以及需要人工构造算法提取特征以及人工筛选特征的问题,本文提出了一种基于WT-CNN 模型的时频图轴承故障识别方法,将一维轴承信号通过小波变换转换成时频图,将时频图输入到本文所构造的WT-CNN 模型中进行训练,并完成故障分类任务,结果表明,此方法能以100%的正确率对3 种故障类别的轴承进行识别,与传统方法相比,本文方法不依赖传统提取特征方法所需经验和专业知识,同时减少了传统方法中需要对特征进行人工筛选的步骤,降低了特征选择的不确定性对轴承故障识别的影响。

猜你喜欢
时频卷积轴承
轴承知识
轴承知识
基于3D-Winograd的快速卷积算法设计及FPGA实现
轴承知识
轴承知识
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
基于时频分析的逆合成孔径雷达成像技术
对采样数据序列进行时频分解法的改进
一种基于卷积神经网络的性别识别方法