基于堆叠稀疏自编码的滚动轴承故障诊断

2018-07-22 13:59侯荣涛周子贤赵晓平谢阳阳王丽华
轴承 2018年3期
关键词:频域特征提取正确率

侯荣涛,周子贤,赵晓平,谢阳阳,王丽华

(南京信息工程大学 a.计算机与软件学院;b.江苏省网络监控中心;c.信息与控制学院,南京 210044)

滚动轴承通常工作于大型机械内部,其信号具有成分复杂、特征能量微弱、非线性等特点,因此故障诊断较为困难。此外,随着机械设备群的规模不断变大、效率不断提高,故障检测设备获得的数据量也急剧增大。因此研究适用于“大数据”背景下的滚动轴承故障检测方法显得非常重要[1]。

目前,滚动轴承故障诊断的方法通常需要经过特征提取和模式识别2个步骤[2]。常用的特征提取方法有小波变换、经验模态分解等[3]。文献[4]提出STFT Viterbi拟合法极大降低了噪声和干扰对特征提取的影响,能够精确估计滚动轴承瞬时频率。模式识别算法中,文献[5]提出了一种基于EMD和支持向量机的滚动轴承故障诊断方法,通过EMD变换得到故障敏感信息的本征模态函数,然后输入SVM分类器进行故障诊断。文献[6]提出基于小波包和Bayes网络的轴承诊断方法,利用小波包分解与特征提取函数提取轴承各频带上的特征信息,输入BN模型进行轴承的故障诊断。以上方法都能够获得较高的诊断识别率,但在信号特征提取时需人工调整参数,处理过程较耗时且算法效率偏低。此外,算法训练时样本数量过少,处理海量实际信号时正确率难以保障。

目前,深度学习理论及其训练策略[7-9]在机械健康诊断领域的应用正在增加,文献[10]将信号经过奇异值分解后输入深信度网络,得到的滚动轴承故障诊断系统效果理想。文献[11]提出构建堆叠自编码器网络,将“海量”信号转化为频域数据输入网络模型,实现了大数据环境下齿轮的故障诊断。以上算法在单一故障的滚动轴承信号诊断中效果良好,对于复合故障信号的处理效果未进行探究。

综上,针对滚动轴承信号非平稳、数据庞大等特点,结合深度学习方法提出了基于堆叠稀疏自编码(Stacked Sparse Autoencoder,SSAE)的滚动轴承故障诊断方法。SSAE算法通过梯度下降法逐层无监督的训练堆叠稀疏自编码网络,实现信号的特征提取,然后将提取的特征信号输入softmax分类器进行分类,根据分类结果与原信号标签的差异对网络进行微调,进一步优化网络,从而实现精确的故障诊断。

1 堆叠稀疏自编码理论

1.1 自动编码器原理

自动编码器(Autoencoder,AE)[12-13]是一个3层的无监督神经网络,包括输入层、隐藏层和输出层,其网络结构如图1所示。

图1 自动编码器结构

假设输入样本集为{x1,x2,…,xk},先使用编码函数fθ将每个训练样本xn转化为隐藏层矢量,即

hw,b(x)=fθ(xn)=s(Wxn+b),

(1)

式中:s为sigmoid激活函数;θ为编码网络的参数矩阵,θ={W,b};W为输入层到隐藏层的权值矩阵;b为偏置项系数。

(2)

式中:θ′为解码网络的参数矩阵,θ′={W′,b};W′为隐藏层到输出层的权值矩阵;b′为偏置项系数。

AE算法通过网络训练寻找最优的参数矩阵,最小化输出数据与输入数据间的误差。因此,需要构建误差损失函数用于网络训练,损失函数定义为

(3)

自动编码器强大的非线性表达能力使其常对数据拟合过度,为提高算法的实用性,需要对自动编码器的学习能力加以限制。

1.2 稀疏自编码

稀疏自编码(Sparse Autoencoder,SAE)通过对AE网络加入稀疏性限制,使得部分隐藏层神经元处于抑制状态,而能够表示输入数据间关联的神经元处于激活状态,从而增强特征提取能力。

(4)

(5)

1.3 堆叠稀疏自编码

堆叠稀疏自编码是由多个SAE堆叠而成的深度网络,其基本思想是训练SSAE网络,使输出的低维信号在包含故障本质特征的同时去除高维信号中的干扰部分,最终将训练得到的特征用于分类器识别。因此,基于稀疏性和堆叠理论的SSAE算法能够提取高维数据的特征因子,增强算法的鲁棒性,提高特征的线性可分性。

根据轴承故障诊断需求,设计由3个稀疏自编码和1个分类器组成的3层SSAE网络,如图2所示。SSAE将上级SAE隐藏层输出的特征向量作为下级隐藏层的输入向量,使用梯度下降法逐层训练SAE网络,并通过多次迭代更新各层网络的参数矩阵,提取输入信号的特征信息。参数矩阵更新公式如下,其中μ表示学习率,

图2 SSAE网络结构

(6)

最后,将SAE3的输出通过softmax分类器进行分类,计算分类器输出与期望值的误差,利用BP反向传播算法微调整个网络的权值和偏置,经过多次迭代收敛误差,最终实现滚动轴承的故障诊断。

使用逐层无监督的方法训练每一层神经网络,多层的网络结构能增强各类输入数据间的差异[14]。输入信息每经过一层网络,特征信息都没有丢失或者丢失的是冗余信息。综上所述,SSAE网络保留了原始信息的类型特征并且使分类边界更加清晰,增强了数据线性可分性,能够更好地提取到信息的特征表示。

2 基于SSAE的滚动轴承故障诊断

滚动轴承的振动信号具有复杂性、非平稳性,且不同故障信号表现出相似性等特点。采集的时域信号成分复杂,难以提取有效的特征分量;而频域信号由复杂时域信号分解的多个频率成分叠加而成,能够更清晰地显示信号的构成。因此,为了提高算法的效率和实用性,将频域信号进行归一化处理后输入SSAE网络。

基于SSAE的滚动轴承故障诊断训练分为5个步骤,其流程如图3所示。

图3 轴承故障诊断流程图

1)SSAE网络数据预处理。采集滚动轴承不同故障状态的时域振动信号,使用Fourier变换将其转换为频域信号,进行归一化处理后输入网络进行训练。

2)SSAE网络结构设定。根据实际数据大小确定网络深度、各层神经元的数量和学习率等参数;再依据不同的任务需求设定合适的代价函数及优化策略。

3)SSAE网络训练。首先逐层训练自编码网络,将前一层网络的输出作为下一层网络的输入,提取特征信息;将最后一层网络的输出作为softmax分类器的输入,通过反向传播算法微调整个网络的权值和偏置等参数。

4)SSAE网络诊断精度测试。根据训练结果判断是否满足实际期望的诊断正确率(95%以上)。如果诊断正确率过低则修正SSAE网络,再重复第2和第3步,直到达到预期精度。

5)SSAE网络构建完成。

3 试验验证

为验证基于堆叠稀疏自编码的深度神经网络对滚动轴承故障的诊断效果,以动力传动故障诊断试验台为对象,采集各种故障状态下的滚动轴承振动信号进行分析。动力传动故障诊断试验台如图4所示,其由驱动电动机、2级行星齿轮箱、定轴齿轮箱和磁粉制动器组成,传感器装于定轴齿轮箱端盖处。

图4 动力传动故障诊断试验台

试验轴承为ER-16K型轴承,使用电火花技术分别在轴承内圈、外圈与滚动体上设置一个直径2 mm、深0.5 mm的点蚀,驱动电动机转速为3 600 r/min,采样频率为5.12 kHz。试验中使用的5种轴承状态见表1,其中复合故障包含外圈、内圈和滚动体3种故障成分。

3.1 试验数据

随机选取每类总样本数据的20%作为测试数据,剩余的80%作为训练数据,即每类数据均具有1 600组训练样本和400组测试样本,其中每组样本均包含3 000个连续的数据采样点(包含轴承旋转多个周期)。轴承5种状态下的时域信号波形如图5所示。

3.2 试验方案与分析

选择频域样本用于SSAE网络训练,并对诊断结果进行分析。此外,SSAE网络框架的构建与参数设置对滚动轴承的诊断效果有一定影响,因此比较了网络深度与迭代次数对最终诊断效果的影响。

SSAE网络训练方法如下:

2)对样本进行归一化处理,输入训练数据开始SSAE网络训练,根据重构误差构建损失函数,通过逐层梯度下降算法调整权值,缩小重构误差。

3)训练结束后,输入测试集测试SSAE网络的诊断正确率,根据诊断正确率再次调整SSAE网络结构与参数。

3.2.1 网络深度对诊断结果的影响

构建N层SSAE网络(N=2,3,4,5,6),利用SSAE网络分别对滚动轴承5种状态下的频域数据进行分析诊断,试验总体识别率如图6所示。

图6 不同深度网络诊断结果

从图6中可以看出,以频域信号作为输入样本时SSAE算法诊断效果良好,不同网络深度的诊断正确率都在96%以上。当SSAE网络深度为3,网络结构3 000-200-100-50-5(输入信号长度为3 000个点;中间3个隐藏层神经元数量分别为200,100,50;输出为5类二进制标签)时正确率达到100%。此外,随着网络层数的增加,诊断正确率不断波动,因此并非网络层数越深诊断效果越好。此外,网络层数变大还会导致计算量的增大,因此选择3层SSAE网络用于滚动轴承故障诊断效果最佳。

为进一步分析SSAE网络较SAE网络(单隐层网络)特征提取的优势,提取频域样本训练SAE,SSAE网络输出的隐藏层特征,利用主成分分析提取这些特征的前3个主成分并进行可视化,结果如图7所示。图7a为频域信号在SAE网络中提取的特征主成分散点图。可以看到各类滚动轴承状态的散点没有完全呈现规律的聚集状态,内圈故障的散点部分与复合故障的散点交叉,说明单隐层的SAE网络对频域信号的特征提取能力还有不足。图7b为SSAE网络提取的频域信号散点图。图中不同滚动轴承健康状态的散点都聚集于一处,同时能够与其他故障明显的分离,因此能取得100%的诊断正确率。

图7 提取特征的散点图

3.2.2 迭代次数对诊断结果的影响

由于不同迭代次数对SSAE网络的诊断效果具有一定影响,所以研究比较了迭代次数对SSAE网络最终分类效果的影响,试验结果如图8所示。

图8 不同迭代次数诊断结果图

从图中可以看出:频域信号输入SAE网络的初始诊断正确率较高,迭代次数20次时已达到98.25%,但随着迭代次数的增加正确率提升缓慢;而SSAE网络在迭代次数到达60次时,诊断正确率已经超过单隐层的SAE网络,且随着迭代次数的增加正确率继续提升,在迭代次数到达150次时,诊断正确率达到100%。

3.2.3 频域特征提取效果分析

为了验证SSAE算法特征提取能力,提取频域信号作为输入样本时滚动轴承5种状态在SSAE网络中第3隐藏层的输出信号,其可视化结果如图9所示。从图中可以看出:轴承5种状态以不同颜色的信号代表并以虚线隔开,可以发现不同故障的输出波明显不同。为了更直观地比较不同样本对特征提取的影响,将每类故障的隐藏层输出与其他4类状态的隐藏层输出做了相关性分析,结果如图10所示。图中不同故障间相关系数普遍较低(均值20.54%),其中,复合故障与滚动体故障相关系数最高仅为44.82%,因此能够较好地区分各类故障。

图9 5种状态SSAE网络的隐藏层输出

图10 频域相关系数比较

综上所述,SSAE网络能够无监督地从滚动轴承的频域信号中提取故障特征,同时保证不同健康状态间的区别度,能够自适应地实现滚动轴承故障诊断。此外,当构建3层网络并以频域信号作为样本时取得诊断精度最高。

3.3 与传统智能方法的对比

为验证上述算法的有效性,与EMD+SVM算法以及BP神经网络进行对比分析。此外,为更好地体现SSAE网络的优势,增大了BP神经网络深度,以构建与SSAE网络结构相同的BP神经网络结构,即网络模型均为3 000-200-100-50-5(输入信号长度为3 000个点;中间3个隐藏层神经元数量分别为200,100,50;输出为5类故障标签)。

试验数据统一采用表1的5类滚动轴承数据,共包含10 000组样本。同样以80%数据作为训练数据,剩余20%作为测试数据。不同诊断方法下滚动轴承的故障识别率见表2。

表2 不同诊断方法识别率

由表2可知: EMD+SVM方法诊断精确度为85.32%,表明在处理复杂时域信号时,基于EMD自适应分解方法的诊断结果较为理想。将输入样本改为频域信号后,单层BP神经网络的诊断性能低于EMD+SVM方法,但其分类准确率依然不足80%。这是因为BP神经网络收敛速度较慢且易产生局部最优解,诊断精度难以满足实际需求。此外,同样网络结构及同等规模的BP神经网络相比,SSAE算法通过构建深层网络,使用梯度下降方法和反向传播算法进行网络训练,能够自适应地提取出故障的特征表示,对故障的分类更加准确。

4 结束语

针对滚动轴承信号非平稳,数据量大等特点,提出了基于SSAE的滚动轴承故障诊断方法。SSAE网络能够自适应地提取轴承信号特征,有效区分不同类型故障,通过采集不同故障类型的轴承数据进行试验,结果表明该方法能够有效提取轴承故障特征且诊断精度高于传统方法,适用于滚动轴承故障的精确诊断。但不足之处在于信号预处理时仅将信号做了时频域转化,如何根据轴承的故障机理与工况选择其他信号预处理方法,从而更精确、更高效地识别滚动轴承健康状况需要进一步的研究。

猜你喜欢
频域特征提取正确率
大型起重船在规则波中的频域响应分析
门诊分诊服务态度与正确率对护患关系的影响
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Daubechies(dbN)的飞行器音频特征提取
频域稀疏毫米波人体安检成像处理和快速成像稀疏阵列设计
网络控制系统有限频域故障检测和容错控制
Bagging RCSP脑电特征提取算法
生意
品管圈活动在提高介入手术安全核查正确率中的应用
生意