基于DHMM和BP神经网络的 齿轮箱故障诊断研究

2018-03-07 03:01朱文辉黄晋英卫洁洁陈海霞封顺笑
组合机床与自动化加工技术 2018年2期
关键词:频域时域故障诊断

朱文辉,黄晋英,卫洁洁,陈海霞,封顺笑

(中北大学 a.机械与动力工程学院;b.计算机与控制工程学院,太原 030051)

0 引言

对于高价值、高可靠性要求的复杂机械系统,关键部件的故障诊断具有重大意义和经济价值,为了提高故障诊断的准确性,研究者将各种人工智能方法引入故障诊断中,取得了很好的效果。综合不同人工智能技术的优点,构造混合智能故障诊断方法是提高诊断方法的敏感性、鲁棒性和精确性的有效途径之一[1-2]。本文针对齿轮箱的故障诊断,从信息融合的角度,构造了基于离散隐马尔科夫模型(DHMM)和BP神经网络算法的混合智能诊断方法。隐Markov模型是一种信号时间序列统计模型,最初在语音识别领域里得到了深入的研究和具体的应用,齿轮箱发生故障后,振动信号往往具有一定的非线性和再现性不佳等问题,和语音信号有很多相似的特性。隐Markov模型理论上能对任意长的时间序列建模,能够很好的弥补神经网络算法对时序问题处理能力不足的劣势[3]。同时,BP神经网络算法具有较强的自组织、自适应和非线性映射能力,可利用其泛函逼近能力对故障类别进行分类,易于和其他方法结合使用[4-6],BP神经网络算法可以有效弥补隐马尔科夫模型自适应性不足的问题。

现有的隐马尔科夫模型与神经网络算法的结合多是从两种方法的串联入手,构建两级分类器进行模式识别。例如,电子科技大学的姜波[7]等把CHMM处理后的语音信号的子频带和全频带特征及帧平均能量作为人工神经网络的输入以提高识别率,东北林业大学的杨红等[8]将HMM的最佳状态序列的输出概率作为BP神经网络的输入,从而对网络进行训练,以达到物体识别的目的。合肥工业大学的孙琼[9]将BP神经网络和隐Markov模型运用到驾驶员驾驶状态的识别中。西安建筑科技大学的黄光球[10]等利用BP神经网络为HMM提供状态概率输出,实现了网络入侵的检测。不管哪种方法作为一级模型,当输出向量的维度设置不合理时都会导致二级模型无法收敛或者诊断精度太低,并且一级分类器的诊断精度也会影响到二级分类器的诊断效果。因此,不同于文献中将DHMM方法和BP神经网络算法直接进行级联,本文从信息融合的角度,利用DHMM方法构造了包含时序信息的新特征集,然后用BP神经网络算法建立了以新特征集作为输入的故障分类器。当BP神经网络算法用于模式识别时,网络规模(即神经元数量、隐藏层数)与样本特征有关,新的特征集包含了更多的信息,适当地增大了网络规模,改善了BP神经网络处理时序问题的能力;将BP神经网络作为分类器,利用了BP神经网络较强的自适应能力,回避了DHMM方法自适应性不足,模型泛化性不好的问题。

1 DHMM方法基本介绍

隐马尔科夫模型描述了一个具有状态转移概率的马尔科夫链和输出观测值的双随机过程,模型的状态是不可见的,只能通过观测序列表现出来,故称为隐马尔科夫模型。当观测到的随机变量的统计变量是离散可数的,则称这样的HMM为离散隐Markov模型(记为DHMM)。

一个DHMM模型可表示为:

λ=(A,B,π,N,M)

(1)

其中,N为模型中隐状态数,记N个状态为S1,…,SN,记t时刻HMM所处状态为qt,qt∈(S1,…,SN);M为每个状态对应的可能的观察值数目,即输出符号数,M个观察值分别为v1,…,vM,记t时刻观察到的值为ot,ot∈(v1,…,vM)。

(1)A:状态转移概率矩阵

A=(aij)N×N,aij=P(qt+1=Sj│qt=Si)

(2)

(2)B:观察值概率矩阵

B=(bjk)N×M,bik=P(ot=vk│qt=Sj)

(3)

(3)π:初始状态概率分布矢量π=(π1,π2,…,πN),其中,

(4)

运用中,初始状态概率π往往是随机给定的。当状态转移矩阵、观察值概率矩阵和初始状态矩阵确定了,DHMM模型也就确定了。

对于给定了观测值序列(o1,o2,…,ot)的DHMM模型的建立,即DHMM参数估计问题.当已知状态序列时,采用极大似然估计的方法确定相关参数,对于未知状态序列时采用Baum-Welch重估公式来确定模型λ[11]。本文选取后者来建立各工况的DHMM模型参数。

定义前向变量αt(i)为:

αt(i)=P(o1,o2,…,ot,qt=Si│λ)

(5)

后向变量βt(i)为:

βt(i)=P(o1,o2,…,ot│qt=Si,λ)

(6)

定义ξt(i,j)为给定观测值序列O={o1,o2,…,ot}和初始模型λ,

ξt(i,j)=[αt(i)aijbj(ot+1)βt+1(j)])/P(O│λ)

(7)

时刻t时Markov链处于Si状态和时刻t+1时处于Sj状态时的概率,那么,t时刻Markov链处于Si状态的概率为:

(8)

Baum-Welch算法中的重估公式如下:

(9)

(10)

(11)

2 基于DHMM方法的信息融合与BP神经网络算法的结合

齿轮箱由正常到出现故障,系统的某些特性是按照一定规律由浅入深逐步变化的,这些变化是有先后顺序的,而不是随机发生的,因此应该用左右型隐马尔科夫模型来描述这个变化过程。此时,状态转移概率及初始概率具有下列约束:

aij=0,j

(12)

(13)

采用Baum-Welch算法对齿轮箱各工况建立DHMM模型λi,采取前向后向算法计算测试样本Ot属于各工况的概率Pi,取其对数pi作为新的特征,如下式:

Pi=P(Ot│λi)

(14)

pi=lnPi

(15)

基于DHMM方法的特征融合步骤:

Step 1:对采集到的信号进行时频分析,提取时频特征,得到总样本集的特征矩阵T=(T1,T2,…Tm)T,其中,Ti=(ti1,ti2,…,tik),Ti为第i个样本的特征向量,tik为第i个样本的第k个时频特征参数。采取LGB算法对特征集进行标量化。

Step 2:采取Baum-Welch算法,分别利用标量化后的n类工况的训练样本建立相应工况的DHMM模型:λ1,λ2,…,λn。

Step 3:采取前向后向算法,计算第i个测试样本在各类DHMM模型下的概率值(Pi1,Pi2,…,Pin),求取概率的对数(pi1,pi2,…,pin)。

Step 4:取测试样本在各类DHMM模型下概率的对数作为新的特征添加到原来的时频特征集中以构造测试样本新的特征向量Ti′=(ti1,ti2,…,tik,…,pi1,pi2,…,pin)及测试样本特征集T′=(T1′,T2′,…Ts′)T,s为测试样本的总个数。基于DHMM方法的信息融合框图如图1所示。

图1 基于DHMM的信息融合方法框图

利用DHMM方法进行信息融合后,引入神经网络对新的特征信息进行非线性映射,将新构造的特征集作为神经网络的输入,利用其泛函逼近能力对故障类别进行分类。在设计BP神经网络的时,输入结点和输出节点是由问题本身所决定的。隐含层的结构在很大程度上决定了网络的性能,隐含层结点太少会使得网络无法收敛,而结点太多则会导致产生冗余,产生过度训练。有如下常规经验[12]可以参考:

m=2n+1

(16)

其中,m为隐藏层节点数,n为输入层节点数。基于DHMM方法特征融合的BP神经网络算法拓扑结构图如图2所示。

图2 基于DHMM方法信息融合的BP神经 网络算法拓扑结构图

3 实验验证与分析

验证实验在中北大学振动实验室台架上进行。选择型号为JZQ250的二级传动减速器,在箱体上,对应输入轴、中间轴和输出轴的6个轴承座上方布置6个测点,设置正常、断齿、保持架断裂、轴承内圈剥落和轴承外圈剥落5种工况,采样频率设置为4000Hz,采集齿轮箱1500r/min时箱体的振动信号(见图3)。对采集到的数据进行时频分析,提取时域均方根、时域峭度、时域八阶矩系数、频域均方根值等35个时频特征作为原始特征集,用到的时频特征如表1所示。每种工况各取100个样本作为DHMM的训练样本,180个样本作为DHMM的测试样本。

图3 实验对象

时域均方根值频域方差时域方根幅值频域峭度时域绝对平均幅值频域峰态时域方差频域偏度时域峭度频域波形指标时域峰态频域峰值指标时域偏度频域脉冲指标时域波形指标频域裕度指标时域峰值指标频域峭度指标时域脉冲指标频域偏态指标时域裕度指标频域八阶矩系数时域峭度指标频域十六阶矩系数时域偏态指标均方频谱时域八阶矩系数功率谱重心指标时域十六阶矩系数频域方差频域均方根值相关因子频域方根幅值谱原点矩频域绝对平均幅值

第一阶段,构造新的特征集。将每个训练样本的35个时频特征标量化后,作为观测值序列,由于隐状态数目的选取和确定仍是研究内容之一,还没有指导性的方法,因此,设置隐状态数目N=5,采取Baum-Welch算法建立齿轮箱5种工况的DHMM模型;再采取前向后向算法计算各个测试样本属于各工况的似然概率的对数值;然后构造新的特征集,如表2所示。

第二阶段,根据新构造的特征集的维度和工况类型,构造一个由40个输入节点,81个隐含层节点和5个输出层节点构成的BP神经网络。以新的特征集作为输入,各工况选择120个样本做为训练样本,60个样本做为测试样本。5种工况下的BP神经网络分类结果如图4所示故障类别由1~5分别为正常、断齿、保持架断裂、轴承内圈剥落和轴承外圈剥落。由图可见,基于DHMM方法的信息融合和BP神经网络算法能对大多数样本正确的分类。

为了更好地判别本方法的诊断效果,分别设置3种方法作为对照组,分别是:第一组,参考文献[7-10],将DHMM方法和BP神经网络进行简单级联,以原始特征作为DHMM模型的输入,将DHMM方法作为一级分类器,进行初步分类,再将DHMM的输出作为BP神经网络的输入,进行进一步分类;第二组和第三组分别是单独采用DHMM方法和BP算法,将原始特征作为输入,对5种工况进行诊断。

本文构造的混合算法与对照组的3种方法的诊断结果如表4所示。从各类方法对各工况的诊断效果来看,单独使用DHMM方法和BP算法的诊断结果均优于两种方法的简单级联,说明两种方法的简单级联有时候并不能优势互补。实际上,在第二种方法中,将DHMM模型作为一级分类器进行粗分类,实质上是信息加工的过程,可以看作是特征降维,必然会导致信息丢失,并且DHMM方法自身还有一些不足,将未经优化的DHMM方法用于粗分类,诊断的准确率也不高(这一点从仅用DHMM方法的诊断结果可以看出);由于一级分类器的输出维数较小,会导致作为二级分类器的神经网络的规模较小,进而影响到了BP神经网络算法的分类效果。本文的方法中,所构建的新的特征集在原始特征集的基础上增加了时序信息,是信息增强的过程;同时,不将DHMM方法作为故障诊断的分类器,回避了DHMM方法自适应能力不足和模型泛化性的问题。由于新的特征集特征维数增加了,其作为BP神经网络算法的输入,会使得BP神经网络模型的输入层节点和隐藏层层数随之增加,网络规模大于BP神经网络算法单独使用时的规模,提高了诊断的准确率。从表4可以看出,本文所构造的方法除了在断齿与轴承内圈剥落这两种工况的诊断正确率上与BP神经网络算法持平外,在其他三种工况的诊断上,均有较大的提升。

表2 新构造的特征集

图4 BP神经网络分类结果

工况样本量诊断结果正常断齿保持架断裂轴承内圈剥落轴承外圈剥落诊断精度正常6052002686%断齿60060000100%保持架断裂6000561394%轴承内圈剥落6000059198%轴承外圈剥落6030165082%

表4 4种方法的诊断结果对比

实验结果证明,基于DHMM方法的信息融合算法利用了DHMM较强的时序建模的优点,构造的新的特征集包含了一定的时序信息,再结合BP神经网络自学习、非线性映射等优点进行故障诊断,显著的提高了齿轮箱故障诊断精度,实现了两种方法的优势互补。

4 结束语

本文构造了一种诊断齿轮箱故障的混合智能算法,采用DHMM方法建立了齿轮箱各工况的时序模型,从信息融合的角度,在原始特征集的基础上构造了包含时序信息的新特征集,最后将BP神经网络算法作为故障分类器实现齿轮箱的故障诊断。本方法综合利用了DHMM模型较强的时序建模能力和BP神经网络算法良好的自适应能力,回避了DHMM方法自适应能力不佳的问题,适当增加了BP神经网络的网络规模,改善了BP神经网络算法对时序问题的处理能力,进而提高了齿轮箱故障诊断的准确率。

[1] Doyle R, Leonard Charest J, Rouquette N, et al. Causal modeling and event-driven simulation for monitoring of continuous systems[C]. 9th Computing in Aerospace Conference (AIAA),1993.

[2] 雷亚国, 何正嘉. 混合智能故障诊断与预示技术的应用进展[J]. 振动与冲击, 2011, 30(9):129-135.

[3] 吴昭同, 杨世锡. 旋转机械故障特征提取与模式分类新方法[M]. 北京:科学出版社, 2012.

[4] 钟秉林, 黄仁. 机械故障诊断学[M]. 3版.北京:机械工业出版社,2007.

[5] 杜娟, 阎献国, 韩建华,等. 基于混合神经网络的数控机床故障诊断技术研究[J]. 组合机床与自动化加工技术, 2011(12):32-34.

[6] 张周锁, 侯照文, 孙闯,等. 应用粒计算的混合智能故障诊断技术研究[J]. 西安交通大学学报, 2011, 45(1):48-53.

[7] 姜波, 黄炜. 基于多带CHMM和神经网络融合的语音识别[J]. 电子技术应用, 2007, 33(2):126-128.

[8] 杨红, 任洪娥. 基于HMM与BP神经网络的物体识别算法[J]. 微计算机信息, 2010, 26(28):160-162.

[9] 孙琼. 基于BP神经网络与隐马尔科夫链的驾驶状态识别[D]. 合肥:合肥工业大学, 2012.

[10] 黄光球, 汪晓海. 基于BP-HMM的网络入侵检测方法研究[J]. 计算机工程, 2007, 33(10):131-133.

[11] 王晓强, 张云, 周华民,等. 基于隐马尔科夫模型的刀具磨损连续监测[J]. 组合机床与自动化加工技术, 2016(10):87-90.

[12] 姚雪梅, 李少波, 璩晶磊. 基于神经网络和证据理论的样本预测方法[J]. 组合机床与自动化加工技术, 2017(6):110-113.

猜你喜欢
频域时域故障诊断
基于包络解调原理的低转速滚动轴承故障诊断
基于频域的声信号计权改进算法
基于复杂网络理论的作战计划时域协同方法研究
数控机床电气系统的故障诊断与维修
频域稀疏毫米波人体安检成像处理和快速成像稀疏阵列设计
山区钢桁梁斜拉桥施工期抖振时域分析
网络控制系统有限频域故障检测和容错控制
一种用于高速公路探地雷达的新型时域超宽带TEM喇叭天线
基于改进Radon-Wigner变换的目标和拖曳式诱饵频域分离
背景和共振响应的时域划分及模态耦合简化分析