拉普拉斯特征映射算法在滚动轴承故障识别中的应用

2015-02-20 05:31黄宏臣张倩倩韩振南林晓龙

中国测试 2015年5期

关键词：流形特征向量时域

黄宏臣，张倩倩，韩振南，林晓龙，刘庆

（太原理工大学机械工程学院，山西太原 030024）

拉普拉斯特征映射算法在滚动轴承故障识别中的应用

黄宏臣，张倩倩，韩振南，林晓龙，刘庆

（太原理工大学机械工程学院，山西太原 030024）

由于滚动轴承故障的非线性和非平稳性特征，传统线性方法不能准确发现和识别出故障类型及其受损情况，该文提出使用流形学习拉普拉斯特征映射（LE）算法对滚动轴承故障进行识别。在由幅值、时域统计指标和由小波包函数分解得到的能量比作为特征向量构建的高维特征空间中，使用LE算法和两种传统的降维方法PCA、MDS进行对比，提取出最敏感、最能表征滚动轴承运行状态的低维特征量，再使用模式识别进行分类，聚类结果用三维图形表示。以样本识别率和模式识别中的类内距和类间距作为评价指标，模拟实验结果表明：LE算法不仅能有效地识别出滚动轴承故障类型而且能区分和识别出轴承外圈在不同受损情况下的运行样本。

滚动轴承；线性方法；拉普拉斯特征映射；特征空间；模式识别

0 引言

滚动轴承是各类旋转机械中最常用也最易受损的零件之一。据统计，旋转机械的故障中有30%是因为轴承故障引起的，轴承的好坏对机器的工作状况影响极大，对重要用途的轴承进行工况监测和故障诊断非常必要[1]。

在滚动轴承早期故障监测时，由于故障信号微弱使得所测得的振动信号中包含大量噪声，常常把故障信号淹没。通常的方法是采用多个彼此信息高度相关的传感器对设备进行监测，更多的信息量可以提高诊断精度，减少系统状态的不确定性，但是海量信息也增加了故障分类的难度。因此，如何消除信息冗余，减低维数，从噪声信号中提取出微弱的故障特征信号，成了目前信号处理和特征提取的关键，也是最大的难点之一。

主元分析法（principal components analysis，PCA）和多维尺度分析（multidimensional scaling，MDS）是对故障的特征量进行有效分类的两种非常成熟的方法，是基于研究对象相似性或距离，将研究对象在一个低维空间（二维或三维）表示出来，进行聚类或者维度分析的图示法。由于这两种方法是线性方法，对于平稳和线性问题可以有效进行维数约简、特征提取，但对于运行状态是典型的非线性和非稳态分布的滚动轴承故障数据就显得效果不佳。而近年来出现的流形学习为非线性的故障诊断提供了一种新的思路。

1 拉普拉斯特征映射（LE）

1.1 流形学习方法

流形学习的本质是一个维度约简的过程，它是从观测到的事物表象去探索和发现事物的本质特征，找到产生数据的内在规律和本征结构[2]。自2000年Science杂志同期发表了3篇关于流形学习的论文，该方法逐渐成为当前研究的热点和难点，已经形成一些经典的流形学习，如等距映射算法（ISOMAP）、局部线性嵌入（LLE）、拉普拉斯特征映射算法（LE），Hessian特征映射（HE）及局部且空间特征映射（LTSA）等[2]。因为流形学习已经成功的应用到了图像处理、数据可视化、模式识别以及信息检索等领域[3]，因此，吸引了机械故障领域的研究者相继投入到流形学习的研究中。

在国内，已经有不少科研工作者进行深入研究并取得了一定的成果。阳建宏等[4]采用重构相空间的时域信号，提出一种基于主流形识别非线性降噪方法，并成功地应用到了齿轮断齿的状态识别；蒋全胜等[5]直接利用拉普拉斯特征映射LE方法对故障时域信号进行学习，提取出非线性信号中的内在本质，成功识别出滚动轴承的故障类型；栗茂林等[6]利用局部切空间排列LTSA在由时域和频域等特征量构建的特征空间中有效提取出表征滚动轴承状态特征；李锋[7]针对风电齿轮箱故障目前普遍使用的故障识别模式的不足，结合流行学习方法，有效识别出风电齿轮箱中的故障。本文首次提出使用LE算法在由多特征量构建的高维空间进行学习提取出低维特征量，对滚动轴承进行故障状态识别。

1.2 拉普拉斯特征映射算法

2003年Belkin[8]提出一种基于图谱理论的流形学习算法——拉普拉斯特征映射（laplacian eigenmaps，LE）。假设在高维特征空间中是近邻点在影射到低维空间中也应近邻，即在保持高维与低维空间中样本性质的连续性与一致性原则的前提下，求出最优低维嵌入。

LE算法可以描述为以下3步：

1）构建邻接图，查找K近邻。通过计算每个样本点与其他点的欧式距离，将每个点与最近的K个近邻点用边连接；或者当两点间的距离小于某个阀值ε时，两者为近邻关系，用一条边连接。

2）确定近邻图上的每一条边的权值。确定权值有两种方法：①简单赋值法，即令图上每条边权重为1，无边则为0；②热核法，即当Xi与Xj相邻，令权重Wij=exp（-‖Xi-Xj‖2/σ2），否则为0。

3）计算数据的低维嵌入。计算矩阵I-D-1/2WD-1/2的最小d+1个特征值所对应的特征向量，去除特征值为0的项，即为最终得到的低维嵌入坐标。

根据LE算法的描述可知，局部邻域的选取对低维流形提取至关重要。在本文中选用K=8的K近邻域法构建邻域图[9]，权值确定的方法将选用热核法。LE算法过程简单，不需要进行迭代计算，因此计算量和运算时间大大减少。

2 构建特征空间

由于设备越来越复杂，包含的信息量增大，在对设备进行早期故障诊断时，所测得的振动信号信噪比大，包含大量冗余信息，很难直接利用振动信号数据进行识别评估。通过特征提取和转换技术把原始信号构建到高维特征空间，利用特定方法对其中的特征向量进行特征融合，提取出能准确描述设备运行状态的低维特征。

为了提高运行状态和故障的识别准确率，本文将从多个角度尽可能的进行全方面分析。根据滚动轴承在不同故障状态下不同特征参数所表达的信息量及敏感性不同的特点，在时域和频域特征中选择特征量。在时域特征中选用最大峰值、峭度等13个特征量作为维度指标。针对时域特征量的局限性，选用平均频率以及采用db4小波包函数进行3层正交小波包分解，均匀划分得8个子频带的滤波信号，将得到的8个子频带滤波以及对总频率的相对能量比作为频域统计特征参数[3]，共计22种特征量参数如表1所示，详细的定义和计算公式见文献[10]。本文将以上述22个特征参数作为样本维度，采用LE算法对特征矩阵进行学习，提取出低维特征向量，准确地描述滚动轴承运行状态。

表中E3i表示第i+1个频带重构信号的能量，Ei=E3i/E表示第i个频带占总能量比，其中i=0，1，…，7，表示总能量。

表1 特征参数

3 基于LE算法的故障诊断模型

基于LE算法的故障诊断思路如图1所示。先对滚动轴承振动加速度信号进行处理，构建高维特征空间，利用LE算法将高维特征向量降维到低维特征空间，通过模式识别对低维空间中的流形结果进行分类。

图1 基于LE算法的轴承故障识别模型

故障诊断是典型的模式识别问题，因此，对于滚动轴承的故障识别，本文将采用故障样本识别准确率以及聚类分析法中的类间距Sb和类内距Sw来衡量提取特征的聚类效果[11-13]。类间距Sb用来描述不同类别分开的距离，类内距Sw表明每个类样本分布紧凑性。假定特征向量为{f1，f2，…，fdim}，dim是特征向量的目标维数，选取dim=3。Sb和Sw两个参数的描述如下：

其中，μpf是每一类中Cp（p=1，2，…，c）样本特征向量的平均值，是所有类型中特征向量的平均值。类间距Sb是用来描述类与类之间的距离，而类内距Sw则是用来描述每一种样本类型聚集程度的好坏，取值越小越好。通过类内距和类间距分类指标的领域选择策略，保证同类样本点的关联性，从而获得较好的聚类质量。

4 故障实验验证与结果分析

机械设备出现故障时，不仅需要识别出故障的类型，更需要能发现其受损的程度、位置以及对发展趋势进行预判。因此，为验证LE算法对于滚动轴承故障识别的有效性，将进行滚动轴承典型故障类型和轴承外圈上不同故障程度判断两组实验，通过与PCA和MDS两种比较成熟的传统方法进行比较，证明LE算法比传统方法更有效，且能高效的识别滚动轴承故障类型及受损程度。本文使用的滚动轴承故障数据均来自美国凯斯西储大学（CWRU）电气实验室实验平台上所进行的故障模拟实验。

4.1 滚动轴承故障类型实验

本实验选取电机驱动端轴承座上同一位置传感器所测得的滚动轴承的内圈、外圈和滚动体3种典型故障及无故障状态信号进行分析。选择在下列条件下测得数据：电机负载为2 hp（1 hp=735.5 W），转速为1750r/min，采样频率为48kHz。人为制造的故障尺寸均为直径0.021in、深度0.011in（1in=2.54cm）。每种故障选50组样本，构建N·m=（50×4）×22的特征矩阵。

图2为滚动轴承4种振动加速度信号时域图。从时域图便能区分故障信号与无故障信号。

图2 4种状态时域图

图3 不同的故障类型分类识别

图3分别为使用PCA、MDS和LE 3种算法对滚动轴承4种不同故障特征矩阵进行学习，将特征向量进行融合提取出前三维特征量，并将结果用可视化的三维图像形式表示。图3（a）为使用PCA方法得到的结果用三维图形表示，可以得出以下结论：4种状态样本没能很好的区分，外圈故障样本分布比较分散，且大量样本被错误识别；无故障、内圈故障和滚动体故障3种样本每种样本比较聚集，聚类性比较好，但是3种样本之间没有很好的区分开，类间距太小，出现了样本的混叠和交叉以及大量错误互识。图3（b）为MDS方法提取得到的结果图，可知所有样本分布分散，聚类性差。无故障样本比较好聚集在一起并与其他3种状态样本区分，其他3种样本中，外圈故障样本和PCA提取的结果一样，分布比较分散且不少样本被错误识别成其他3种状态，内圈和滚动体故障样本出现了大量的混叠。而使用LE方法就很好的区分开4种状态样本，4种样本中的每种样本很好地聚集在一点，各种样本间的类间距也很明显，很好的区分识别出各种样本，识别率达到98.5%。

图4 不同程度故障损伤

3种算法提取的特征参数值见表2，可知流形学习方法LE与PCA以及MDS相比，识别率大大提高，聚类性的类间距Sb和类内距Sw都得到优化，在滚动体故障类型识别实验中很好地体现出了流形学习非线性降维的优点。

4.2 滚动轴承外圈不同受损故障实验

本节选用模拟实验中轴承外圈正常状态和3种不同故障程度的受损情况进行识别验证。传统分析方法结果见图4，图4（a）至上而下分别是无故障、直径为0.007，0.014，0.021 in故障所对应的时域图，图4（b）为3种故障经FFT变换得到的对应的频域图，从图中并不能识别出滚动体故障受损程度。同样，在本实验中每种类型选择50组样本构建N·m=（50×4）×22的特征矩阵，分别使用3种算法对特征矩阵进行特征融合提取出前三维特征量，并将结果用三维图像表示，如图5所示。

表2 特征参数值

图5 不同的故障程度分类识别

表3 特征参数值

图5（a）是PCA降维得到的三维结果表示，图5（b）图是MDS方法进行特征融合提取，进行降维得到的结果；可知各种样本之间出现了大量的交叉混叠和错误识别，各种类型间的界限很不明显。PCA得到的结果比MDS的聚类性更好，MDS的分布范围区间大、比较分散。图5（c）图为LE得到的结果图，可以明显得出：识别准确率和聚类性比PCA和MDS两种方法要好，各种类型间的分界线非常明显，虽然也出现了一些错误识别。3种方法对滚动轴承4种不同受损程度的识别准确率和聚类性见表3。本实验证明了LE算法对滚动轴承外圈可以识别出不同受损程度，同理也能识别出滚动体和内圈故障的不同受损故障，本文将不再详述。

上述实验结果表明：LE算法在滚动轴承故障识别中比线性方法PCA和MDS具有更高的识别准确率且聚类效果好。

5 结束语

本文提出使用LE算法对滚动轴承故障进行识别，进行两组模拟实验，实验结果表明：LE算法不仅能高效识别滚动轴承故障类型，而且能有效识别出轴承外圈在不同受损情况下的运行状态样本。为LE算法运用到其他机械故障诊断，以及将流形学习中其他方法应用到滚动轴承以及其他机械故障诊断中提供借鉴，为将LE算法及流形学习方法中的其他算法应用到工程实践中做准备。

[1]钟秉林，黄仁.机械故障诊断学[M].北京：机械工业出版社，2006：298-299.

[2]黄添强.数据挖掘-算法与应用[M].厦门：厦门大学出版社，2011：113-120.

[3]雷迎科.流形学习算法及其应用研究[D].合肥：中国科学技术大学，2011.

[4]阳建宏，徐金梧，杨德斌，等.基于主流形识别的非线性时间序列降噪方法及其在故障诊断中的应用[J].机械工程学报，2006，42（8）：154-158.

[5]蒋全胜，李华荣，黄鹏.一种基于非线性流形学习的故障特征提取模型[J].振动与冲击，2012，31（23）：132-136.

[6]栗茂林，王孙安，梁霖.利用非线性流形学习的轴承早期故障特征提取方法[J].西安交通大学学报，2010，44（5）：45-49.

[7]李锋.基于流形学习的风电机组传动系统故障诊断方法研究[D].重庆：重庆大学，2011.

[8]Belkin M，NiyogiP.Laplacian eigenmaps for dimensio nlity reduction and data representation[J].Neural Comp utation，2003，15（6）：1373-1396.

[9]王泽杰，胡浩民.流形学习算法中的参数选择问题研究[J].计算机应用与软件，2010，27（6）：84-85.

[10]盛兆顺，尹琦岭.设备状态监测与故障诊断技术及应用[M].北京:化学工业出版社，1991：40-41.

[11]张学工.模式识别[M].北京：清华大学出版社，2010：146.

[12]He Q B.Vibration signal classification by wavelet packet energy flow manifold learning[J].Journal of Sound and Vibration，2013（332）：1881-1894.

[13]He Q B.Time-frequency manifold for nonlinear feature extraction in machinery fault diagnosis[J].Mechanical Systems and Signal Processing，2013（35）：200-218.

Application of laplacian eigenmap in fault diagnosis of rolling bear

HUANG Hongchen，ZHANG Qianqian，HAN Zhennan，LIN Xiaolong，LIU Qing
（College of Mechanical Engineering，Taiyuan University of Technology，Taiyuan 030024，China）

Due to the nonlinearand non-stationarycharacteristicsofrolling bearing fault，traditional linear methods cannot accurately find and identify the fault type and its damage.This paper put forward and used manifold learning laplacian eigenmap（LE）algorithm to identify rolling bearing fault.In the high dimensional feature space constructed by feature vectors from amplitude，time domain statistical indicators and energy ratio decomposed by wavelet packet function，the paper used LE algorithm to compare two traditional dimension reduction methods with PCA and MDS and extracted the low dimensional characteristics that are the most sensitive and can represent the running state of the rolling bearing when using pattern recognition to classify and the three dimensional figure to show clustering results.Taking sample recognition rate and the class cohesion and class spacing of pattern recognition as evaluation index，the results of the two simulation experiment show that:LE algorithm not only can effectively detect rolling bearing fault types，but also can distinguish and identify the running samples in different damage cases of outer ring.

rolling bearing；linearmethod；laplacian eigenmap；characteristicspace；pattern recognition

：1674-5124（2015）05-0094-05

10.11857/j.issn.1674-5124.2015.05.024

2014-09-21；

：2014-11-13

国家自然科学基金资助项目（50775157）山西省基础研究项目（2012011012-1）山西省高等学校留学回国人才科研资助项目（2011-12）

黄宏臣（1986-），男，湖南永州市人，硕士研究生，专业方向为流形学习算法和机械故障研究。

拉普拉斯特征映射算法在滚动轴承故障识别中的应用

0 引 言

1 拉普拉斯特征映射（LE）

2 构建特征空间

3 基于LE算法的故障诊断模型

4 故障实验验证与结果分析

5 结束语

0 引言