Laplacian双联最小二乘支持向量机用于早期故障诊断

2017-08-31 11:56汤宝平
振动与冲击 2017年16期
关键词:流形模式识别训练样本

李 锋,汤宝平,郭 胤

(1.四川大学 制造科学与工程学院,成都 610065;2.重庆大学 机械传动国家重点实验室,重庆 400044;3.四川航天技术研究院 总体设计部,成都 610100)

Laplacian双联最小二乘支持向量机用于早期故障诊断

李 锋1,汤宝平2,郭 胤3

(1.四川大学 制造科学与工程学院,成都 610065;2.重庆大学 机械传动国家重点实验室,重庆 400044;3.四川航天技术研究院 总体设计部,成都 610100)

提出基于Laplacian双联最小二乘支持向量机(Laplacian Twin Least Squares Support Vector Machine, Lap-TLSSVM)半监督模式识别的新型早期故障诊断方法。用时、频域特征集广泛收集旋转机械不同早期故障的特征信息,再用提升半监督局部Fisher判别分析(Enhanced Semi-Supervised Local Fisher Discriminant Analysis, ESSLFDA)将高维时、频域特征集约简为具有更好类区分度的低维特征向量,并输入到Lap-TLSSVM中进行早期故障诊断。Lap-TLSSVM引入了包含大量无标签数据信息的流形规则实现半监督学习;其目标函数只含等式约束条件,且用共轭梯度法求解目标函数的线性方程组以加速训练过程。所提出的方法在训练样本非常稀少的情况下具有较高的诊断精度和计算效率。深沟球轴承早期故障诊断实验验证了该方法的有效性。

旋转机械;流形学习;Laplacian双联最小二乘支持向量机;半监督学习;故障诊断

轴承、转子、齿轮等旋转部件是机械装备的重要组成部分,起到支撑载荷、传递运动和动力的关键作用。然而这些旋转部件一旦出现故障得不到及时诊断和处理,任由其发展、扩大,将会引起整台机械装备的重大事故以及代价高昂的长期停工。因此,及时准确地诊断出处于早期发生阶段的微弱或潜在故障意义重大,这有助于及早掌握旋转机械性能退化的征兆,对故障的发生发展起到防微杜渐的作用[1]。然而,旋转机械的早期故障总是被强噪声淹没,具有症状不明显、特征信息微弱等特点,不易识别[2-3]。由于流形学习比传统的信号分析和数据挖掘方法更能体现复杂观测数据的本质,在获取主要变量的同时还可优化原始观测空间的拓扑结构[4-5],为准确提取含有强噪声干扰、微弱、非线性的旋转机械早期故障特征提供了新思路。基于流形学习维数化简的早期故障诊断方法实现模式如下:用多征兆域特征融合方法广泛收集早期故障特征信息→用流形学习对高维多征兆域特征集维数化简→对低维主特征量模式识别[6]。

本文延用文献[7]中提出的时、频域特征参数集来广泛挖掘旋转机械不同早期故障的特征信息。常用的对高维多征兆域特征集维数化简的流形学习方法多采用无监督或有监督学习机制。无监督学习机制就是只利用基于欧几里得几何测度的流形局部几何结构,而未利用训练样本的类标签判别信息进行流形解耦和分类的学习机制;有监督学习机制是利用训练样本的类标签判别信息和流形局部几何结构来指导所有样本(包括训练样本和待测样本)分类的学习机制。前者对样本中的噪声比较敏感,投影后低维子流形仍然会发生严重混叠现象,造成线性不可分;后者在训练样本稀少情况下,分类性能也会明显衰退[8-9]。而积累用于训练的机械装备早期故障标准样本主要通过实验室模拟或加速试验、真实现场试验这两种试验方法解决。这两种试验的完成都需要花费大量长期的时间与人力,因此收集充足的有类标签样本在实际应用中通常是困难的[10]。本文采用新型半监督流形学习(半监督学习机制就是主要依靠待测样本(即无类标签样本)的流形局部几何结构,并以训练样本的类标签判别信息和流形局部几何信息为辅助来指导样本分类的学习机制)理论:提升半监督局部Fisher判别分析(Enhanced Semi-Supervised Local Fisher Discriminant Analysis, ESSLFDA) 来解决现有流形学习方法在有类标签样本稀少情况下分类性能衰退的问题,ESSLFDA在待测样本的局部几何信息和训练样本的类标签双重指导下分类,且施加了不相关约束使输出的基向量统计不相关,因此在训练样本稀少条件下也能产生较好的分类效果。

ESSLFDA输出的仍是收敛性不足、尚有一定空间维度、不易分析的特征向量,要更为简洁、准确地呈现早期故障诊断结果,还须借助模式识别技术建立降维后的特征向量与早期故障之间的推理逻辑,以明确结论的形式导出特征向量所属的早期故障类别。经典的模式识别方法主要有:连续隐Markov 模型(Continuous Hidden Markov Model, CHMM)[11],k-近邻分类器(K-Nearest Neighbor Classifier, KNNC)[12]、最小二乘支持向量机(Least Squares Support Vector Machine, LSSVM)、小波最小二乘支持向量机(Wavelet Least Squares Support Vector Machine, WLSSVM)[13]等。然而,以上方法都采用有监督学习机制,过多依赖训练样本的拓扑结构和类信息对待测样本分类决策而忽视了待测样本中潜在的分布信息对模式识别的作用[14]。因此,它们的推理特性在训练样本数量不充足情况下会受到限制,且与半监督流形学习方法ESSLFDA在理论架构上极不协调。本文研究了与ESSLFDA相配套的新型半监督模式识别方法:Laplacian双联最小二乘支持向量机(Laplacian Twin Least Squares Support Vector Machine, Lap-TLSSVM)。Lap-TLSSVM为样本寻找两个非平行超平面使每个超平面尽可能靠近样本隶属的类别,并远离异类;还引入了包含大量无类标签样本信息的流形规则实现半监督学习;且其目标函数只含等式约束条件,并嵌入了共轭梯度算法求解目标函数的线性方程组以加速训练过程。这使Lap-TLSSVM在训练样本稀少情况下仍具有较高的模式识别精度,同时消耗较少的计算时间。

本文提出的基于Lap-TLSSVM半监督模式识别的早期故障诊断方法集成了时、频域特征集,ESSLFDA和Lap-TLSSVM的优势,适用于训练样本稀少条件下的旋转机械早期故障诊断问题。

1 Laplacian双联最小二乘支持向量机(Lap-TLSSVM)

1.1 半监督流形规则学习框架

为弥补有监督学习机制在训练样本稀少条件下的不足,本文改用半监督学习框架,半监督学习可同时利用大量无标签样本和相对较少的有标签样本建构分类器。由于流形学习能保持数据的几何信息,因此为实现半监督学习,本文引入流形规则项

(1)

在再生核Hilbert空间(Reproducing Kernel Hilbert Spaces, RKHS)选取适当的核函数κ(·,·)之后,则半监督流形规则框架可通过最小化式(2)建立起来

(2)

1.2 线性Lap-TLSSVM

Lap-TLSSVM旨在利用嵌入在全体样本集(包括待测样本)中的潜在几何信息建构半监督学习机制下的分类器。线性Lap-TLSSVM搜索以下两个非平行超平面

(3)

(4)

(5)

式中,c1,c2>0为经验风险惩罚参数,用于维持式(4)和式(5)中损失项之间的平衡。

考虑RKHS规则项

(6)

以及流形规则项

(7)

式中:L为Laplacian矩阵;X∈R(l+u)×n为所有样本集。再引入松弛变量ξ*,ξ,η*和η,则Lap-TLSSVM的主问题可表示为

s.t.Aw1+e1b1=ξ*

Bw1+e2b1+e2=ξ

(8)

s.t.Bw2+e2b2=η*

Aw2+e1b2+e1=η

(9)

式中,λ1,λ2∈(0 1]为调节参数。

在优化以上两问题之前,需要给出它们的几何解释。例如,对于式(8),目标函数中的第一项用于最小化A(标签为“+1”的样本集)的函数值f1(x)的平方和,使有标签样本集A尽可能逼近“+1”的超平面f1(x)。优化第二项使得B(标签为“-1”的样本集)与f1(x)的距离至少为1。式(8)中的第三项(即RKHS项)是RKHS中f1(x)的范数,用于控制Lap-TLSSVM的模型复杂性避免过学习。最后一项(即流形规则项)利用所有样本X(包括待测样本)内部的几何信息,迫使f1(x)沿着本征流形M方向变得更为平滑。另外,引入了调节参数λ1以平衡RKHS项和流形规则项。λ1越小表示越侧重、越依赖流形规则项,反之亦然。

由于式(9)中的优化问题与式(8)类似,因此主要聚焦式(8)的求解。将等式约束条件代入目标函数,则二次规划问题(8)变为

(10)

将式(10)对w1和b1的偏导数设置为0,则得到

w1L=A′(Aw1+e1b1)+c1B′(Bw1+e2b1+e2)+

λ1w1+(1-λ1)X′L(Xw1+eb1)=0

(11)

λ1b1+(1-λ1)e′L(Xw1+eb1)=0

(12)

用矩阵形式整理、合并式(11)和式(12)后得到

(13)

Pv1=-c1G′e2

(14)

式中,P=H′H+c1G′G+λ1I+(1-λ1)J′LJ。

同理,二次规划问题(9)的解可由式(15)求得

Qv2=c2H′e1

(15)

Lap-TLSSVM的解可通过求解线性方程式(14)和式(15)直接得到,而不用像SVM那样需要求解更为复杂的二次规划问题得到。此外,采用功能强大的共轭梯度(Conjugate Gradient, CG)算法高效地求解以上线性方程组。共轭梯度法是最实用的求解大型线性方程组的迭代方法之一,其形式为

Ax=b

(16)

式中:x为待求解;A为对称正定矩阵;b为向量。完整的求解过程如算法1所述。

算法1 用于Lap-TLSSVM的共轭梯度算法。

输入:矩阵A和b向量;指定的收敛常量ε;初始近似解x0。

① 初始化残余向量r0=b-Ax0和搜索路径p0=r0。

② 开始当条件 (‖rk+1‖<ε) 循环

④ 修正最新解xk+1=xk+αkpk

⑤ 更新残余向量rk+1=rk-αkApk

⑦ 修改下一步的搜索路径pk+1=rk+1+βkpk

⑧ 增加迭代次数k=k+1

⑨ 结束当条件循环。

输出:问题式(14)和式(15)的最优解x*(即v1或v2)≈xk+1。

优化问题式(8)和式(9)的解(w1,b1)和(w2,b2)由算法1得出后,则新的待测数据x∈Rn就可以根据它更靠近两个超平面式(3)中的哪一个来分配类标签i(“i=+1”或“-1”),即

(17)

1.3 非线性Lap-TLSSVM

为将Lap-TLSSVM模型延伸到非线性领域,需得到以下两个核生成超平面

f1(x):κ(x′,X′)u1+b1=0

f2(x):κ(x′,X′)u2+b2=0

(18)

式中:X∈R(l+u)×n为所有样本集(包括待测样本);κ(·,·)为适当选取的内核,例如RBF内核,κ(u,v)=e-γ‖u-v‖2,γ>0。则非线性Lap-TLSSVM的优化问题可表示为

s.t.κ(A,X′)u1+e1b1=ξ*

κ(B,X′)u1+e2b1+e2=ξ

(19)

s.t.κ(B,X′)u2+e2b2=η*

κ(A,X′)u2+e1b2-e1=η

(20)

式中:K为κ(X,X′),c1,c2>0为经验风险惩罚参数,λ1,λ2∈(0 1] 为调节参数;L为Laplacian矩阵。

将约束条件代入目标函数之后,二次规划问题式(19)和式(20)变为

(21)

(22)

二次规划问题式(21)和式(22)的解可分别由式(23)和式(24)导出

(23)

(24)

其中,

(25)

(26)

式中:Jφ=[Ke] ;Hφ=[κ(A,X′)e1];Gφ=[κ(B,X′)e2]。

与线性情况类似,借助共轭梯度(CG)算法(即算法1)求解式(23)和式(24)。问题式(19)和式(20)的解(u1,b1)和(u2,b2)一求出,则新待测数据x∈Rn就可根据它更靠近两个超平面式(18)中的哪一个来分配类标签i(“i=+1”或“-1”),即

(27)

Lap-TLSSVM是两类分类器,但实际解决的往往是多类问题。本文采用多类分类思想,即对于k类样本,采用k-1层Lap-TLSSVM进行逐层分类(见图1),并对输出分类模式进行编码,使Lap-TLSSVM可以直接输出早期故障的模式编号(例如1、2、3等)。

图1 Lap-TLSSVM逐层分类模型Fig.1 Layer by layer classification model of Lap-TLSSVM

2 早期故障诊断方法“时、频域特征集→ESSLFDA→Lap-TLSSVM”

早期故障诊断方法“时、频域特征集→ESSLFDA→Lap-TLSSVM”实现流程如图2,步骤如下:

步骤1 对表征不同早期故障特征的训练样本和待测样本信号分别构造11个时域特征参数和13个频域特征参数,并将11个时域特征参数和13个频域特征参数合并成24维的时、频域特征参数集。

步骤2 将训练样本和待测样本的时、频域特征参数集并列输入ESSLFDA用于训练,求出转换矩阵。

步骤3 利用训练成功的ESSLFDA对训练样本和待测样本化简维数,得出d维特征向量,d为最优化简维数,且1≤d<24(当nk×C≥24时,nk为每类早期故障的训练样本数,这里nk取定值,即每类早期故障的训练样本数目取相同值,C为早期故障种类数目)或1≤d

步骤4 将训练样本和待测样本的d维特征向量导入多类Lap-TLSSVM,对多类Lap-TLSSVM进行训练。

步骤5 由训练好的多类Lap-TLSSVM来判别待测样本的早期故障类型。

图2 早期故障诊断方法“时、频域特征集→ESSLFDA→Lap-TLSSVM”实现流程Fig.2 Implementation process of early fault diagnosis method “Time-frequency domain early fault feature set→ESSLFDA→Lap-TLSSVM”

11个时域特征参数和13个频域特征参数的构建依据和过程详见文献[7],这里不做赘述。由11个时域特征参数和13个频域特征参数组合而成的24维时、频域特征参数集可较广泛地包容旋转机械各类早期故障的特征信息。ESSLFDA是一种新型半监督流形学习方法,它在待测样本的局部几何信息和训练样本的类标签双重指导下最小化同类流形的离散度并最大化异类流形的离散度以实现类判别,还施加了不相关约束使所提取的特征统计不相关,因此在训练样本稀少条件下也能产生较好的分类效果,有关ESSLFDA的理论探讨详见文献[5]。

3 实验分析

以深沟球轴承早期故障诊断实例验证所提出方法的有效性。实验中使用的是外径为52 mm,内径为25 mm,厚度为15 mm的6205-2RS型深沟球轴承。实验台如图3所示,由PC机、信号采集仪、电荷放大器、压电式加速度传感器、扭矩传感器/译码器、扭矩加载器、转轴、电器控制装置、电动机等组成。电动机驱动输入轴,转速约为1 770 r/min,输出轴驱动载荷。分别在3个轴承的外圈、内圈、滚动体上加工深度约为0.16 mm、直径约为0.09 mm的小凹槽以模拟轴承外圈、内圈、滚动体的早期轻微裂纹故障。用加速度传感器、电荷放大器和信号采集仪采集3类早期故障及正常状态的振动数据各50组,每组数据的时间长度为0.1 s,采样频率设定为48 kHz。图4示出正常状态和3种早期故障待测样本的时域波形。

图3 深沟球轴承故障辨识实验装置Fig.3 Experimental equipment of fault diagnosis for deep groove ball bearings

在用所提出的方法对6205-2RS型深沟球轴承的正常状态和3种早期故障进行辨识之前,对该方法中可以预先设定的相关参数说明或设置如下:因时域和频域特征参数总数为24,故ESSLFDA的输入样本的维数亦为m=24;ESSLFDA的邻域大小设定为k=d,而最优化简维数d的估计方法如第2节所述,ESSLFDA中的局部缩放比例参数σ设定为σ=1。由于Lap-TLSSVM的经验风险惩罚参数c1,c2的变化对模式识别的精度没有显著的负面影响,故将c1,c2固定为c1=c2=1;针对非线性Lap-TLSSVM,其RBF核参数定为γ=0.5;为方便起见,设置Lap-TLSSVM的调节参数λ1=λ2=λ,λ在区间(0 1]中取值。早期故障类型(含正常状态)与3层Lap-TLSSVM期望输出的对应关系设为:正常状态→1、外圈早期轻微裂纹→2、内圈早期轻微裂纹→3、滚动体早期轻微裂纹→4。这里从50组数据中分别随机抽取nk=6、5、4、3、2、1 (k=1,…,C,C=4)组作为训练样本,则剩余的44、45、46、47、48、49组样本用作待测样本;每组训练和待测样本的数据点长度都为4 096(数据截取长度的选取遵循既大致覆盖各类早期故障的振动周期/频率又不过度增加早期故障辨识方法计算量的兼顾原则)。所提出的基于Lap-TLSSVM半监督模式识别的早期故障诊断方法的实现流程参考第2节所述,它在nk=5、4、3、2、1这5种条件下对深沟球轴承的正常状态和3类早期故障的诊断精度如表1~表5所示。为了将Lap-TLSSVM的诊断精度与CHMM、KNNC、LSSVM、Shannon小波LSSVM等经典的采用有监督学习机制的模式识别方法做比较,以评估Lap-TLSSVM在训练样本稀少条件下的诊断特性,表1~表5同时提供了后4个方法在以上5种训练样本稀少条件下的分类精度,其中特征挖掘环节使用的时、频域特征参数集和维数化简环节使用的ESSLFDA维持不变。

图4 深沟球轴承正常状态、外圈轻微裂纹、内圈轻微裂纹、滚动体轻微裂纹待测信号波形Fig.4 Waveform of the testing signals of normal state, minor outer race crack, minor inner race crack and minor ball crack

对表1~表5分析得知,随着训练样本数的逐步递减,CHMM、KNNC、LSSVM、Shannon小波LSSVM等有监督机制下的模式识别方法对正常状态和3种早期故障的诊断精度及平均诊断精度都出现了明显下滑;当每类早期故障(或正常状态)的训练样本数降至nk=1时,CHMM、KNNC、LSSVM、Shannon小波LSSVM的分类决策能力已完全失效。而对于Lap-TLSSVM而言,在训练样本数递减情况下只要适当减小调节参数λ(即增大包含大量无标签样本信息的流形规则项的权重),Lap-TLSSVM对深沟球轴承的正常状态和3类早期故障的诊断精度仍维持较高水平。这表明由于Lap-TLSSVM寻找一对非平行超平面来聚集同类、区隔异类,同时在目标函数中嵌入了流形规则项,使得只要适当调节流形规则项的权重,就能使Lap-TLSSVM的分类能力在训练样本稀少且待测样本数据结构复杂的条件下仍具有优良的鲁棒性,因此Lap-TLSSVM比CHMM、KNNC、LSSVM、Shannon小波LSSVM等有监督学习机制更适用于训练样本不足条件下的旋转机械早期故障诊断问题。由于RBF内核的卓越的非线性映射能力,使得非线性Lap-TLSSVM的诊断精度在nk=6、5、4、3、2、1六种情况下又总是略高于线性Lap-TLSSVM。

表1 6种模式识别方法的早期故障诊断精度对比(nk=5)

表2 6种模式识别方法的早期故障诊断精度对比(nk=4)

表3 6种模式识别方法的早期故障诊断精度对比(nk=3)

表4 6种模式识别方法的早期故障诊断精度对比(nk=2)

表5 6种模式识别方法的早期故障诊断精度对比(nk=1)

为体现验证过程中所抽取的训练样本和待测样本的随机性和多样性,这里再用交叉验证法从深沟球轴承的3类早期故障及正常状态的各50组振动数据中随机抽取nk=1 (k=1,…,C,C=4)组作为训练样本,从剩余的所有(50-nk)×C=96组样本中用交叉验证法随机抽取总共10组样本作为待测样本,结果在待测样本中含有4组外圈早期轻微裂纹的样本和6组内圈早期轻微裂纹的样本,不含正常状态和滚动体早期轻微裂纹的样本,每组训练和待测样本的数据点长度仍为4 096。将训练和待测样本导入所提出的早期故障诊断方法(Lap-TLSSVM的权重调节参数λ=0.1)进行识别,得到对外圈早期轻微裂纹和内圈早期轻微裂纹待测样本的诊断结果如表6所示。

如表6所示,无论是非线性Lap-TLSSVM还是线性Lap-TLSSVM,它们对4组外圈早期轻微裂纹待测样本和6组内圈早期轻微裂纹待测样本的诊断精度都较高。

表6 所提出方法对10组待测样本的早期故障诊断结果(nk=1)

另一方面,本文比较了Lap-TLSSVM与CHMM、KNNC、LSSVM、Shannon小波LSSVM的计算效率。图5所示为在nk=6时,用3层非线性Lap-TLSSVM、3层线性Lap-TLSSVM、CHMM、KNNC、LSSVM、Shannon小波LSSVM对深沟球轴承的正常状态和3类早期故障分别做10次早期故障诊断实验所消耗的平均训练时间(实验是在4G RAM、3GHZ Intel Core i5-2320 CPU和Matlab 2009的计算机配置条件下开展的)。3层非线性Lap-TLSSVM和3层线性Lap-TLSSVM对训练样本的平均训练时间分别仅为0.000 608 s和0.000 567 s,远低于CHMM、KNNC、LSSVM和Shannon小波LSSVM所消耗的平均训练时间。表明Lap-TLSSVM的目标函数采用的等式约束条件以及求解目标函数所使用的共轭梯度算法都有效加速了训练过程,使其计算效率要显著高于后四种模式识别方法。

图5 (a) 非线性Lap-TLSSVM;(b) 线性Lap-TLSSVM;(c) CHMM;(d) KNNC;(e) LSSVM;(f) Shannon小波LSSVM的平均训练时间Fig.5 Mean training times of (a) Nonlinear Lap-TLSSVM;(b) Linear Lap-TLSSVM;(c) CHMM;(d) KNNC;(e) LSSVM; (f) Shannon wavelet LSSVM

4 结 论

(1) ESSLFDA在待测样本的局部几何信息和训练样本的类标签双重指导下进行类判别,还施加了不相关约束使所提取的特征统计不相关,因此在训练样本稀少条件下也能产生较好的分类效果。

(2) Lap-TLSSVM寻找两个非平行超平面使每个超平面靠近样本隶属的类别,并远离异类;引入了包含大量待测样本信息的流形规则实现半监督学习;且目标函数只含等式约束条件,并嵌入了共轭梯度算法求解目标函数的线性方程组以加速训练过程。这使Lap-TLSSVM在训练样本稀少情况下具有较高的模式识别精度,且训练速度更快。

(3) 基于时、频域特征参数集、ESSLFDA和Lap-TLSSVM的理论优势,所提出的旋转机械早期故障诊断方法在训练样本非常稀少的条件下具有较高的诊断精度和计算效率。

[ 1 ] TANG H F, CHEN J, DONG G M. Sparse representation based latent components analysis for machinery weak fault detection [J]. Mechanical Systems and Signal Processing, 2014, 46 (2): 373-388.

[ 2 ] WANG Y, XU G H, LIANG L, et al. Detection of weak transient signals based on wavelet packet transform and manifold learning for rolling element bearing fault diagnosis [J]. Mechanical Systems and Signal Processing, 2015, 54/55: 259-276.

[ 3 ] 王国彪,何正嘉,陈雪峰,等. 机械故障诊断基础研究“何去何从”[J]. 机械工程学报, 2013, 49(1):63-72. WANG Guobiao, HE Zhengjia, CHEN Xuefeng, et al. Review of life prediction for mechanical major equipments [J]. Chinese Journal of Mechanical Engineering, 2013, 49(1):63-72.

[ 4 ] LI W, RUAN Q Q, WAN J. Dimensionality reduction using graph-embedded probability-based semi-supervised discriminant analysis [J]. Neurocomputing, 2014, 138:283-296.

[ 5 ] HUANG H, LI J W, LIU J M. Enhanced semi-supervised local fisher discriminant analysis for face recognition [J]. Future Generation Computer Systems, 2012, 28 (1): 244-253.

[ 6 ] LI F, WANG J X, CHYU M K, et al. Weak fault diagnosis of rotating machinery based on feature reduction with supervised orthogonal local fisher discriminant analysis [J]. Neurocomputing, 2015, 168:505-519.

[ 7 ] LI F, CHYU M K, WANG J X, et al. Life grade recognition of rotating machinery based on supervised orthogonal linear local tangent space alignment and optimal supervised fuzzy c-means clustering [J]. Measurement, 2015, 73: 384-400.

[ 8 ] JIANG L, XUAN J P, SHI T L. Feature extraction based on semi-supervised kernel Marginal Fisher analysis and its application in bearing fault diagnosis [J]. Mechanical Systems and Signal Processing, 2013, 41(1/2): 113-126.

[ 9 ] ZHANG S W, LEI Y K, WU Y H. Semi-supervised locally discriminant projection for classification and recognition [J]. Knowledge-Based Systems, 2011, 24(2): 341-346.

[10] 张小丽,陈雪峰,李兵,等. 机械重大装备寿命预测综述[J]. 机械工程学报, 2011, 47 (11):100-116. ZHANG Xiaoli, CHEN Xuefeng, LI Bing, et al. Review of life prediction for mechanical major equipments [J]. Journal of Mechanical Engineering, 2011, 47 (11):100-116.

[11] ANTONUCCI A, ROSA R D, GIUSTI A, et al. Robust classification of multivariate time series by imprecise hidden Markov models [J]. International Journal of Approximate Reasoning, 2015, 56: 249-263.

[12] ZOUHAL L M, DENOEUX T. An evidence-theoretic k-NN rule with parameter optimization [J]. IEEE Transactions on Systems, Man, and Cybernetics, 1998, 28 (2): 263-271.

[13] 李锋,汤宝平,宋涛. 基于Shannon小波支持矢量机二级决策的故障诊断[J]. 机械工程学报, 2010, 46 (17): 42-47. LI Feng, TANG Baoping, SONG Tao. Fault diagnosis based on the second class decision making through Shannon wavelet support vector machine [J]. Journal of Mechanical Engineering, 2010, 46 (17): 42-47.

[14] CHEN W J, SHAO Y H, DENG N Y, et al. Laplacian least squares twin support vector machine for semi-supervised classification [J]. Neurocomputing, 2014, 145: 465-476.

[15] BELKIN M, NIYOGI P, SINDHWANI V. Manifold regularization: a geometric framework for learning from labeled and unlabeled examples [J]. Journal of Machine Learning Research, 2006, 7(1): 2399-2434.

Early fault diagnosis using Laplacian twin least squares support vector machine

LI Feng1,TANG Baoping2,GUO Yin3

(1.School of Manufacturing Science and Engineering, Sichuan University, Chengdu 610065, China;2.The State Key Laboratory of Mechanical Transmission, Chongqing University, Chongqing 400044, China;3.The General Design Department, Sichuan Academy of Aerospace Technology, Chengdu 610100, China)

A novel early fault diagnosis method based on semi-supervised pattern recognition with Laplacian twin least squares support vector machine (Lap-TLSSVM) was proposed in this paper. In this method, the time-frequency domain feature set was first used to widely collect the feature information of various early faults. Then, the enhanced semi-supervised local Fisher discriminant analysis (ESSLFDA) was utilized to reduce the high-dimensional time-frequency domain feature sets of training and testing samples to the low-dimensional eigenvectors with better category segregation. Finally, the low-dimensional eigenvectors of all samples were input into the introduced Lap-TLSSVM to conduct early fault diagnosis. In Lap-LSTSVM, the manifold regularization with large amounts of unlabeled data information was introduced to achieve semi-supervised learning. In addition, the twin objective functions of Lap-LSTSVM have only equality constraints and an efficient conjugate gradient (CG) algorithm was embedded in Lap-LSTSVM to solve the linear equations of objective functions for speeding up the training procedure. The proposed early fault diagnosis method has high diagnosis accuracy and computation efficiency even if the training sample set is small. Experimental results of early fault diagnosis on deep groove ball bearings confirm the effectiveness of the proposed method.

rotating machinery; manifold learning; Laplacian twin least squares support vector machine; semi-supervised learning; fault diagnosis

国家自然科学基金青年基金(51305283);中国博士后科学基金第60批面上资助项目(2016M602685)

2016-04-29 修改稿收到日期: 2016-06-06

李锋 男,博士,副教授,硕士生导师,1982年5月生

郭胤 男,博士,工程师,1984年6月生

TH165.3;TN911.2

A

10.13465/j.cnki.jvs.2017.16.014

猜你喜欢
流形模式识别训练样本
多重卷积流形上的梯度近Ricci孤立子
人工智能
局部对称伪黎曼流形中的伪脐类空子流形
对乘积开子流形的探讨
UPLC-MS/MS法结合模式识别同时测定芪参益气滴丸中11种成分
第四届亚洲模式识别会议
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究
可拓模式识别算法中经典域的确定方法
舰艇受损舱室的破损模式识别算法