基于EEMD降噪和流形学习的高速列车走行部故障特征提取

2016-05-08 07:13金炜东
铁道学报 2016年4期
关键词:频域时域特征提取

于 萍,金炜东,秦 娜

(西南交通大学 电气工程学院,四川 成都 610031)

研究表明,列车走行部发生故障时,其振动监测信号是典型的非线性非平稳随机信号。针对目前常见的非平稳信号处理方法,如短时傅立叶变换、Wigner-Ville分布、小波分析等,国内外学者将其与列车故障背景相结合,展开了大量研究工作。文献[1]利用小波变换对走行部轴承故障振动信号进行了时频分析。文献[2]利用自适应短时傅立叶变换对列车滚动轴承故障振动信号进行了特征提取。文献[3]将小波分解和离散余弦变换相结合来提取列车牵引齿轮故障特征信息,取得了较好的效果。经验模态分解(EMD)[4]是处理非线性非平稳信号的一种新方法,但利用EMD处理振动信号时易出现末端效应、模态混叠等问题,为此文献[5]提出了集合经验模态分解(EEMD),有效抑制了EMD的模态混叠现象。

列车正常运行时,走行部各部件的振动是有规律的[6],当其出现诸如抗蛇行失稳、横向减振器失效等常见故障时,这个正常的规律就被打破,表现出有故障的规律,且会伴随很多冲击成分。这些成分中往往包含走行设备运行状态的重要信息,然而其经常被噪声淹没不易识别。另一方面,由于测量时存在噪声及多种振源等因素的影响,对故障信号构造的时域、频域、时频域等高维特征集间存在一定程度的相关性及冗余信息[7],降低了分类识别率,因此需要对高维特征集进行降维。流形学习[8]是一种新的非线性维数约简方法,由于高维观察空间数据的变化模式在本质上是由少数几个隐含的变量所决定,运用流形学习降维(在较大程度保留有用信息的前提下,将原始高维空间中的数据集通过非线性映射投影到一个低维空间,从而实现高维数据的低维表示),可获得高维数据内在的低维本质特征(与原特征呈非线性关系),降低冗余信息,去除不同特征间的相关性,有利于提高故障分类的准确性。为此,本文以某高速列车走行部故障振动监测数据为研究对象,提出基于EEMD降噪获取各故障主要冲击成分—流形学习特征维数约简—支持向量机(SVM)分类识别的故障特征提取模型,旨在获得能较好地区分走行部几种常见故障类型的低维有效特征参数。

1 EEMD降噪

故障信号经EEMD分解所得一组固有模态分量(IMF)是分布在不同频段的振动成分,频率从高到低逐次排列,而与故障有关的冲击成分往往位于较高的频段,本文在引用文献[9]提到的利用基于互相关系数和峭度准则的EMD降噪的研究成果基础上,用EEMD方法代替EMD降噪,并提出将两条降噪准则归一化再相加得到综合指标,对一组IMF进行评价,从中选取一个最优的IMF来表征原故障信号,以达到突出高频段冲击成分的目的,为进一步提取特征做准备。

1.1 EEMD方法原理

EEMD的本质是在原始信号中加入高斯白噪声的多次EMD分解,EEMD分解具体过程如下:

(1)在原信号x(t)中多次加入高斯白噪声n(t),第m次加入高斯白噪声的计算过程为

xm(t)=x(t)+h·nm(t)
m=1,2,3,…,N

( 1 )

式中:nm(t)为第m次所加白噪声;xm(t)为第m次加入噪声后的信号;h为所加白噪声的幅值系数。

(2)用EMD方法将xm(t)分解为一组IMF。

(3)对上述步骤1和步骤2重复N次。

( 2 )

式中:N为EMD的集合次数;ci,m为第m次EMD分解得到的第i个IMF。

1.2 故障信号冲击成分获取

本节主要目的是将各故障原始信号经EEMD分解分别得到一组IMF,依据综合指标最大准则(由峭度和互相关系数所得[9]),从中各选取一个最优IMF来分别表征原始故障信号所含的主要冲击成分,从而达到降噪目的。

互相关系数定义为

( 3 )

式中:Rx,ci(τ)为分解所得各IMF与原始信号的互相关;Rx(τ)为原信号的自相关。

峭度是无量纲参数,对检测故障信号中所含冲击成分十分有效,其数学描述为

( 4 )

式中:μ为信号x的均值;σ为信号x的标准差。当机械部件发生故障时,其振动信号的峭度值相对于正常状态会明显增大[9],说明信号中冲击成分增多。

信号经EEMD分解所得某IMF的峭度值K越大,说明该IMF中含有相对较多的冲击成分,包含的故障信息越丰富。同样,若某IMF的互相关系数值ρx,ci越大,则说明该分量与信号本身越相似。故K与ρx,ci对故障信号主要冲击成分的获取有相似趋势,因而将K与ρx,ci分别归一化到[0,1]之间,再相加得到综合指标Z作为最优IMF分量选取准则,其定义为

Z=K′+ρ′

( 5 )

式中:K′和ρ′分别为K和ρx,ci归一化后的结果。

2 特征提取与维数约简

对上述依据综合指标最大准则所得最优IMF表征的已降噪信号进行特征分析,提取每个样本信号24维特征(包括16个时域、频域特征以及8个小波包能量矩描述的时频域特征),具体构成如下:

2.1 时域、频域特征

时域、频域特征参数是信号全局取值的统计均值,不同的特征参数提供了不同的分析角度。表1列出了本文所用到的16个时域、频域特征的计算公式。

表1 时域、频域特征参数

续上表

其中,μ为信号x的均值;b1~b16依次为标准差、方差、偏斜度、峭度、峰-峰值、峰值、均方幅值、平均幅值、方根幅值、波形指标、峰值指标、脉冲指标、裕度指标、总功率谱和重心频率、频率方差。

2.2 小波包能量矩特征

当列车走行部发生故障时,其振动监测信号的能量空间分布与正常时相比会发生一定变化。故障状态与正常时相比,同频带内信号的能量分布将有较大差别,利用这一特征可建立能量与不同故障间的映射关系。本节采用文献[10]中提到的能量矩概念,采用db14小波包函数对原信号进行6层小波包分解重构,从而将已降噪信号分解在不同频带内,提取前8个频带各自的小波包能量矩特征,并作归一化处理,得到每个样本信号以能量矩为元素的一个8维特征向量。各频带信号Sjk的能量矩Mj的数学描述如下

( 6 )

( 7 )

式中:Δt为采样时间间隔;n为总的采样点数;E为归一化的能量矩特征向量。能量矩[10]不仅考虑了各频带上的能量大小,还考虑了能量随时间的分布情况,较好地描述了信号的时频域特征,表征了列车走行部故障信号的非平稳时变特性。

2.3 维数约简

邻域保持嵌入(NPE)是一种基于局部保持的流形学习方法[11],其基本思想是:设X=(x1,x2,…,xN)为高维观测空间RD中的数据集,其中xi∈RD,i=1,2,…,N,NPE算法的实质就是寻找一个最佳映射变换矩阵aT,该矩阵可实现从高维观测空间RD中的数据集X到低维嵌入空间Rd的数据集Y的映射,即Y=aTX,且在降维同时,保持高维数据集原有的局部流形结构不变,具体实现步骤如下:

(1)局部邻域因子k选择,构建邻域图

(2)计算权值矩阵W

在重构损失函数φ(W)最小的条件下,求解近邻图重构权值系数矩阵W。其中φ(W)的定义为

( 8 )

式中:wij表示数据点xi的第j个近邻的加权。上述过程等价于求解以下约束最优化问题。

( 9 )

(3)利用计算得到的权值矩阵W,求解每个高维数据点X对应的低维表示Y,具体可由求解以下约束问题得到。

(10)

式中:I为N阶单位矩阵。带入线性变换Y=aTX得

(11)

利用线性代数知识可将式(11)等价为

(12)

式中:M=(I-W)T×(I-W)。

式(12)的最优化问题可转化为求解XMXTa=λXXTa这个广义特征方程的d个最小特征值对应的特征向量,即可得到低维投影向量。

2.4 故障信号冲击特征提取流程

通过上述分析,基于EEMD和流形学习提取高速列车走行部故障信号冲击特征的具体步骤如下:

步骤1对各工况信号进行EEMD分解,各得到一组IMF,依据综合指标最大准则获取一个最优IMF来表征各故障信号所含主要冲击成分,以达到降噪目的。

步骤2对步骤1中所得最优IMF分量表征的已降噪信号提取时域、频域、小波包能量矩特征,构造每个样本的高维特征集。

步骤3运用流形学习NPE算法对高维特征集进行维数约简,得到低维本质特征。

步骤4运用SVM进行故障类型识别。

3 实验

为了验证本文特征提取模型的有效性和优越性,对轴承标准数据集和高速列车走行部故障振动信号监测数据分别进行了仿真实验。

3.1 标准数据集实验

首先引用来自美国Case Western Reserve大学轴承数据中心提供的数据[12]进行仿真验证,数据是由驱动器端加速度计测得的轴承转速为1 797 r/min时正常、内环故障、外环故障、滚珠故障四种工况的振动信号,采样频率为12 kHz。图1为四种工况振动信号前0.5 s采样数据的时域图(图中横坐标表示时间,纵坐标表示信号幅值)。

图1 四种工况振动信号时域图

由图1可以看出,当轴承出现故障时(图1(b)、图1(c)、图1(d)),振动信号在时域图中的幅值相对于正常(图1(a))时明显增大,但由于噪声等因素的影响,由故障引起的冲击成分并不易区分。为此,按照2.4节特征提取流程的步骤1,对四种工况的原始信号进行EEMD分解,各得到一组IMF,并计算各分量的综合指标值,结果如图2所示。

图2 四种工况经EEMD分解所得分量综合指标值

由图2可知,应选取综合指标值最大的IMF1作为最优IMF分量,分别表征四种工况信号所含主要冲击成分。按照2.4节的步骤2对上述最优分量表征的四种工况的已降噪信号,每种工况截取15 000个点,每500个点为一个样本,各提取24个特征(包括16个时域、频域特征和8个小波包能量矩特征),从而构造出120×24的原始高维特征集。按照2.4节步骤3,运用NPE算法对四种工况信号的原始高维特征集(24维)降维,得到低维本质特征(3维)分布如图3所示。可以看出低维特征聚类效果较好,四类工况在低维分布图中能完全区分开,且不同类别之间有较大的类间距离,同一类内具有较小的类内距离,表明NPE算法降维所得低维特征的优异性,可以实现不同故障间的有效分离。

图3 经EEMD降噪的四种工况低维特征分布

按照2.4节的步骤4将上述所得低维特征作为SVM的输入进行故障识别,得到四种工况识别率均为100%,从而验证了本文特征提取模型的有效性。

3.2 高铁故障数据实验

数据来源:模拟走行部出现故障时,通过安装在转向架上的某横向加速度传感器监测到的四种工况振动信号数据。(a)正常;(b)抗蛇行减振器全拆;(c)横向减振器全拆;(d)复合故障(横向减振器全拆复合抗蛇行减振器全拆)。采样时长3.5 min,采样频率243 Hz。图4为四种工况振动信号前60 s采样数据的时频图。

图4 四种工况原始信号时、频域图

由图4可以看出,相对于正常状态,当走行部出现故障时,振动信号在时、频域图中的振幅明显增大,并且出现了很多冲击成分,不同故障的冲击强度、特征频率也不同,即故障信号的固有振动频率发生了变化,偏离了正常运行时的分布。按照2.4节的步骤1对四种工况信号运用EEMD分解,计算分解所得各IMF分量的综合指标值,结果如图5所示。

图5 四种工况EEMD分解所得分量综合指标值

由图5可以看出,对走行部数据,应选取综合指标值最大的IMF1作为最优分量,来表征各故障信号所含主要冲击信息。同样,对走行部数据每种工况截取14 580个点,每486个点为一个样本,各提取24个特征得到原始特征空间构成为120×24,用NPE算法降维得120×3的低维特征,结果如图6所示。

图6 经EEMD降噪的四种工况低维特征分布

由图6可以看出,低维特征所达到的分类精度很高,四种工况都能完全分开,且各工况间类内距较小,类间距较大。此外还可看出工况d(横向减振器全拆复合抗蛇行减振器全拆)的低维嵌入坐标与工况b(抗蛇行减振器全拆)、工况c(横向减振器全拆)这两个单一故障的低维坐标并没有重叠,而是有较大的类间距。表明虽然a与b形成的复合故障能够与单一故障a,b分开,呈三块区域分布,但无法判断此复合故障中是否含有a,b这两种成分,这里把复合故障当成一种新的故障类型。原因可能是由于高速列车走行部动力学系统是一个非线性系统,不满足叠加性等一系列线性系统特征,因而该复合故障不是两种单一故障成分的简单线性叠加,而是以某种未知的形式出现的,同时复合故障必定会含有构成它的两个单一故障成分的某些特征,这一点有待进一步探索。按照2.4节步骤4将所得低维特征输入SVM进行分类,得到三种单一故障及一种复合故障的识别率均为100%,从而实现了走行部故障的准确诊断。

为进一步验证本文运用EEMD对故障信号降噪的有效性,将未经EEMD进行降噪的四种工况原信号直接提取24个高维特征,并在相同实验条件下,用流形学习NPE算法进行维数约简,得到低维特征分布如图7所示。

图7 未用EEMD降噪的四种工况低维特征分布

由图7可以看出,四种工况不能有效区分开,各工况的低维特征分布也较分散,类内距离较大,且工况d与工况a混叠,工况b与工况c的低维分布也较接近,聚类结果较差。进一步借助SVM对各工况进行分类识别,得到工况a的识别率为86.67%,工况b的识别率为73.33%,工况c的识别率为93.33%,工况d的识别率为80.0%,明显比运用EEMD降噪所得到的分类结果差,这是因为运用EEMD降噪提取最优IMF分量来表征原信号,能达到突出各故障信号中高频段的冲击成分的效果,更有利于特征提取。

4 结束语

(1)本文利用流形学习的NPE算法对各故障的原始高维特征集进行降维,得到低维本质特征,降低了高维特征间的相关性和冗余性,提高了分类效果,是较好区分走行部几种常见故障类型的有效特征参数。

(2)本文针对高铁走行部故障监测数据特点所提出的冲击特征提取模型是有效的,标准数据集实验和高铁数据实验结果验证了该模型能够有效提高走行部多种故障分类的准确度。实验中发现邻域因子k的选择对NPE算法的整体性能具有重要影响,如何实现邻域因子的自适应选择是将来工作的研究方向之一。另外,本文所研究的数据都是走行部几种部件在全拆状态下的监测数据,实际应用中故障监测常面对的是性能退化问题,进一步探究设备参数渐变规律是后续研究的重点。

参考文献:

[1]陈特放,黄采伦,樊晓平.基于小波分析的机车走行部故障诊断方法[J].中国铁道科学,2005,26(4):89-92.

CHEN Tefang, HUANG Cailun, FAN Xiaoping. Fault Diagnosis Method for Locomotive Bogies Based on Wavelet Analysis[J]. China Railway Science, 2005,26(4):89-92.

[2]丁夏完,刘葆,刘金朝,等.基于自适应STFT的货车滚动轴承故障诊断[J].中国铁道科学,2005,26(6):24-27.

DING Xiawan,LIU Bao,LIU Jinzhao,et al.Fault Diagnosis of Freight Car Rolling Element Bearing with Adaptive Short-time Fourier Transform[J].China Railway Science,2005,26(6):24-27.

[3]黄采伦,樊晓平,陈春阳,等.基于小波系数提取及离散余弦包络分析的机车牵引齿轮故障诊断方法[J].铁道学报,2008,30(2):98-102.

HUANG Cailun,FAN Xiaoping,CHEN Chunyang,et al.Fault Diagnosis Method of Locomotive Driven Gear Based on Envelopment Analysis of Wavelet Coefficients Extraction and DCT[J].Journal of the China Railway Society,2008,30(2):98-102.

[4]SHEN Z, et al. The Empirical Mode Decomposition and the HilbertSpectrum for Nonlinear and Non-stationary Time Series Analysis[J].Proceedings of the Royal Society of London (Series A),1998,454:903-995.

[5]WU Z H, et al. Ensemble Empirical Mode Decomposition:A Noise-Assisted Data Analysis Method[J]. World Scientific,2009, 1(1):1-41.

[6]张兵.列车关键部件安全监测理论与分析研究[D]. 成都:西南交通大学, 2007:34-38.

[7]张葛祥.雷达辐射源信号智能识别方法研究[D] .成都:西南交通大学, 2005: 42-50.

[8]COSTA J, et al. Geodesic Entropic Graphs for Dimension and Entropy Estimation in Manifold Learning [J].IEEE Transactions on Signal Processing,2004, 25(8):2 210-2 221.

[9]苏文胜,王奉涛,张志新,等.EMD降噪和谱峭度法在滚动轴承早期故障诊断中的应用[J].振动与冲击,2010,29(3):18-21.

SU Wensheng,WANG Fengtao,ZHANG Zhixin,et al.Application of EMD Denoising and Spectral Kurtosis in Early Fault Diagnosis of Rolling Element Bearings[J].Journal of Vibration and Shock,2010,29(3):18-21.

[10]林圣,何正友,罗国敏.基于小波能量矩的输电线路暂态信号分类识别方法[J].电网技术,2008,32(20):30-34.

LIN Sheng,HE Zhengyou,LUO Guomin.A Wavelet Energy Moment Based Classification and Recognition Method of Transient Signals in Power Transmission Lines[J].Power System Technology,2008,32(20):30-34

[11]HE X F, et al. Neighborhood Preserving Embedding[C]// Tenth IEEE International Conference on Computer Vision, 2005,2:1 208-1 213.

[12]The Case Western Reserve University Bearing Data Center Website. Bearing Data Center Seeded Fault Test Data [EB/OL].http: http://www.eecs/cwru/edu/laboratory/bearing.2008-3-11.

猜你喜欢
频域时域特征提取
基于频域的声信号计权改进算法
基于复杂网络理论的作战计划时域协同方法研究
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Daubechies(dbN)的飞行器音频特征提取
频域稀疏毫米波人体安检成像处理和快速成像稀疏阵列设计
山区钢桁梁斜拉桥施工期抖振时域分析
网络控制系统有限频域故障检测和容错控制
Bagging RCSP脑电特征提取算法
一种用于高速公路探地雷达的新型时域超宽带TEM喇叭天线
基于改进Radon-Wigner变换的目标和拖曳式诱饵频域分离