基于时频特征和PSO-SVR模型的零部件剩余寿命分析*

2021-05-28 07:27舒启林
组合机床与自动化加工技术 2021年5期
关键词:时频丝杠特征向量

武 滢,舒启林

(沈阳理工大学机械工程学院,沈阳 110159)

0 引言

基于数据驱动的机械零部件剩余寿命预测方法是近年来研究较多的预测方法之一,该方法主要应用机器学习等数据处理方法对机械零部件全寿命周期各个阶段的状态数据进行分析,提取能够反映零部件状态退化的特征量,同时与记录的剩余寿命数据建立回归模型,通过特征量的变化趋势,进而预测零部件的剩余寿命[1]。常用的反映零部件状态变化的数据包括电流信号数据、振动信号数据、声发射数据等,其中电流信号数据可以在进行信号采集的同时保证机械设备正常工作[2],这对于采集零部件的全寿命周期数据是非常有利的,也是其他信号采集不具备的优势。多数机械零部件运行过程中采集的信号数据都表现出非线性、非平稳性等特点,针对这类信号,最有效的方法就是时频分析[3]。时域上常用来表征性能衰退的信号特征量有峰峰值、偏态、峭度、均方根等。频域上目前常用的信号处理方法包括小波变换、经验模态分解(Empirical Mode Decomposition, EMD)等能够有效地从非线性非平稳信号中提取具有实际物理意义的特征量的方法。EMD方法是一种自适应信号分解方法,可以从分解得到的本征模态函数(Intrinsic Mode Function, IMF)中提取反映零部件状态退化的特征量[4-5]。

支持向量机是在统计学习理论的基础上发展而来的一种新的模式识别方法,在解决有限样本、非线性及高维模式识别问题中表现出许多特有的优势。Fernández-Delgado等比较了179种不同的分类学习算法在121个数据集上的性能,发现Random Forest(随机森林)和SVM(支持向量机)分类准确率最高,在大多数情况下超过其他方法[6]。Dong S J等于基于LS-SVM方法对轴承的退化过程进行了预测[7]。近年来,人们对于剩余寿命预测的研究也越来越深入,Huang H Z对于应用支持向量机方法进行剩余寿命预测的研究现状和发展趋势进行了总结[8]。Li B等基于Gamma过程和Bayesian方法对轴承的剩余寿命在线预测模型进行了研究[9]。

本文提出了基于信号数据时频特征向量和粒子群优化支持向量机回归模型(PSO-SVR)的剩余寿命预测方法。在对采集的全寿命周期信号数据进行时域分析和经验模态分解(EMD)后,应用皮尔逊相关系数,分别筛选信号的时域特征和IMF分量,构造多变量时频特征向量。结合记录的零部件的实际剩余寿命数据,建立由粒子群优化算法(PSO)优化的支持向量机回归模型(PSO-SVR)。最后通过训练好的模型预测零部件实时信号所反映的剩余寿命。以某型号卧式加工中心X轴丝杠为实时监测对象,对丝杠三相电流信号中部分铣削电流数据进行特征提取与特征选择,根据选择的时频特征向量对X轴丝杠进行剩余寿命预测,与SVR方法和BP神经网络方法对比,对所提出方法的预测准确度和泛化能力进行了验证。

1 信号IMF分量的能量特征

1.1 EMD方法

EMD方法通过筛分过程实现IMF函数的分解,通过筛分过程依次得到信号从高频到低频的多个IMF分量Cn(t)和残余项r,直到满足预先给定的终止条件,则筛选过程结束[10]。最终,原始信号可以表示为如式(1)所示:

(1)

式中,各IMF分量C1(t),C2(t), … ,Ck(t)分别表示原始信号从高频到低频不同频段的成分。

这里采用仿柯西收敛准则(如式(2)所示)约束筛分过程。

(2)

式中,SD称为筛分门限值,一般取0.2~0.3;T为信号序列的时间长度;h1k(t)为第k次筛选所得数据;h1(k-1)(t)为第k-1次筛选所得数据。

1.2 信号IMF分量的能量特征

当机械零部件发生磨损时,其EMD分解的IMF分量的能量信息[11]会发生相应变化。这里采用零部件电流信号的IMF分量的能量信息作为特征值可以间接反映零部件剩余寿命的变化情况。

应用EMD方法对信号x(t)进行分解,得到n个内禀模态函数(IMF分量)和一个残留量r,计算各IMF分量的总能量,如式(3)所示:

(3)

式中,Ci(t)为第i个IMF分量,Ci为离散点的幅值,n为采样点个数。

那么m个IMF分量的总能量Es,即为:

(4)

构造能量特征向量E′为:

E′=[E1E2…Em]/Es

(5)

2 PSO-SVR回归模型

2.1 SVR回归模型

支持向量机理论以其良好的泛化能力著称,其基本思想是通过核函数,将输入空间映射到高维空间,进而求出原样本集的最优分类面,使得所有样本离该最优分类面的误差最小[12-13]。

设在高维特征空间中建立的线性回归函数为:

f(x)=wTΦ(x)+b

(6)

可以将最优分类面的构造转化为二次规划问题,即:

(7)

约束条件为:

(8)

式中,αi为与每个样本对应的Lagrange乘子;ε为线性不敏感损失误差;C为惩罚因子,其值越大表示对误差大于ε的样本惩罚越大,反之越小。K(xi,xj)=Φ(xi)Φ(xj)为核函数。核函数有多种形式,这里采用径向基核函数:

(9)

其中,σ为径向基核参数。

求得最优回归函数为:

(10)

2.2 PSO-SVR回归模型

SVR模型参数的选择对模型预测结果起着关键的作用。为了获得较高的预测准确度,这里通过粒子群优化(PSO)算法对SVR模型中的参数进行优化以获得最佳参数。

粒子群优化算法(PSO)通过在可行解空间初始化一群粒子,用位置、速度和适应度值来表示粒子的特征,通过跟踪个体极值Pbest和群体极值Gbest更新粒子的速度与位置[14],即:

(11)

(12)

其中,d=1,2,…,D,D表示搜索空间的维数;i=1,2,…,n,n表示种群中的粒子数;k为当前迭代次数;Vid为当前粒子的速度;ω为惯性权重;c1和c2为学习因子;r1和r2为[0, 1]区间的随机数。

这里,将惩罚参数C、径向基核参数σ、不敏感损失误差ε作为PSO算法中的粒子,由SVR模型计算出的各个粒子的均方根误差(MSE)作为适应度函数来验算粒子的优劣。通过不断更新粒子的速度和位置,直至达到最小误差或最大迭代次数,从而得到满足适应值函数最小的全局最优解,即得到了经过PSO算法优化的SVR模型参数。

3 基于信号时频特征和PSO-SVR模型的机械零部件剩余寿命预测方法

基于信号时频特征和PSO-SVR模型的机械零部件剩余寿命预测方法框图如图1所示。

图1 基于时频特征向量和PSO-SVR模型的零部件剩余寿命预测方法框图

如图1所示,该方法具体步骤为:

(1)时域特征提取。首先对采集的信号进行时域特征提取。本文考虑了7种时域统计特征,各统计特征的计算公式如表1所示。

表1 时域特征值计算公式

尽管上述特征可以反映零部件的性能状态,但其反映的精确度却有较大差别。其中的一些特征与零部件的状态改变密切相关,而其他特征则不能准确的反映零部件状态改变的趋势。因此,有必要从特征集中选取那些可以精确反映零部件性能状态的特征,来避免维数灾难并提供预测的准确度。这里用皮尔逊积矩相关系数ρ(如式(13)所示)来表征特征和零部件性能的相关性,其取值范围在[-1,+1]之间。

(13)

应用式(13)对表2中的7种特征值与剩余寿命进行相关系数计算,选取与剩余寿命最为相关的m个特征值,构造时域特征向量T=[T1T2…Tm]作为模型时域输入特征。

将上述时域特征T和频域特征E′ 组成时频特征向量X作为模型输入特征,即:

X=[X1X2…Xk]

(14)

(3)PSO-SVR预测模型的建立。将上述经过筛选得到的特征向量X的一部分数据作为训练集,连同对应训练集样本的剩余寿命数据进行PSO-SVR模型训练,建立模型M。其余数据作为测试集,代入训练好的模型M中进行剩余寿命预测,将得到的预测结果连同对应测试集样本的剩余寿命数据计算均方误差ε(如式(15)所示)和决定系数R2(如式(16)所示),对模型性能进行评价。若性能没有达到要求,则可以通过修改模型参数重新建立回归模型,直到满足要求为止。满足要求则确定了模型参数,即确定了PSO-SVR预测模型M。

(15)

(16)

(4)对于实时采集的信号数据,首先按照步骤(1)、步骤(2)进行特征提取,然后将提取的时频特征代入步骤(3)建立的PSO-SVR预测模型中进行实时剩余寿命预测。

4 卧式加工中心丝杠剩余寿命预测

4.1 丝杠电流数据采集及预处理

对某汽车公司发动机缸盖生产线上的卧式加工中心X轴丝杠进行实时电流数据采集。该机床为数控Fanuc系统三轴卧式加工中心,发动机缸盖材料为铝合金。

提取该卧式加工中心X轴丝杠铣削缸盖平面时的全寿命周期电流信号进行X轴丝杠剩余寿命预测。发动机缸盖铣削平面刀具为4刃面铣刀,直径30 mm,铣削参数为主轴转速5660 rpm,进给速度1700 mm/min,切削深度0.8 mm。

对采集的X轴驱动电机U、V、W三相电流信号进行预处理得到实测电流数据RMS值。为保证数据选取合理,具有普遍性,这里选取一次加工中,第二次铣削平面时其中2个波峰,3个波谷共计601个数据,可以覆盖到对故障敏感的最低频率,如图2所示。共提取以上类型数据110组对应于X轴丝杠不同剩余寿命阶段。

图2 截取的铣削加工部分数据段

4.2 特征提取

4.2.1 时域特征提取

应用式(13)计算4.1节预处理得到的110组数据中各电流信号峰峰值、标准差、偏态、峭度、均方根、波峰因子和波形因子分别和剩余寿命之间的相关系数绝对值为0.758 4、0.720 6、0.743 2、0.59、0.469 5、0.859 6、0.790 3。选取相关系数绝对值较高的5种特征值,即峰峰值、标准差、偏态、波峰因子和波形因子构造时域特征向量T作为模型时域输入特征。

4.2.2 频域特征提取

采用EMD方法对不同剩余寿命下的滚珠丝杠电流信号进行分解,得到若干IMF分量。图3所示为X轴丝杠剩余寿命为600 h时,丝杠电流信号RMS值的前6个IMF分量。

图3 丝杠电流信号IMF分解的前6个分量

根据式(13),分别计算IMF分量IMF1~IMF8与原始信号的相关系数为0.114 4,0.190 0,0.216 9,0.519 5,0.557 5,0.566 2,0.029 2,0.041 7。舍弃后两个相关系数较小的分量,选取与原始信号较为接近的前6个IMF分量,按照式(3)~式(5)计算各分量的能量信息作为PSO-SVR模型的频域输入特征E′。

将时域特征T和频域特征E′ 组成时频特征向量X(如表2所示)作为模型输入特征。

表2 电流信号时域、频域特征值与实际剩余寿命数据

4.3 丝杠剩余寿命预测模型的建立

在提取的110组丝杠时频特征向量和剩余寿命数据中,随机选取80组数据作为训练数据,其余数据作为测试数据,建立丝杠PSO-SVR剩余寿命预测模型。为了对比该模型的性能,同时将训练集与测试集数据应用BP神经网络模型和SVR模型进行建模,并对比预测结果。这里对20次测试集预测结果的均方误差与决定系数取平均值,各模型预测结果如表3所示。

表3 各模型预测结果对比

通过上述比较,可以明显看出,应用PSO-SVR回归模型进行丝杠剩余寿命预测结果优于BP神经网络模型和SVR模型,表明所建立的预测模型具有较高的准确率和较好的泛化能力。

对于实时采集的执行同样工序的丝杠电流信号数据,按照第3节阐述方法提取其时频特征向量,输入建立的PSO-SVR模型中,可以预测该电流信号对应的丝杠剩余寿命。

5 结论

对于数据驱动的机械零部件剩余寿命预测问题,根据采集的全寿命周期信号数据,采用皮尔逊相关系数,分别对时域和频域特征向量进行筛选,构造多变量时频特征向量。结合零部件实际剩余寿命数据,建立信号时频特征向量和机械产品剩余寿命之间的PSO-SVR回归模型。通过实例验证,并与BP神经网络模型和SVR模型进行对比分析,表明所提出的方法较其他模型具有更好的预测准确性和泛化能力。该方法适合于对设备进行信号监测和采集的同时,根据实测的信号进行关键部件的剩余寿命预测。

猜你喜欢
时频丝杠特征向量
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
克罗内克积的特征向量
滚珠丝杠的热力耦合作用仿真
行星滚柱丝杠副的研究
一类特殊矩阵特征向量的求法
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用
基于SIMOTION D425的高速滚珠丝杠副测控系统设计
基于时频分析的逆合成孔径雷达成像技术
对采样数据序列进行时频分解法的改进
双线性时频分布交叉项提取及损伤识别应用