基于CEEMD-SE和LSTM的滚动轴承剩余寿命预测

2021-07-04 09:58高宏玉张守京

轻工机械 2021年3期

高宏玉，王典，张守京

(1.北奔重型汽车集团有限公司，内蒙古包头 014000；2.西安工程大学机电工程学院，陕西西安 710048)

在现代工业生产系统中，不同的组件协同工作以实现既定目标[1]。滚动轴承作为许多生产领域的关键部件，其健康状况在很大程度上影响着整个机械系统的性能[2]。然而，滚动轴承通常在恶劣多变的工作环境下工作，在工程应用中易受损伤。尽管滚动轴承在相同的工作条件下与其它产品部件一起使用，但是它们的使用寿命可能会有很大的不同。对滚动轴承的性能进行评估，不仅可以保证机械设备的平稳、高效运行，而且可以发现和消除运行中的意外故障事件。因此，在对传感器信号进行实时监测的基础上，对滚动轴承的性能退化进行评估也是至关重要的[3-4]。评估滚动轴承的性能退化从根本上说是机器健康监测系统(machine health monitoring system，MHMS)问题。应用于MHMS的方法一般有2种:物理的模型和数据驱动的模型[5]。

包括马尔科夫模型在内的其他基于机理模型的方法，在设备不断精密化、智能化和复杂化的前提下建立准确的物理模型非常困难[6]。数据驱动的方法，包括统计分析和人工智能，是当前研究的焦点[7]。统计分析方法需要预测多步递归后的剩余寿命(remaining useful life，RUL)，不能保证实时性，而浅层人工智能方法存在特征提取不精确的问题，所以目前基于深度学习的方法是RUL预测中最流行的方法之一[8]。

堆叠自动编码器是一种传统的深度学习方法，该方法能够提取到更加精确的特征[9]，但是由于RUL预测很明显的一个特点就是时间相关性，而自编码器(auto-encoders，AE)方法无法提取到时序数据的时间相关性特征，因此后来人们提出循环神经网络模型(recurrent neural network，RNN)。RNN能够建立数据之间的时间相关性关系[10]，但是在实际应用中受计算节点的限制，其“记忆能力”受限。针对这些问题，RNN的变体——长短期记忆神经网络 (long short-term memory，LSTM)应运而生，并且其在语音识别等领域效果显著[11]。然而LSTM在设备RUL预测上的应用是极少的，尤其是在重要领域发挥着非常关键作用的设备上RUL预测的研究和应用就更少了[12]。所以如何利用LSTM的优势对这类数据建立有效的RUL预测模型是非常重要的问题[13]。

因此课题组结合多频率尺度样本熵与LSTM建立寿命预测模型:一方面通过提取滚动轴承的多频率尺度样本熵特征达到降噪和提高运算效率的效果；另一方面利用LSTM处理时间序列的优势提高滚动轴承RUL预测的准确性。

1 多尺度样本熵特征提取

1.1 互补集合经验模态分解

互补集合经验模态分解(complementary ensemble empirical mode decomposition,CEEMD)在算法中加入正、负辅助白噪声以减小重构误差，实现了减小模态混叠对经验模态分解(empirical mode decomposition，EMD)影响的目的；CEEM是基于经验模态分解(empirical mode decomposition，EMD)的改进方法，与集成经验模态分解(ensemble empirical mode decomposition，EEMD)方法相比，该方法减少了噪声集的添加，提高了计算效率[14]。

CEEMD方法的具体步骤：

1) 对原信号加入符号相反的白噪声信号;

2) 利用CEEMD将加入了白噪声的信号分解成若干IMF分量；

3) 每次加入随机白噪声序列，重复步骤1)和步骤2)；

4) 分别对分解后得到的IMF求总体平均，取平均后的IMF序列作为最终结果。

1.2 样本熵

样本熵(sample entropy, SE)是度量系统在时间序列中稳定性的一个参数，表示在时间序列中出现新信息的可能性。样本熵可以测量非线性非平稳信号的复杂度，因此，样本熵可以用来测量滚动轴承振动信号的复杂度。性能退化程度越深，该指标的值越高，可用于设备健康状态的评价。

滚动轴承多频率尺度样本熵构建：为实现原始信号的降噪及多尺度化，首先采用CEEMD分解结合相关系数分析提取包含主要退化信息的IMF分量；再对各分量进行样本熵分析，即为原始信号的多频率尺度样本熵。

2 基于多尺度样本熵和LSTM的RUL预测

2.1 LSTM原理

LSTM是一种用于时间序列分析的 RNN 网络，其在RNN的基础上引入了判断信息是否符合要求的门限结构(输入门、遗忘门和输出门)来控制信息的累积速度，从而借助这种结构对新信息进行记忆和更新，解决长期依赖的问题。如图1所示每一个LSTM的神经单元是由细胞状态即长期状态ct和短期状态ht，以及输入门it、遗忘门ft和输出门ot组成。

图1 LSTM结构Figure 1 LSTM structure

所谓的细胞状态，我们可以将其理解为一个存储信息的容器，通过输入门、遗忘门和输出门的过程控制，逐步对容器中的信息进行增减变化和输出。在每一个神经单元中，细胞状态经历了遗忘门的遗忘过程，输入门的输入过程以及向输出门进行输出信息的过程。

输入门就是复制处理当前神经单元的输入信息。整个输入门包含2个部分：sigmoid激活函数部分决定什么样的输入信息会被更新，也就是忽略掉一定的输入信息；tanh部分用来构建出一个新的候选值向量，加入到当前的细胞状态中。即

(1)

遗忘门的主要作用是用来决定当前的状态需要丢弃之前的哪些信息，LSTM的通过学习来决定让网络记住哪些内容。且

ft=σ(Wf·[xt,ht-1]+bf)。

(2)

输出门主要控制的是当前隐藏状态的输出信息。且有：

(3)

式中:xt,ht分别为t时刻网络的输入和输出;ct为t时刻tanh部分构建出的新的候选值向量；ft,it,ot分别为遗忘门、输入门和输出门；Wf,Wi,Wo,Wc分别为遗忘门、输入门、输出门和记忆细胞的权重矩阵；bf,bi,bo,bc分别为遗忘门、输入门、输出门和记忆细胞的偏置；σ为sigmoid函数，φ为Tanh函数。

最后则通过时间反向传播(back propagation through time, BPTT)算法进行误差和梯度计算，得到LSTM模型的优化参数。

2.2 寿命预测步骤

课题组搭建基于多频率尺度样本熵与LSTM相结合的寿命预测模型，最大程度的保留了原始信号中包含的滚动轴承退化信息，并充分利用LSTM网络处理时间序列数据的优势提高了寿命预测精度。图2所示为寿命预测模型的框架结构。

图2 寿命预测模型框架结构Figure 2 Framework structure of life prediction model

课题组提出的寿命预测模型的过程依次为CEEMD分解、特征向量构建和RUL预测。集成预测模型的具体步骤如下：

1) 将预处理后的振动加速度序列进行CEEMD分解，得到若干个相对稳定的不同尺度的固有模态函数IMF分量以及一个剩余残差RES分量；

2) 对CEEMD分解后的若干IMF分量进行相关系数分析，提取6个包含主要退化信息的IMF分量计算样本熵特征，构建训练集和测试集矩阵；

3) 选择预测起始点(start prediction point，STP)，根据均方根特征和峭度特征选择RUL预测起始点；

4) 将训练集和测试集输入LSTM网络中进行寿命预测。

3 实验验证

3.1 实验数据处理

本研究实验数据采用美国辛辛那提大学轴承实验室第2组试验数据，其采样频率20 kHz，每隔10 min采集1个实验样本，一直到滚动轴承磨损至外圈出现故障试验终止时共提取了984个样本数据，根据其采样间隔可以计算出实验轴承全寿命周期为9 840 min。滚动轴承运行前中期较为稳定，其振动数据也处于相对平稳状态，因此文中对滚动轴承磨损前中期不予分析。

滚动轴承退化预测最重要的是在其失效前进行及时、准确的预测，而RUL预测的准确性极大程度地依赖于滚动轴承退化特征的选择和提取。

为实现降噪和最大程度保留滚动轴承退化信息的目的，课题组首先采用CEEMD对原始振动信号进行分解，使复杂的原始信号频域稳定化，得到若干个固有模态分量和一个剩余残差RES分量。图3所示为原始信号经过CEEMD分解后的结果。

图3 CEEMD分解结果Figure 3 CEEMD decomposition results

由图3可见，经过CEEMD分解后，各分量根据频谱特征从高频到低频依次表征出来，并且与原序列相比，各分量的波动更加稳定。该方法在保持原序列特征的基础上将原非线性不稳定序列分解为若干平稳子序列，证实达到了预期的效果。

在提取敏感固有模态函数IMF分量进行降噪和信号重构时，为了提取包含主要退化信息的IMF分量降低其他随机因素对预测精度的影响，大部分研究直接根据过往经验主观的进行选择。课题组从客观角度出发避免人为主观因素的影响，在选择包含滚动轴承主要退化信息的IMF分量时采用相关系数分析的方法，通过比较各子序列与原始信号之间的相关系数，选取与原始信号相关性高的IMF分量进行去噪并构建特征参数。各IMF分量与原始信号的相关系数如表1所示。根据表1的数据课题组按照时间顺序选取每组数据的前6个IMF分量计算样本熵，构成984×6的特征矩阵作为性能退化评估的特征参数。

表1 IMF分量相关系数

3.2 开始预测点(SPT)的选择

由于滚动轴承的寿命相对其他零部件较长，其寿命预测起始点的选择会影响模型训练和测试的效率以及准确性，进而将影响寿命预测的准确性，所以选择合适的滚动轴承RUL预测起始点对于提高预测精度和减少预测时间是极其重要的。

在滚动轴承运行早期对其寿命进行预测，在一定程度上会明显降低预测精度；而在滚动轴承寿命后期预测其寿命无法起到提前维修或者更换的目的。因此在保证一定预测精度情况下，选择合适的SPT点进行滚动轴承RUL预测是十分必要的[15]。

经过筛选后发现均方根特征值(root mean square, RMS)能够表征滚动轴承随时间推移引起的缓慢磨损，其反映了滚动轴承振动能量的大小[16]；峭度特征值可以有效反映滚动轴承是否存在故障，其对滚动轴承故障造成的冲击能量大小敏感[17]。所以课题组将选择均方根特征和峭度特征值作为衰退特征信号，确定开始预测点。从图4可以看出滚动轴承在第700组数据点左右出现了明显的波动，这一方面证实了均方根特征和峭度特征作为衰退特征信号是真实可信的；另一方面说明此处为较明显的滚动轴承性能衰退点。

图4 均方根与峭度特征趋势Figure 4 Characteristics trend of RMS and kurtosis

(4)

(5)

式中：MAPE为平均相对误差，评估模型的预测能力，MAPE越小模型预测精度越高；RMSE为均方根误差，评估模型预测值的离散程度，其值越小，预测值离散程度越小，预测准确性越高。

从表2中可以看出开始预测点越早模型预测时间越长，在保证一定预测精度的情况选择从第684组样本数据开始进行RUL预测效果较好。

表2 不同SPT预测结果对比

为了在保证预测精度的同时尽早开始对滚动轴承进行寿命预测，课题组选择从第384组数据开始进行模型训练，即将384～684组数据作为训练集，684～984组数据作为测试集。

3.3 LSTM模型预测

为了确定被测轴承何时到达预期寿命，根据起始预测点的选择，现将第384～684组样本数据作为训练集完成对模型的训练。图5中训练误差随着迭代次数的增加趋于0说明模型具有较好的训练效果。表3所示为经过训练后的LSTM 网络参数；图6所示为滚动轴承RUL预测结果。

图5 LSTM训练误差Figure 5 LSTM training error

表3 LSTM参数

图6 滚动轴承剩余使用寿命Figure 6 Remaining service life of rolling bearing

从图6中可以看出通过LSTM得到的预测值与真实值吻合程度较高，证明课题组特征提取和SPT点选择对提高寿命预测精度具有明显的作用。而且由于轴承不断运转至失效时振动数据会出现突变导致预测结果出现小波动，这一情况也与图6相符。这表明对滚动轴承振动信号提取多频率尺度样本熵特征输入到LSTM进行RUL预测的方法是有效的。

为验证LSTM可以充分利用具有时间相关性的退化历史数据的优越性，将本研究特征提取方法得到的多频率尺度样本熵特征作为输入，分别采用BP神经网络和ELM进行对比试验。表3列出了3种方法的预测误差，基于多频率尺度样本熵和LSTM寿命预测RMSE=0.072 7，MAPE=0.206 5，小于其他2种方法，因此该方法可以更准确预测滚动轴承RUL。

表4 预测误差

4 结语

课题组以滚动轴承原始振动信号经过CEEMD分解后提取敏感IMF分量的样本熵特征矩阵作为轴承退化的特征值完成对LSTM的训练和测试。研究结果表明，基于CEEMD-SE和LSTM的滚动轴承RUL预测方法具有较高的准确性，具备以下特点： ①提取滚动轴承的多频率尺度样本熵特征参数作为表征其退化过程的特征量，综合时频特征和熵特征，提高了模型运行效率； ②通过滚动轴承RUL预测SPT点选择降低了寿命预测长度提高了模型精度与效率； ③多层LSTM可以充分利用具有时间相关性的滚动轴承退化数据并有效地实现非线性函数映射，提高了轴承RUL预测的精度。