基于多尺度卷积神经网络的轴承剩余寿命预测

2023-02-09 01:20马占伟袁逸萍樊盼盼
机械设计与制造 2023年1期
关键词:特征提取尺度轴承

马占伟,袁逸萍,樊盼盼,赵 琴

(新疆大学机械工程学院,新疆乌鲁木齐 830047)

1 引言

设备故障预测和健康管理作为保证工业设备正常可靠运行的技术得到了广泛的关注。轴承广泛应用于各类工业设备中,通过建立轴承剩余使用寿命(Remaining Useful Life,RUL)预测模型可以实时评估轴承的退化程度,及时更换不满足要求的轴承,避免由于轴承故障所引起的故障级联传播。对设备预测性维护具有重要的指导意义。

传统的基于数据驱动(Data−Driven,DD)的轴承RUL预测方法主要有基于统计数据驱动方法和基于机器学习(Machine Learning,ML)的方法。DD类方法一般分为以下两个步骤:(1)根据检测数据特性构建退化量;(2)建立预测模型,通过退化量进行RUL预测。退化量一般基于轴承振动加速度及其他检测数据,提取其中能表征轴承退化过程的特征构建。预测模型研究主要有基于gamma[1]过程和winner[2]过程的统计数据驱动方法,以及基于支持向量机(Support Vector Machine,SVM)和深度学习(Deep Learning,DL)等ML的方法。

文献[3]采用提取振动加速度信号中提取16个时域特征指标、13个频域特征指标,通过核主成分分析进行融合,最终采用最小二乘支持向量机(Least Square Support Vector Machine,LSSVM)实现轴承RUL预测。文献[4]提取14种时、频域特征,使用相关系数法简约特征,作为BP 神经网络(BP Neural Network,BPNN)模型的输入完成了轴承RUL预测。以上方法都是人工提取特征的方法需要先验知识,而且需要融合特征。此类特征提取方法不但繁琐而且需要大量先验知识支撑。相较于BP神经网络,卷积神经网络(Convolutional Neural Network,CNN)有独特的权值共享及下采样特征降维特性,有着良好的特征提取能力[5]。因此,文献[6]将轴承的全生命周期的振动信号进行傅里叶变换,然后,将频域特征作为CNN的输入进行进一步特征提取进行RUL预测且预测结果有效。通常的CNN一般在单一尺度上进行特征提取,忽略了不同尺度的信息。

为了更加全面的提取数据特征采用多尺度卷积神经网络(Multiscale Convolutional Neural Network,MCNN)模型进行RUL预测,并且以振动加速度数据作为模型的输入,避免人工提取特征过程。最后,使用移动平均法对MCNN的输出进行平滑处理,去除局部波动对预测性能的影响,得到轴承RUL预测结果,并使用滚动轴承寿命实验数据集验证了所提方法的有效性。

2 神经网络模型

2.1 卷积神经网络

卷积神经网络是一种有监督学习的深度前馈神经网络。它可以避免由于层间的完全连接而造成的参数冗余,使得网络模型的训练依赖于大量的数据[7]。

CNN 的连接方式是局部连接,从而大大减小了网络模型的参数大小和对训练数据量的依赖性。CNN主要包含三种层:卷积层、池化层和全连接层。卷积层将输入局部区域与卷积核进行卷积,每个内核在输入向量上进行卷积,生成一个特征向量。卷积核使用相同的权值来提取输入局部区域的局部特征,被称为权值共享。假设输入信号x∈Rn,卷积核为w∈Rm,一维卷积过程,如式(1)所示。

式中:xl—第l层的输出;σ(⋅)—激活函数;bl—l层的偏置;Yl—l层的卷积运算结果,卷积核的权重为wl,卷积方式—same;yl(t)—t个输入向量与卷积核的乘积求和。

池操作的本质是降低空间维数,降低计算复杂度。经过多次卷积及平均池化,将提取的特征平铺为一维向量输入全连接层输出。

2.2 多尺度卷积神经网络

一般一个卷积层只是从输入信号中用相同尺寸的多个卷积核进行卷积操作,这种特征提取方式在一定程度上局限于卷积核的尺寸,而不同尺寸的卷积核将会从不同尺度上并行提取特征,所以用多个不同尺寸卷积核的卷积层同时对原始特征信号进行卷积操作实现不同尺度上的特征提取,以提取更加全面的信号特征。构造的MCNN结构,如图1所示。

图1 MCNN结构Fig.1 MCNN Structure

MCNN以水平和竖直两个方向的振动数据采样样本作为输入,其输入层的尺寸为2560×2。模型的多尺度层由3个拥有不同尺寸卷积核的并行一维卷积神经网络(1 Dimensional Convolu‐tional Neural Network,1D−CNN)实现,其通道数均为6,卷积核尺寸分别为4、8、16,同时在不同尺度上进行全局的特征提取。其中每个1D−CNN 后连接一个尺寸为3 的平均池化层,用以缩减特征。其次,在Concatenate层将提取的特征进行合并,以便输入后续1D−CNN。对合并后的特征进行两次卷积和一次最大池化操作,卷积操作的卷积核尺寸为8,通道数为8,最大池化尺寸为4。模型中所有1D−CNN均采用tanh激活函数,完成特征提取操作。最后通过一个输出为1激活函数为sigmoid的Dense全连接层得到RUL预测结果。

各种信息系统和平台的应用,使房地产估价从线下走向线上。相比线下作业模式,无论是接受询价、发起项目、分配项目等业务流还是外业查勘、数据采集、数据处理、报告形成等作业流,线上作业模式的工作效率都极大提升。以最常见的住宅房地产抵押估价业务为例,传统线下作业模式一般需要3~5个工作日,线上作业模式可精减至1个工作日[4]。

该模型使用损失函数为均方误差(Mean Square Error,MSE),如式(2)所示。

式中:li—样本的标签值;oi—模型的实际输出。

该模型将使用RMSprop 算法更新网络权重,该算法的更新过程为:

式中:Gt—t时刻的梯度平方和;γ—指数衰减参数;gt—t时刻的梯度;θt—t时刻的参数;η—学习率;为了避免式(4)分母为0,使用ε作为修正。RMSProp算法使用指数衰减平均调整历史梯度的比重,能自适应调节学习率,能加速模型快速收敛。

3 加权平均平滑

网络模型初步RUL预测结果多为波动较大且不连续,采用移动平均法,如式(5)对网络模型的初步预测结果进行平滑去噪处理,去除局部波动对预测性能的影响。

式中:—在t时刻平滑之后的值;yt—其t时刻未平滑的波动数据。

4 实例验证

4.1 数据来源

采用法国FEMTO−ST研究所提供的滚动轴承加速寿命数据来验证所提方法的有效性。

在实验过程中,采用两个加速度计对轴承的水平方向和垂直方向进行了振动加速度信号的采集。载荷来自水平方向,通过改变载荷转速等条件模拟不同工况。

信号采样频率为25.6kHz,每10s采集一次数据,采集数据的时间为0.1s[8]。当加速度计超过20g时,认为轴承发生故障。工况一下轴承1的全生命周期的振动加速度数据,如图2所示。

图2 振动加速度信号Fig.2 Vibration Acceleration Signal

4.2 验证结果

采用采用工况一下的前6个轴承水平和竖直两个方向的振动加速度信号作为训练样本。第7个为测试样本,其全生命周期的振动加速度数据,如图3所示。

图3 测试样本振动加速度信号Fig.3 Vibration Acceleration Signal of Test Sample

数据标签使用理想寿命退化曲线,即将轴承从初始运行到完全故障的时间作为最终寿命然后每隔一次采样周期递减1构造一维数组,再使用经验最大寿命2803(轴承1的寿命)为最大值把所有数据集中的数据归一化到[0,1]作为其剩余寿命,这样依次对每一个采样样本设置对应的标签。

先将所有训练样本数据进行归一化处理,如式(6)所示。

MCNN模型的初始化,所有层的权值初始化为服从均值为0,标准偏差为0.01的正态分布随机数;偏置初始值为0。通过多次迭代训练测试发现,当迭代次数为100、批尺度为60、初始学习率为0.01、指数衰减参数γ为0.9、ε为1×10−6时,得到最优预测结果。迭代过程中损失函数的变化,可以看出,模型经过100次迭代收敛,收敛速度较快,如图4所示。预测结果,如图5所示。

图4 MCNN训练过程Fig.4 MCNN Training Process

图5 MCNN预测值Fig.5 MCNN Estimates

采用相同卷积层数的传统CNN对相同数据集在相同初始化环境下进行了训练和测试,得到如图5的预测结果,如图6所示。

图6 传统CNN预测值Fig.6 Traditional CNN Estimates

通过图5、图6可以看出通过移动平均法平滑处理明显减少了局部波动。

从总体退化趋势可以看出,图5在轴承退化中期的退化曲线拟合较为准确,而图6中预测值明显低于实际值。通过观察训练样本轴承和测试样本轴承(图2、图3)可以看出:训练样本轴承在退化过程中振动加速度逐渐增大,为退化失效。测试样本轴承在退化后期振动加速度急剧增大,为突发失效。

对比MCNN和CNN在轴承退化后期失效过程中的预测结果可以发现,对于测试样本中突发失效的情况,前者对该部分的RUL 预测误差更小,因此MCNN 具有更好的泛化能力。较传统CNN,该研究提出的MCNN模型的预测结果更加符合实际。预测误差对比,采用MSE、平均绝对误差(Mean Absolute Error,MAE)、均方根误差(Root Mean Square Error,RMSE)等指标进行评价,如表1所示。式中:ai—实际值;pi—预测值。

表1 预测误差对比Tab.1 Estimates Error Comparison

从表1中的误差统计可得,MCNN模型的预测结果相较与传统CNN 模型MSE、MAE、RMSE 误差分别提高了59.1%,38.4%,35.6%,说明MCNN具有更高的预测精度。

5 结论

该研究提出了一种考虑轴承多尺度特征提取的剩余寿命预测方法,以解决因退化特征提取不完备导致剩余寿命预测精度欠佳的问题。该方法通过将轴承全生命周期的振动监测信号输入能进行多尺度特征提取的MCNN模型完成剩余寿命预测。并将所提方法在轴承加速寿命实验标准数据集上进行了算例验证,发现取得了较好的预测精度。

相较于传统的轴承RUL预测方法,该方法简化了依靠人工经验进行特征提取的步骤,使其预测过程更加智能化。且相较传统只考虑单一尺度上特征信息提取的方式,该模型具有更好的泛化能力和预测精度。

猜你喜欢
特征提取尺度轴承
轴承知识
轴承知识
轴承知识
轴承知识
财产的五大尺度和五重应对
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Daubechies(dbN)的飞行器音频特征提取
Bagging RCSP脑电特征提取算法
宇宙的尺度
基于MED和循环域解调的多故障特征提取