基于1D-CNN 联合特征提取的轴承健康监测与故障诊断∗

2021-11-09 02:45朱健成韩光洁毕远国
软件学报 2021年8期
关键词:准确度故障诊断轴承

刘 立 ,朱健成 ,韩光洁 ,毕远国

1(河海大学 信息学部物联网工程学院,江苏 常州 213022)

2(东北大学 计算机科学与工程学院,辽宁 沈阳 110169)

工业物联网是驱动工厂智能化改造与网络协同制造纵深发展的重要技术基础[1,2],由此催生的智能产线已逐步实现柔性化、定制化、自适应的混流制造模式.然而,伴随着不断增长的设备规模、愈发精密的元件和更加多元的机械组合方式,产线设备集群协作的智能化和复杂度不断提高,其运维强度和难度均大幅度增大.对于不同设备可能出现的意外行为模式以及无法用精确数学模型描述的工业流程,传统的机理模型和经验模型将失去对未知工作模式的解释能力[3].随着泛在感知和人工智能的兴起,依靠部署传感器网络捕获关联松散的智能产线信息物理要素,结合基于机器学习的数据驱动模型实现设备运行状态特征提取和故障诊断,体现了巨大的潜力[4−6].

针对特定机械设备运行数据驱动构建的故障诊断模型,仅对该设备的状态具备解释性,不具备泛化能力;而以机械设备为单位建立单独的诊断模型成本极高[7,8].若将目光放在更小但具有代表性的机械元件上,则能大幅度削减诊断模型的建模成本.作为设备运转的关键部件之一,滚动轴承几乎存在于所有机械中,是机械设备中最易损坏、也最能反映机械健康状态的元件.研究表明:在工业物联网大型机械的故障中,轴承缺陷占比达40%;在小型机械故障中,轴承缺陷的占比达90%[9].因此,轴承的运行数据包含大量机械运行状况的信息[10],依靠轴承运行数据构建的故障诊断模型将具备更好的泛化能力[11].

现有数据驱动的轴承故障建模研究在特征信号选择上涵盖了振动、电流、电压、声信号.文献[12]通过融合声信号和振动信号进行轴承的故障检测,实验表明,振动信号比声信号包含更丰富的状态信息.文献[13]使用声发射信号进行故障分类,虽然短时傅里叶变换代替信号处理和特征提取技术减少了数据预处理的时延,但是模型精度受不规则噪音影响严重.文献[14]选择电动机本身的电流信号结合深度卷积神经网络(convolutional neural network,简称CNN)和信息融合技术进行故障的分类,复杂的故障分类过程佐证了电流信号中相关信息的贫乏.上述文献表明了,运用振动信号进行轴承故障检测具有明显优势.具有分类能力的机器学习模型能够通过训练大量特征信号实现故障模式识别.与浅层学习模型相比,深层学习模型具有特征自动学习能力,诊断准确度和鲁棒性更加优越[15−17].作为一种典型的深层学习架构,CNN 将特征提取、特征变换、信息融合、模式识别整合在同一深层结构中.在故障诊断领域,CNN 的应用思路主要分为两个方向.第1 类是将信号转换到频域,由CNN 提取频率特征完成分类.如:Janssen 等人[18]采用了离散傅里叶变换将振动信号变换到频域,并训练带标记样本的CNN 完成齿轮箱故障诊断;Guo 等人[19]将连续小波变换后的结果作为CNN 的输入矩阵来诊断旋转故障,并取得了良好的诊断效果.在此类研究中,CNN 仅作为分类器,优秀的多层特征提取和抽象能力未得到充分利用.第2 类是利用时间序列信号的图像作为CNN 的输入,将故障诊断问题视为图像识别问题.Wen 等人[20]将轴承振动信号图像作为CNN 的输入,诊断准确率在95%以上.Wang 等人[21]对原始信号进行了预处理,用短时傅里叶变换得到时频图,通过CNN 自适应提取时频特征完成诊断.

以上两类研究中,引入的CNN 是以二维矩阵为输入的2D-CNN.然而,机器运行期间产生的振动、压力等状态信号通常是一维向量[22−24].因此,部分学者尝试构建1D-CNN[25]实现故障诊断.例如,Turker 等人[26]测试了电机的电流,并利用1D-CNN 实现实时状态监测和故障诊断;Peng 等人[27]利用1D-CNN 对轮毂轴承的振动信号进行故障诊断,取得了较好的效果.与2D-CNN 相比,1D-CNN 对于一维时间序列信号无需傅里叶变换、小波变换等时频变化处理,而是直接输入原始的时间序列信号,避免了因时频变换导致的特征丢失或失真[28].

尽管1D-CNN 能通过数据驱动的方式良好分类轴承工况,但是作为一种深层学习模型,1D-CNN 需要大幅度降低硬件设施的存储计算负担、加速模型训练进程,以适应时延敏感的工业故障诊断应用.因此,本文以一维卷积神经网络为架构对轴承振动状态进行健康监测和故障诊断.为缩减训练时延、去除故障信息重叠的冗余信号区域,所提算法对轴承不同工况下产生的原始振动信号进行裁剪,将裁剪获得的信号区域作为特征学习空间,并行输入1D-CNN 中以提取各工况下的代表性特征,并优先针对健康状态选择代表性特征构造健康状态判别模型.对检测为非健康状态的原始信号,令其与各故障信号裁剪获得的代表性特征通过自动编码器进行耦合,学习特征间的相关性和完整性后,进入softmax 层对故障进行具体分类.

本文第1 节介绍1D-CNN 模型的理论基础.第2 节介绍基于1D-CNN 联合特征提取的健康状态监测与故障诊断算法.第3 节设计实验综合验证方案的有效性.第4 节对本文工作进行总结并提出未来研究方向.

1 一维卷积神经网络

如图1 所示为具有l层的1D-CNN 的网络架构.输入信号自输入层进入卷积层后,通过卷积层中的一维卷积核对输入信号的局部区域卷积实现特征提取,不同的卷积核可从在输入中提取不同的特征信号.对于第(l−2)层卷积层,其输出可以表示为

其中,k表示卷积核,j表示卷积核数量,M表示输入xl−1的通道数,b表示与内核对应的偏置,f表示激活函数,*表示卷积算子.

Fig.1 One-dimensional convolution neural networks图1 一维卷积神经网络

经卷积层提取的特征信号随后进入池化层实现特征降维,简化网络计算复杂度.若最后一个池化层是第(l−1)层,其输出作为输入传递给全连接层,在全连接层产生的输出结果为

其中,w表示权重,b表示偏置.最终,全连接层连接softmax 层进行分类操作.

输出层的结果与预期结果的误差反向回传网络,依次得到全连接层、池层和卷积层的误差.通过计算误差梯度更新权值和阈值,直至满足误差允许条件完成训练.输入向量a在输出层的均方误差所示如下:

增量误差可采用梯度下降法更新每个神经元的权重与偏置,增量误差用于更新该神经元的偏差和连接到该神经元的上一层神经元的所有权重,其定义如下:

随后从全连接层到池化层的执行反向传播:

其中,rev(⋅)表示反转数组,conv1Dz(⋅)表示完全卷积.

传统的深度学习模型对样本数量的要求极高,而1D-CNN 可在样本有限的条件下完成模型训练;其次,对比需要经时频域转换或者参量计算从而在振动信号中学习故障信息的方法,1D-CNN 无需手工特征提取、特征选择以及快速傅里叶变换或离散小波变换等任何预定转换即可开始模型训练;最后,1D-CNN 紧凑的架构配置仅执行1D 卷积,其经济高效的特性以及简单的硬件实现适合于实时故障检测和监视.因此,本文以1D-CNN 为基础架构,构建轴承的健康状态判别模型和故障诊断模型.

2 1D-CNN 联合特征提取的轴承故障在线监测方案

2.1 原始振动信号分区裁剪

传统方案在轴承故障诊断模型训练的过程中令健康态和各故障态组成完整的工况特征集合U={Wh,Wr,Wo,Wb},通过训练各工况下的故障特征,直接判断出轴承所处的具体状态.其中,Wh,Wr,Wo,Wb分别表示健康状态、内圈故障、外圈故障和滚珠故障的对应特征.

本文考虑健康状态作为实际工厂运作时的常态,不应当与小概率出现的工况(内圈故障、外圈故障和滚珠故障)属于同一优先级,而应属于先后关系,因此优先监测健康状态,当出现故障时再进行故障诊断.所以首先将工况集合中的元素归纳为健康态和非健康态,即其中从而对轴承健康状态优先做出判断,避免对故障重叠等冗余信息的处理.记轴承的旋转速度为v,轴承旋转一轮所需的时间为单位周期,在单位周期内对产生的振动信号进行采样,采样频率为fs,将单位周期内获得的采样点作为样本,样本规模n=fs/v.如图2 所示.

Fig.2 Health monitoring and fault diagnosis based on 1D-CNN joint feature extraction图2 基于1D-CNN 联合特征提取的健康监测与故障诊断

在振动信号分区裁剪阶段,将单位周期内的振动信号进一步拆分成若干信号区间,选择j个单位周期的采样数据,并将其矩阵化表示为

其中,i表示区间序号.矩阵的每一行是由i个区间组成的一个样本,每一列代表一类信号区间,每个元素的组成如下所示:

2.2 基于1D-CNN并行训练的特征域筛选

1D-CNN 能够直接学习原始信号中的相关信息,使得伪特征具备该工况对应的部分特性.在图2 所示的特征域筛选阶段,通过1D-CNN 并行训练所有工况下的每类伪特征,从中筛选出能准确反映特定工况(健康状态、外圈故障、内圈故障、滚珠故障)的伪特征组,构建该工况下状态检测模型的特征域.过小的振动信号采样数值会增加1D-CNN 学习过程中的计算难度,为了避免此类问题,将每个伪特征进行单独归一化处理.对于任意一个伪特征的归一化方式如下:

其中,xi代表进行归一化的采样数据,max 和min 表示进行归一化的伪特征中最大和最小的值.每个伪特征归一化后,能保证并行训练时具有相仿的时延;其次,相同维度的数据给予每个伪特征一样的贡献能力,在筛选阶段提供可靠的敏感度评判结果.使用1D-CNN 筛选伪特征的过程本质上是在单位周期内的振动信号上进行的数据裁剪,丢弃不具代表性的伪特征,从根本上降低所需处理的数据量.

通过1D-CNN 的并行训练,得到每个伪特征对应于每个状态(健康状态、内圈损坏、外圈损坏、滚珠故障)的分类准确度,作为能够准确反映各状态的敏感度.

首先筛选出对于诊断健康状态具有高分类准确率的伪特征:

Ph(Ci)为第i个伪特征对于判断轴承健康状态的准确度;Thresholdh是人为设置的用于判断伪特征在健康判别时是否具有代表性的阈值;nh为筛选出的伪特征数量,筛选的数量应当不超过总数的2/3,以免过分增加在线监测的时延和硬件负担;Fh为健康状态的特征域.如图3 所示,本文将筛选出的伪特征进行联合特征的提取,即特征域中的元素拼接形成子样本输入1D-CNN 学习,训练后的模型用于判断轴承是否处于健康状态.

Fig.3 Online health monitoring based on feature domain splicing图3 基于特征域拼接的健康状态在线监测

已有文献表明:轴承健康状态的诊断所需要的数据量极少,大多数模型针对的问题是如何实现对轴承4 种工作状态的准确分类.在实际工业背景下,优先发现故障比花费大量时间直接分类故障更具有实际意义.

考虑到轴承故障已知且种类较少,本文采用为不同故障选取伪特征的方式降低需要处理的数据量.针对故障选出的伪特征组成的特征域涵盖大量该故障的相关信息,不易造成故障种类混淆,能够提高判断的准确度.使用公式(14)~公式(16)筛选出对于不同故障状态下具有高分类准确率的伪特征:

其中,Pr(Ci)是第i个伪特征对于判断内圈故障的准确度,类似地,Po(Ci)和Pb(Ci)分别表示第i个伪特征对于判断外圈故障和滚珠故障的准确度,Thresholdf是人为设置的阈值,Fr,Fo和Fb是分别针对内圈故障、外圈故障、滚珠故障所选择的伪特征组成的特征域.为故障筛选伪特征是为了筛选出包含特定故障种类相关信息最多的伪特征,而非直接用于分类故障.并行式1D-CNN 筛选伪特征构造的健康状态判别模型具有低时延、低复杂度、强泛化能力的特点,而为故障分类筛选出的伪特征所包含的信息比全局学习得到的特征更具针对性,也意味着多个故障信息重叠易造成混淆判断的区域会被舍弃.

2.3 基于联合特征提取的故障诊断

对实时收集的振动信号优先采集健康状态特征域,并在训练完成的健康状态判别模型中对其进行判别,确定轴承的健康状态,对表现出非健康状态的数据重新采样,使用耦合自动编码器的softmax 层对其进行分类,得出确切的故障类型.

由于当前筛选出的针对3 种故障的3 个特征域本质上是轴承旋转一周所得采样点中富含特定工况信息的段落集合,虽然包含大量特定工况的信息,但是缺少关联性和完整性.如果效仿健康状态判别模型将特征域内的元素连接成一维数组形成新的子样本并通过1D-CNN 学习,则无法达到良好的故障分类效果.综合考虑裁剪周期后数据不完整、缺少相关性的特点,将筛选出来的伪特征组与原始信号通过自动编码器做联合特征处理后对具体故障进行识别.

首先对原始信号采样数据的矩阵进行全局归一化,数学表达式如下:

p是以周期为行、以样本数为列的原始信号数据集,表示矩阵中第i行、第j列的数据点表示第j列的二范数.上述公式表示每一列的每一个数据点除以该列的二范数.

随后归一化每个样本的特征:

耦合自动编码器期望得到一种稀疏且特征间依然具有相关性的原始信号数据集,用来弥补被挑选出来的伪特征间缺失的相关性和裁剪掉的信息所包含的相关信息.因此,本文采用两个自动编码器进行两组数据间的特征耦合,即:将两个数据集通过编码器和解码器进行重构,通过重构误差和相关性度量组成的损失函数实现高准确度的故障分类.自动编码器的编码解码如下:

其中,fs为特征提取函数,即编码器;hi是Ci编码的表示;gs函数映射回输入空间;s是编码器与解码器的权重和偏置的集合{W,b,W′,d}.

自动编码器在训练过程中减小重构误差:

L(⋅)表示重构函数.

通常情况下,使用平方误差表示重构误差,训练则使用反向传播,通过梯度下降实现最小化.

Fr,Fo和Fb分别与p进行重构耦合,以外圈故障为例,为重构误差增加相关性度量项,相关性度量定义如下:

由于两数据集同源,两个自动编码器的耦合能够很快捕获两者间的相似性,弥补缺失信息.fa与fo分别是数据集p和Fo的映射函数,Ca和Co是输入的数据,Sa和So是权重和偏置的集合,所以更新损失函数为

其中,μi是控制重构误差和相似性度量的参数且训练过程依旧由反向传播和梯度下降进行,在模型最后加入softmax 层进行分类.本文针对两个同源数据集开展特征耦合:一类数据剔除了采样周期内受噪声影响,包含故障重叠信息的部分,保留特定工况信息最丰富的区域;一类具有强相关性、稀疏性,通过自动编码器耦合之后能够发挥出两类数据的优势,故障分类的准确度优于其中的任何一类数据.本文所提基于1D-CNN 联合特征提取的轴承健康监测与故障诊断算法伪代码如下.

3 实验仿真与性能评估

3.1 参数设置

实验采用凯斯西储大学(Case Western Reserve University)轴承数据中心提供的轴承数据进行实验,数据以12 000 个采样点每秒从机械的加速度计上收集,采样点/圈数=采样频率×60/旋转速度=12000×60/1797=400,因此固定单位周期的振动信号长度为400 个采样点,即每个样本由400 个采样点组成.轴承健康状态及不同故障状态各选取1 000 个样本,训练与测试所用数据比例为9:1.实验所用1D-CNN 的激活函数为Relu,而网络层数包括5 层卷积、5 层池化以及2 层完全连接层,卷积核大小为10,数量分别是27,27,27,36,36.

如图4(a)~图4(d)所示为轴承正常运转、内圈故障、外圈故障、滚珠故障下产生的一个样本长度的振动信号时域波形图.

Fig.4 Vibration signal under four working conditions per cycle图4 4 种工况下单位周期长度的振动信号

4 种工况单位周期长度的振动信号图表明,不同信号区间包含不同的相关信息.依据本文提出的方案对每个样本进行裁剪,将每个样本平均裁剪成10 个信号区间,每个信号区间中的采样点集合作为一个伪特征,可获得数据矩阵:

3.2 健康诊断和联合特征故障模式识别

将数据矩阵中每一列分别作为一个样本集,并行地进入1D-CNN 中训练,图5 为分别使用10 个伪特征(分别记为PF1,PF2,..,PF10)诊断健康状态、滚珠故障、内圈故障、外圈故障的准确度.

Fig.5 Diagnosis accuracy of different bearing states using 10 pseudo-features图5 使用10 个伪特征诊断不同轴承状态的准确度

如图所示,使用不同伪特征判断4 种工况的准确度是具有差异性的,即单位周期长度的样本内每个信号区间所包含的相关信息差异很大,主要原因在于:(1) 部分信号区间包含大量的混淆信息,往往是造成传统方法中错误分类故障的原因;(2) 一些区域对于工况信息不敏感,特定工况的相关信息少.而诊断健康状态的准确度比诊断其他故障的准确度明显要高,因为健康状态的信号在某些区域与故障的信号有明显差异,便于分辨出数据是否健康.因此,可以将针对健康状态的阈值设置在较高水平,Thresholdh=0.95,随后针对故障的分类结果设置阈值.图5 中结果表明:仅靠一小部分区域来分类故障很难达到令人满意的结果,但是分类的准确度可以提供每个区域对于判断特定工况的敏感性.因此,设置故障准确度阈值时不必太高,本文设置Thresholdf=0.85.

在实验过程中,存在不同伪特征判断的准确度普遍不高或准确度区分性不明显的情况.可通过适当减少每个样本切割出的伪特征数量,增加切割出的伪特征即信号区间长度,或切割时不从信号初始点位开始切割,使每个伪特征包含最多且最具针对性的轴承工况的相关信息.

基于特征域拼接的健康状态检测有效性的实验结果如图6 所示,根据阈值筛选出针对健康状态的伪特征组成特征域Fh=[Ch,1,Ch,3,Ch,5],将选择出的特征域中元素拼接成子样本进入1D-CNN 训练健康状态判别模型.本实验将3 个伪特征分别诊断健康状态的准确度与使用特征域拼接构建子样本进行诊断健康状态的准确度以及传统一维卷积诊断健康状态的准确度进行了比较,结果如图6 所示.3 个元素连接形成的子样本因为包含最多的健康状态相关信息,比3 个伪特征单独分类的结果具有更高的准确度,证明了伪特征连接成子样本的有效性.

Fig.6 Experimental analysis of the validity of health status detection based on feature domain splicing图6 基于特征域拼接的健康状态检测有效性实验分析

图7 所示分别是:1) TR1D-CNN:传统一维卷积健康状态判别模型;2) CFC1D-CNN:健康状态的特征域中元素连接成子样本通过1D-CNN 构建健康状态判别模型分别诊断相同数量的信号所需的时延.如图所示,随着样本数量的增加,本文的健康状态判别模型因为只对每个样本特征域所在区域进行处理,所以实际处理的数据量远小于传统的1D-CNN.传统的1D-CNN 模型本身因为能够直接学习原始信号而具有低时延特点,本文在此基础上进一步降低了训练时延,兼顾了工业场景下对诊断精度与诊断时延的服务质量要求.

图8 所示分别是:1) TR1D-CNN:基于传统一维卷积的轴承故障诊断模型;2) CFC1D-CNN:故障的特征域中元素连接成子样本通过1D-CNN 构建的故障诊断模型;3) CFJ1D-CNN:故障特征域中每个伪特征的故障分类结果以投票方式进行决策级融合构建的故障诊断模型;4) CFCAE:本文所提的特征域与原始信号做联合特征,最后在softmax 中进行分类构建的故障诊断模型.TR1D-CNN 因为数据包含冗余和故障信息重叠的部分,在准确度上并不突出.而CFC1D-CNN 和CFJ1D-CNN 虽然都比各自特征域中任意一个伪特征故障分类的准确度高,但是提升的准确度很有限,而由于处理的数据量最少,在时延方面占优.最后,CFCAE 因只联合同源数据,不会显著提升时延,其次,耦合的过程对于数据完整性和相关性的弥补大大提高了故障分类的准确度.

Fig.7 Time delay comparison of different health discrimination models图7 不同健康状态判别模型的时延对比

Fig.8 Comparison of diagnosis accuracy of different fault diagnosis models图8 不同故障诊断模型的诊断精度对比

4 总结

基于价值驱动的工业故障诊断应当是时延与准确度拉锯平衡下的技术,及时发现故障避免灾难性损失,再进行精准的故障模式识别,能对当前工业生产产生实际价值.本文提出了一种基于1D-CNN 联合特征提取的轴承健康监测与故障诊断算法,该算法优先通过健康状态特征域组成的子样本训练1D-CNN 模型,高效、准确地发现故障,随后使用故障的特征域和原始信号耦合模型进行故障的模式识别.实验结果表明:本文在追求分类故障准确度的同时,降低了分类延迟,且模型的存储和计算复杂度弱化了对基础硬件设施的承载能力要求.在未来的工作中,我们将在本文提出的算法基础上对轴承复合故障诊断进行研究,分析并发故障对轴承运转数据变化规律的影响,消除由单故障和复合故障共存引起的诊断歧义.

猜你喜欢
准确度故障诊断轴承
轴承知识
轴承知识
基于包络解调原理的低转速滚动轴承故障诊断
轴承知识
轴承知识
Phosphatidylinositol-3,4,5-trisphosphate dependent Rac exchange factor 1 is a diagnostic and prognostic biomarker for hepatocellular carcinoma
幕墙用挂件安装准确度控制技术
数控机床电气系统的故障诊断与维修
动态汽车衡准确度等级的现实意义
因果图定性分析法及其在故障诊断中的应用