基于机器学习的故障诊断方法研究

2021-07-10 11:13王加昌王媛美郑丹晨

科技视界 2021年17期

王加昌唐雷王媛美郑丹晨赵欣

（中国核动力研究设计院核反应堆系统设计技术重点实验室，四川成都610213）

0 引言

随着新工业革命时代的开启，物联网、工业互联网、人工智能等技术成为舞台上最受瞩目的新星。在这些新兴技术的推动下，工业领域中的大数据环境正在逐渐形成，数据从制造过程中的副产品转变成为备受企业关注的战略资源。然而，如何利用这些大数据更好地为企业生产经营服务仍然处于探索阶段。一个比较明确且有前途的方向是将大数据应用到高精密生产设备的智能维保中。这个概念最早是由美国提出的。早在2003年，美国国防部为了减少战斗机的高额维保费用，提升设备的完好率和任务成功率，在其联合战斗机计划中提出了故障预测与健康管理（Prognostics Health Management，PHM）的概念。PHM指在通过传感器监测设备运行的各项参数，通过大数据分析故障发生的周期、区域和类型，并以此为基础预测设备的剩余使用寿命，从而制定积极主动的设备维护保障措施[1]。鉴于PHM的有效性，美国航空航天局随后跟进了PHM技术，将其应用到飞行器以及卫星电池的维护保障中，并组织成立了PHM学会向工业界推广PHM技术。

故障诊断是PHM的核心功能之一，其目标是基于大数据分析技术诊断设备的故障类型。在过去，故障诊断大多靠人工检查设备的健康状态，增加了人工强度，并且诊断准确率不高。高级的信号处理方法可以帮助确认设备在何处发生故障以及发送故障的类别。然而，这些方法都极大地依靠专业知识。此外，通过信号处理手段得到的数据对于设备的使用和维护人员来说过于专业，通常难以理解。因此，基于传感器数据的智能故障诊断方法已经逐渐取代传统人工方法成为设备故障诊断的主流方法。这类数据驱动的方法优势是自动识别设备的故障类型，具有良好的扩展性，不再依赖领域专家的经验。

早期数据驱动的设备故障诊断方法主要采用浅层结构的机器学习模型来进行诊断，例如，人工神经网络、支持向量机等。随着深度神经网络的飞速发展，自编码器、受限玻尔兹曼机、卷积神经网络、残差网络等深度学习模型也被应用到故障诊断中，并取得了优异的诊断性能[2]。本文对目前最新的故障诊断方法展开研究，归纳基于机器学习的故障诊断方法的基本流程，介绍了用于故障诊断的4种机器学习模型，最后，对未来的研究趋势进行了展望。

2 故障诊断问题及建模的基本流程

基于机器学习的故障诊断方法通常被建模为一个有监督的多分类问题，如图1所示。方法分为两个阶段。在训练阶段，将有标记的训练样本输入机器学习模型，判断当前设备所处的故障类型，通过最小化模型分类错误来优化模型参数，从而得到最优的故障诊断模型。在诊断阶段，将不带标记的样本输入到故障诊断模型，计算当前设备的故障类型。其中的关键点主要集中在两个方面：第一个关键点是如何构造样本，即设备的哪些状态参数作为样本特征；第二个关键点是如何设计机器学习模型的结构，以取得最准确的分类结果。

图1 基于机器学习的故障诊断方法的两个阶段

基于有标签样本集建立多分类器的基本流程如图2所示，包括数据收集、特征预处理、建模3个步骤，本节将对其进行简要介绍。首先，是数据收集，主要通过设备中安装的传感器实时采集数据，通常一个设备上会安装多个传感器，采集振动信号、声发射信号、温度和电流值等。其次，是特征预处理，采集到的数据可能是频域数据，也可能是时域数据，或者时频域数据，因此，需要对这些数据进行预处理，以使这些数据适合于机器学习和模型学习。最后是故障诊断模型建模，通常包括模型设计和模型训练两个步骤。

图2 基于机器学习的故障诊断方法的基本流程

3 设备故障诊断模型

早期的设备故障诊断通常依赖于专家的经验知识。例如，一个专业的工程师可以通过不寻常的声音诊断机械的故障，或者通过信号处理技术分析轴承的震动信号来定位轴承的问题。显然，这种依赖人工判断的方法在准确度、扩展性、实时性等方面都存在较大的问题。近年来，随着传感器技术的飞速发展，通过在精密设备上安装传感器来采集设备的实时运行数据成为可能，伴随海量数据集的诞生，利用机器学习模型来建立故障分类器成为目前故障诊断研究的最热门的领域。这类数据驱动的诊断方法能自动根据设备的运行状态数据诊断设备的故障类型，在准确度、扩展性、实时性等方面都比人工方法更有优势。本文介绍4个用于故障诊断的代表性机器学习模型，分别是属于浅层结构的支持向量机和人工神经网络；属于深度神经网络的堆叠自编码器和深度卷积神经网络。

3.1 基于浅层结构的机器学习模型

在传统的浅层机器学习模型中，最主要采用的两种模型是支持向量机[3]和人工神经网络[4]。首先，介绍基于支持向量机的故障诊断模型。支持向量机（Support Vector Machines，SVM）是一种二分类模型，它的基本模型是定义在特征空间上的间隔最大的线性分类器，如图3所示。在线性不可分的情况下，SVM通过非线性变换将输入空间变换到一个高维特征空间，在这个新空间中求解最优线性分类面。由于SVM只能进行二分类，而故障诊断通常是一个多分类问题，因此，需要分别建立多个SVM，再扩展成一个多分类器。目前，已有的扩展策略主要包括：一对多、一对一、决策树、决策导向无环图等。图4展示了采用一对多法进行多分类扩展的结构示意图。假设训练样本中包括K类故障状态，因此，需要构造K个二分类的SVM，每个SVM分别以一类故障样本作为正样本，其余所有样本为负样本进行训练。采用SVM的优势在于通过最小化结构风险来进行模型参数训练，理论严谨有助于提高模型的可解释性。其次，SVM的优化目标解决方法是凸二次优化算法，因此，诊断模型可以很容易地获得全局最优解，进而获得较高的诊断准确度。SVM方法的缺点在于其分类性能严重依赖于对核函数的选择，不适合的核函数会导致分类性能急剧下降。此外，在SVM中很难利用传感器采集的时序数据，然而某些特征值的时序变化对于故障分类是非常有价值的。

图3 SVM分类原理

图4 扩展的SVM多分类器

另一种在故障诊断中代表性的机器学习模型是人工神经网络(Artificial Neural Network，ANN)，其结构图如图5所示。它包括1个输入层，1个包含若干神经元的隐藏层和1个最终的输出层，输出层的神经元个数为机器故障的类型数，每个输出节点输出的是输入样本对应每种故障类型的概率。ANN通过模仿人类的神经网络行为来实现多分类任务。这种网络依靠系统的复杂程度，通过调整内部大量节点之间相互连接的关系，从而实现对高阶特征隐含信息的挖掘，具有自动学习和总结的能力。传统的人工神经网络通常只包含1个隐藏层，因此模型参数训练可以采用BP算法完成。与SVM类似，ANN的主要缺点在于不能处理时序的设备状态数据，而只包含1个隐藏层，导致对高阶特征组合的挖掘能力有限。

图5 基于ANN的多分类器

3.2 基于深度神经网络的方法

随着深度神经网络在自然语言处理和图像识别方面取得巨大成功。深度神经网络也被引入设备故障的智能诊断中。目前，主要的深度神经网络包括堆叠自编码器（Stacked Auto-Encoder，SAE）、深度信念网络（Deep Belief Network，DBN）、深度卷积神经网络（Deep Convolution Neural Network，DCNN）、残差网络（Residual network，ResNet）等。本文选择其中两种代表性的模型进行介绍。图6展示了堆叠自编码器[2]用于建立故障分类器的结构图。如图6所示，它通常包含了多个自编码器，每个自编码器生成的隐向量将作为下一个自编码器的输入，最后一个自编码器的隐向量输入到一个softmax分类器中进行分类，通过最小化分类误差来优化模型参数。深度卷积神经网络[5]一种局部连接和权重共享的深度前馈神经网络。典型深度卷积神经网络的结构如图7所示。它包括若干卷积层和池化层，最后通过一个softmax函数来完成故障分类。

图6 基于SAE的故障诊断模型结构

图7 基于DCNN的故障诊断模型结构

4 未来的研究趋势

本文对基于机器学习的故障诊断模型展开了研究，描述了建模的基本流程和几种典型的用于故障诊断的机器学习模型。虽然这类数据驱动方法展示出了令人满意的结果，但是作为新一代的主流故障诊断方法仍然存在一些重大的挑战。本节从这些挑战出发阐述该领域未来的研究趋势。

第一个挑战是来自传感器数据本身，机器学习的基础是构建大规模的高质量数据集，然而在工业场景是多种多样的，采集到的数据很可能存在缺失、噪声干扰导致的异常等问题，如何辨别出异常数据，进行有效清洗，从而提升数据质量将是一个有价值的研究方向。此外，通过传感器采集的数据虽然很多，但其中绝大多数都是设备正常运行的数据，只有在设备发生故障之前的一段时间采集的数据才对故障诊断模型训练真正有用。因此，实际构建训练样本集时，可用样本数量其实是非常稀少的，从而导致模型学习不充分。目前，比较有前途的解决方法是利用迁移学习技术来增加有效样本数量。

第二个挑战是对采集数据进行手动和自动的特征工程。因为设备上采集的实时传感器数据是多种多样的，并不是每个特征数据都与故障诊断有关，将无关特征数据作为样本特征值输入到模型可能会降低模型的分类性能。为此，通常基于人工对采集的数据进行特征选择和组合，而手动特征工程通常缺少扩展性，而且也严重依赖领域专家的分析。目前，一个比较有前途的方向是采用简单且可解释的机器学习模型对数据集进行预训练，从而自动分析出哪些特征和特征组合对于故障分类是有切实帮助的。

第三个挑战是对故障分类模型的设计，在现实中，技术更成熟、采用更多的是浅层结构的机器学习，例如，支持向量机和人工神经网络等。然而目前一些最新研究指出深度神经网络对于挖掘复杂特征组合之间的隐含携带信息更为有效。未来进一步确认这些深度神经网络在故障诊断方面的性能，以及结合传统模型和深度学习模型来进行故障诊断可能也是非常有前景的研究方向。此外，深度神经网络往往缺乏可解释性，因此，如何结合物理模型来解释利用深度神经网络挖掘到的一些关键组合特征信息也是非常有意义的一件事情。

第四个挑战是建立不同应用场景下的不同设备故障诊断基准数据集和基准模型，也是对进一步推进机器学习模型在故障诊断中的研究以及落地应用有非常积极的作用。NASA和PHM协会已经开放了若干故障诊断数据集供相关研究者研究，目前，我国在这方面还处于起步阶段，虽然也公开了一些数据集，例如，2017年中国工业大数据创新竞赛提供风机故障数据，但是在影响力和研究广度方面与NASA和PHM的数据集仍有较大的差距。

除了上述技术方面的挑战，目前阻碍故障诊断研究进展的主要困难其实是跨领域人才的缺乏。先进工业企业可能有大量有经验的设备专家，但是这些专家通常不具备大数据分析的能力，而专业的数据分析人才又可能对机械设备的物理模型、运转原理缺乏理解。因此，培养复合型人才或者加强两者的紧密合作，将会极大地促进设备故障诊断方法的研究工作。