基于CNN特征提取及模型融合的飞机液压系统故障诊断

2020-10-21 11:36李时奇赵东标申珂楠丰嬴政

机械制造与自动化 2020年5期

李时奇，赵东标，申珂楠，丰嬴政

(南京航空航天大学机电学院,江苏南京 210016)

0 引言

智能故障诊断是未来飞机液压系统故障诊断发展的趋势之一[1-2]。国内通常采用小波包分解或者信息熵等方法对复杂的液压系统压力信号进行特征提取,然后输入BP神经网络或者支持向量机等学习器进行故障诊断分类[3-5]。这些特征提取的方法对人的经验要求比较高：不具备通用性；对于多传感器压力信号难以有效融合；单一模型有较大过拟合风险。

针对上述问题，提出了一种卷积神经网络(CNN)特征提取加多模型融合的故障诊断方法。使用一维多通道CNN可以直接接收多传感器一维压力时间序列，从而实现多传感器融合。选取少量数据对CNN进行有监督训练提取特征。再用提取出的特征训练如线性多分类、决策树、支持向量分类、k邻近等学习器分别对其进行故障诊断。最后使用Stacking技术对这些模型进行融合。使用Amesim软件对典型飞机液压系统建模并进行故障仿真，验证了算法效果。结果表明，本文算法在准确率和训练用时上更优。

1 算法理论介绍

1.1 一维多通道CNN

由于飞机液压系统的压力信号是一维时间序列曲线，而且不同位置的多个传感器可以采集多条曲线,为同时将多个传感器的一维时间序列输入CNN，采用一维多通道CNN。网络中的所有卷积层、池化层均使用一维结构。

设Hl为第l层的输入特征图，S为卷积操作的结果,Hl+1为卷积层的输出特征图，K为卷积核，i代表特征图上的索引，p代表卷积核上索引，c为通道的索引，Hl(∶，c)为通道c的特征图，b为偏移量,f(x)为激活函数,则一维多通道卷积公式如下[6]：

S(i)=∑c∑pHl(i+p,c)K(p)

(1)

Hl+1=f(S+b)

(2)

池化操作分为最大池化和均值池化。设第l层为池化层，k为池化窗口的大小,p代表池化窗口上的索引。最大池化和均值池化操作公式分别为式(3)和式(4):

(3)

(4)

1.2 线性多分类器

对数几率回归(logistic regression, LR)是一种用线性回归模型的预测结果去逼近真实标记的对数几率，虽然名字是“回归”，实际上是一种分类算法。设x为输入向量，y为输出标记，w和b为待学习的权重和偏置。公式如下：

(5)

当y>0.5时预测为正类，y<0.5时预测为反类，y=0.5时可以随机预测。通过OvO(One vs. One)或者OvR(One vs. Rest)等拆分策略可以推广到多分类[7]。

1.3 决策树分类器

决策树通过树型结构对样本进行学习。树的节点代表某个属性，该节点下的路径代表属性的不同取值。每个叶节点代表某个类。随机森林(random forest, RF)[8]是多个决策树通过bagging策略集成的, RF能引入随机性，有效减少过拟合。

1.4 支持向量分类器

支持向量机(support vector machine, SVM)通过寻找一个超平面划分两类样本，离超平面最近的几个训练样本称为“支持向量”，两个不同类别的支持向量到超平面距离和称为“间隔”，支持向量机算法试图找到间隔最大的超平面来划分不同类[9]。SVM同样可以使用拆分策略推广到多分类。

1.5 k邻域分类器

k邻近算法(k- nearest neighbor,KNN)的训练过程就是保存训练集所有数据。当新的样本输入时，计算训练集中距离它最近的k个样本，根据这k个样本的类别来决定新样本的类别[10]。

2 算法流程

图1为算法流程示意图。首先对典型飞机液压系统进行Amesim建模,通过改变某些部件参数来模拟飞机液压系统的常见故障。采集不同故障状态以及正常状态的压力信号，进行归一化处理并通过划窗重采样进行数据集增强。将训练集分为A和B两个子集。用A集数据对CNN进行有监督训练。再将数据集B输入训练好的CNN，提取中间层的特征，将中间提取出的特征输入其他学习器进行训练。之后将多个学习器的结果用Stacking融合技术融合。最后将测试集输入训练好的模型，验证算法效果。

图1 算法流程示意图

2.1 CNN特征提取

CNN各个层的结构如表1所示。CNN可以接受一维多通道数据，可将不同飞机液压系统中不同传感器获取到的一维压力时间序列输入CNN。表中filter指卷积核(又叫滤波器)或者池化滤波器。filter大小1100指窗口大小为100的卷积核在特征图上滑动，步长指的是filter在特征图上滑动步长。

表1 CNN各层参数

用A集监督训练CNN，目的是让CNN的每一层获得不错的权重从而使网络具备提取抽象特征能力。将B集输入到训练好的网络，提取全连接层2尺寸为128的特征。此时向量的总数据维度从1 800降到了128，此时的特征已经过滤掉一些无效信息并提取到有用的抽象特征，能极大地加快训练速度，简化训练难度，提高训练准确率。

2.2 Stacking模型融合技术

Stacking模型融合技术[11]是一种两级的模型融合技术，将初级学习器学习到的分类结果作为次级学习器的输入，再进行一次学习。

Stacking模型融合技术示意图如图2、图3所示。首先需要每个学习器使用k折交叉验证(图中k=5)。将原训练集分为k折，用k-1折训练,预测剩下的1折，预测结果作为次级学习器的输入，重复k次，每次用不同的折划分。对于测试集，将k次的结果取平均值。用不同初级学习器重复相同操作，最终次级学习器的输入特征为n个初级学习器的预测结果(图中n=4)。用次级学习器对新生成的训练集进行训练，预测新测试集，得到最终结果。

图2 Stacking融合每个学习器训练步骤

图3 Stacking融合多学习器融合步骤

由于不同学习器的学习原理有所差异，通过融合可以互相弥补不足，提高总准确率的同时减少过拟合的风险。

3 算例分析

3.1 飞机液压系统故障仿真及数据生成

图4为典型飞机液压系统Amesim模型。为简化模型，只保留液压系统核心部件以及一个用于故障诊断的作动器，其余作动器均用“液压用户”代替。

图4 典型飞机液压系统 Amesim模型

表2为Amesim模型中各元件参数以及含义[12]。

表2 飞机液压系统Amesim模型参数

系统故障模拟方法如下：通过在泵两端并联溢流阀模拟泵泄漏；改变油滤等效孔径参数模拟油滤堵塞；改变液压油中气体含量模拟液压油污染；用伺服阀和作动器直接串联溢流阀模拟伺服阀堵塞；改变作动器内泄漏参数模拟作动器内泄漏。5种故障状况加上正常情况共6种类别，类别标号和类别编码如表3所示。

表3 故障类别表

取仿真时长为18s，提取图4中A、B、C 3处的压力信号进行故障诊断。设采样周期为0.01s，取长度为6s的曲线用于故障诊断。将6s的窗口在18s的曲线上滑动取点来增强数据集。通过在正常或者故障范围内微调参数多次仿真可以增加数据量。最终每个样本含3条(A、B、C 3个位置)6s的曲线，即原始输入特征的尺寸为16003。

图5为液压油污染情况以及正常情况下泵出口压力曲线对比图。由图可知液压油气体含量上升导致的污染会使压力曲线滞后。