基于发参数据的发动机泵调系统的健康监测

2022-02-25 01:47杨天林烨2徐占艳2白舒雯2赵永平
测控技术 2022年1期
关键词:基线聚类样本

杨天林, 朱 烨2, 徐占艳2, 白舒雯2, 吴 奂, 赵永平

(1.南京航空航天大学 能源与动力学院,江苏 南京 210016; 2.中国航发控制系统研究所,江苏 无锡 214063)

航空发动机作为一种复杂的气动热力学系统[1],监控其工作状态和性能参数变化趋势,及时有效地规避故障,对于保证和提高发动机工作的安全性和可靠性有着重要意义。发动机数据是规避故障的基础,然而随着系统可靠性的逐渐提高,发动机故障数据在较短时间内难以获得,故传统针对故障数据的监测方法不再适用。同时,数据库、传感器技术、数据采集方法等的应用为发动机健康监测提供了大量的发动机状态数据,基于该状态数据对发动机各个部件及其故障进行可靠性分析和监测已成为趋势[2]。

飞机发动机的泵调系统是数控系统的组成部分之一,也是故障频发的部件之一,其中泵调包括油源部件、电液转换装置、燃油切断模块、保护模块、监控模块等。国内针对发动机泵调系统故障研究相对较少,针对发动机整机及其他部附件的研究较多,这些研究取得的成果对泵调系统的健康监测有一定的参考价值。如陶立权等[3]针对航空发动机传感器故障检测方法的适用范围缺乏量化数据问题,对基于卡尔曼滤波器和基于自适应滑模观测器的故障检测方法适用性进行了对比分析,但是所采用方法的故障检测率较低。王天义[4]对燃油系统典型故障进行了特征分析,并提供了处理这些故障的应急措施,但缺少相应的故障检测算法。崔建国等[5]通过提出的小波包能量比与极限学习机相结合的方法对航空发动机燃油泵进行故障诊断,以振动传感器感知发动机附件机匣的振动信号为分析对象,证明了该方法的有效性。以上研究均未涉及到基于泵调系统特征数据的健康监测算法,故对于泵调系统的健康监测没有一定的针对性。

由于泵调系统没有实现自动监控,因此在航线上常发生突发故障,目前航空公司关于泵调系统的维修主要是利用可视化工具对泵调系统性能参数可视化,技术人员观察并分析参数变化曲线,依据经验确定范围边界或阈值,一旦数据超限则停下来维修[6]。这种事后维修,无法有效地健康监测甚至故障预测。综上所述,本文选择发动机泵调系统作为研究对象,对泵调系统的健康监测方法进行研究。第1节分析了发动机泵调系统非参数化模型的建立方法,引出马氏距离技术的优越性;第2节从原理和影响因素两方面对马氏距离技术进行阐述;第3、4两节分别介绍了预警阈值确定方法和健康监测聚类算法;最后在第5节具体介绍了2、3、4节中的方法在泵调系统健康监测中的实际应用和实践结果,最终得出结论。

1 发动机泵调系统非参数化模型建立

一般基于数据挖掘技术所构建的数据模型分为两类:参数化模型与非参数化模型。参数化模型主要是指假设模型由有限组参数限定,已知数据分布的情况下,参数可以捕获关于数据的全部信息的模型。例如神经网络、支持向量机等算法。非参数化模型则相反,例如多元状态估计等,数据分布不能由一组有限参数限定,参数捕获的关于数据的信息会随着数据的增多而增多。由于基线模型属于非参数化模型,故本文以马氏距离算法作为健康监测算法。马氏距离是由印度统计学家马哈拉诺比斯提出的,它是一种有效的计算两个未知样本集的相似度的方法[7]。马氏距离算法针对非参数化模型建立有以下几个优势:

① 由于泵调系统性能参数较多,且参数之间具有较高的关联性,马氏距离可以很好地处理该问题[6];

② 马氏距离技术是一种数据驱动建模技术[8],不需要了解甚至建立泵调系统的物理模型,省去了高成本的监控软件;

③ 马氏距离技术对训练样本数量的要求不高,且可以利用训练样本自行验证方法的有效性。

为叙述方便,下文中的马氏距离由Mdist替代。

2 Mdist技术介绍

Mdist技术是通过学习发动机泵调系统历史健康监测数据,并且根据相关特征值体系构建参数之间相似数学模型的一种相似性计算技术。针对某一起动序列的飞行数据,与历史样本数据进行比对,得出两者之间的Mdist数值。由于历史样本数据表征系统处于完全健康的状态,故Mdist数值越小,代表与历史样本越相似,即系统越健康;反之,系统则越不健康,甚至是故障。从而达到起动系统健康监测的目的。

2.1 Mdist技术原理

(1) 提取训练样本。

首先需要挑选出系统历史健康状态下的特征值集合,组成训练样本矩阵D,D的每一列代表一类型的特征值,每一行代表一个训练样本,即一次起动试验。假设训练集合中包含N个训练样本,M个特征值。则训练样本矩阵可表示为

D=[X1,X2,…,XM]

(1)

Xj=[x1j,x2j,…,xNj]T, 1≤j≤M

(2)

(2) 建立系统性能参数基线模型。

在训练矩阵D中,一个行向量表示系统在健康状态下的特征值集合。为了使训练矩阵D更具有一般性,应尽量选取表征能力强的特征参数。提取基线模型的方法有很多,如随机森林、主成分分析法、多元状态估计等。由于本文所用的起动过程数据已经进行了去噪、归一化等操作,因此本研究选用均值来计算泵调系统起动过程性能参数基线,即

(3)

(4)

(3) 计算协方差矩阵。

协方差是概率论与数理统计中一个非常重要的概念,主要用来计算两个变量的整体偏差。k和l两个维度样本的协方差为

(5)

式中:n为样本数量。

那么对于实际样本集Dreal,大小为Nreal×M的矩阵,其协方差矩阵S为

(6)

式中:

(7)

(4) 计算实际样本与参数基线之间的相似度,即Mdist。

(8)

式中:dMdist,i为第i次试验样本与参数基线的Mdist,即第i次试验的健康指数,用来表征系统的健康状态,达到健康监测的目的。

2.2 Mdist技术的影响因素

(1) 训练样本选择。

在确定了所需的特征参数之后,由于特征参数是随转速变化的一系列时间序列,采样时间为0.1 s,在起动时间范围内,若选择所有的数据作为样本,不仅会造成计算负荷的指数型增加,而且样本的维数过高,会使得算法计算结果精度较低。因此,本文采用分段线性插值的方法来从飞行历史数据中筛选出合适的样本组成最佳训练样本,该方法能较好地保留原特征参数的变化趋势,同时也降低了样本维度。

分段线性插值拟合法首先就是要对所有时间序列平均划分为K段:

(9)

式中:Lm为时间序列长度;M为所需数据向量维数,在历史记录样本被分为K段后,每一段上的数据用线性差值进行拟合,组成训练样本。插值公式如下:

(10)

式中:xm为所求特征参数对应的转速;x1和x2分别为前一时刻的转速和后一时刻的转速;ym为所求特征参数;y1和y2分别为x1和x2转速所对应的特征参数。

(2) 性能参数标准化。

Mdist技术进行健康监测时,除了样本的选择,性能参数本身的系统偏差也是影响其精度的重要因素。而系统偏差的主要原因在于环境因素的影响,系统在不同的温度、压力下,性能参数的数值会不同。因此选取同一架飞机、同一台泵的主控通道的数据。此外,为了消除异常数据对基线模型的影响,需要对性能参数标准化。目前性能参数标准化比较流行的方法步骤如下:

① 选择起动过程中有利于研究的性能参数,并且按照起动序列一一对应。

② 将性能参数按照起动序列进行绘图,绘制出性能参数变化图(如图1所示),并根据3σ模型在图形中绘出性能参数偏差图(如图2所示),其中绿线代表σ,红线代表3σ。

图1 泵调系统某性能参数数值

图2 某性能参数偏差图

③ 选择超过3σ的起动序列,分析其偏差较大的原因,在不考虑外界环境参数影响的情况下,该参数可以认为已经出现了异常,应当从训练样本中剔除,保留在测试样本中。

3 泵调系统健康监测预警阈值确定方法介绍

通过Mdist系统健康监测技术计算出实际运行样本与基线模型之间的相似度(即健康指数),为了消除随机因素的随机干扰,使健康指数更具代表性,进而使健康监测更准确,本节介绍滑动窗口偏差统计的方法对相似度数值进行处理。

假定在泵调系统某运行时间段内,由Mdist技术计算的样本之间相似度数值(即健康指数数值)序列如下(按照时间排序):

ε=[ε1,ε2,ε3,…,εj,…]

(11)

对健康指数序列取一个宽度为j的滑动窗口,然后对窗口内连续j个值取其平均值:

(12)

设置合理的滑动窗口大小j,使得系统内由于随机因素而产生的随机干扰被消除。基于该方法,系统健康指数的变化趋势不仅可以被准确及时地表征,还能准确地反映系统的健康状态。进而通过经验或资料对健康指数均值设定合理的阈值,一旦健康指数均值超过阈值,便发出警告,达到系统故障提前预警的目的。此外,经过滑动窗口均值化后的健康指数提高了健康监测和预警的可靠性。

接下来根据计算的健康指数均值来设定合理的阈值EAN:

EAN=±k·EN

(13)

式中:EN为发动机泵调系统在完全健康状态下的健康指数均值绝对值的最大值;k为预警阈值系数,可根据实际经验来确定,一般在1~1.2之间。

4 用于离群点检测的K均值聚类算法

由于简单快速的原因,本文采用基于欧氏距离的K均值聚类算法[9]进行发动机泵调系统健康监测。具体算法流程图如图3所示。其中,聚类中心的选择主要有3种方式:① 从样本中随机选取K个对象作为中心;② 根据样本的数据分布范围均匀地随机生成K个中心;③ 初始聚类阶段随机选择10%的样本的子样本。

5 基于Mdist技术的发动机泵调系统健康监测

发动机泵调系统健康监测流程图如图4所示。流程如下:首先,在获取以往发参数据的基础上提取起动过程的相关参数,形成训练样本;继而,对所有特征

图3 K均值聚类算法流程图

图4 发动机泵调系统健康监测流程图

数据进行标准化,筛选出完全健康的样本数据;其次,根据Mdist技术计算泵调系统起动过程性能参数基线模型以及健康指数阈值。当有新的发参数据时,得到新数据的性能参数与基线模型计算求取Mdist值,作为表征泵调系统健康状态的健康指数;采用K均值聚类算法对样本进行聚类,因偏差值异常而被判定为离群点的数据,被划分为故障类,继而对其进行故障预警,否则继续监控。

5.1 发动机泵调系统特征值体系的提取与建立

本文所选型号飞机为双发,故泵调系统包括左泵和右泵。由于故障数据有限,仅对右泵的数据进行分析。首先,从数据库中的数据中筛选出同一型号飞机右泵的主控通道数据。根据判据,处理数据,得到所需的特征值。为研究泵调系统的特性选择两个关系型特征,即油针控制精度与转速、油针位置与转速,进行曲线趋势分析。发动机起动阶段右泵关系型特征参数变化趋势如图5所示(注:油针控制精度与油针位置均为归一化后的量)。

图5 右泵特征参数变化曲线

分析图5(a)曲线,10%转速之前的曲线体现出泵调的一种设计方式,油针控制精度基本不变,在10%转速之后,除较为异常的两条曲线外,油针控制精度控制在0~5%之间,且呈现出A、B两个通道的数据簇。

分析图5(b)曲线,由于发动机转速较低时,热能与机械能的转换效率较低,加速性较差,故在转速10%~30%之间采取固定的供油方式,此后供油量迅速增加,充分提升转速。此外,除了两条异常数据线外,整体呈现出A、B两个通道的数据簇。

综上所述,为了消除通道不同以及异常数据等的影响,应对A、B主控通道分别建立泵调系统参数基线模型,并剔除故障数据或异常数据,筛选出完全健康的起动序列。

5.2 性能参数基线模型的建立与预警阈值的确定

5.2.1 训练样本的选择与构建

按照文中2.2节介绍的选择样本与处理的方法,先对提取的转子转速Ng数据进行划分,以2%转速为间隔记录一次数据,采用分段线性插值的方法分别计算相应转速下的油针位置、油针控制精度等特征值,构成训练样本。训练样本的每行代表一次起动试验,所选的特征参数作为样本的每列。

继而,对所有特征数据进行标准化,选择3σ模型从训练样本中剔除数据异常的样本,得到完全健康的样本数据。经过标准化后泵调系统部分特征变化趋势如图6所示(注:油针控制精度与油针位置均为归一化后的量)。

图6 标准化后右泵特征参数变化曲线

5.2.2 性能参数基线模型的建立

根据维修记录(如表1所示,1号为左泵,2号为右泵),选择出泵调系统完全健康的起动序列;基于3σ模型对泵调系统性能参数完成了标准化。接下来,本文将按照2.1节中建立基线模型的方法,计算泵调系统在飞机起动过程健康状态参数基线。

表1 某型号飞机左右泵的维修记录

本文采取均值的方法,建立参数基线模型,飞机A泵调系统起动过程基线结果如表2所示(篇幅限制仅展示20%转速以内的基线模型数据)。

表2 飞机A右泵A、B主控通道特征参数基线模型

5.2.3 监测预警阈值的确定

在确定监测预警阈值之前,需要计算训练样本与基线之间的Mdist数值,即健康指数。训练样本由完全健康的样本组成,故所计算的健康指数应表征完全健康的泵调系统。

参照文中2.1节Mdist的计算方法,训练样本的健康指数如图7、图8所示。

图7 A主控通道训练样本的健康指数

继而通过滑动窗口的方法来确定泵调系统起动过程健康监测的预警阈值。选择窗口宽度,根据经验选取预警值系数,计算得到健康指数预警阈值。需要指出的是该健康指数预警阈值只适用于基于同一基线模型同一台泵的数据。

5.3 K均值聚类算法在系统健康监测中的应用

当飞机起动过程发生突发故障时,传统的判别故障类型的方法是将起动过程参数可视化,根据维修人员经验进行排故,该方法效率较低,且事后维修起不到健康监测或故障预测的作用。故本文在基线模型的基础上,采用文中第4节介绍的K均值聚类算法对泵调系统的起动过程进行健康监测,同时对3种质心选择方法的聚类结果进行了对比。

算法输入的实际样本数据包含飞机右泵A、B主控通道的所有飞行数据。每一行代表起动序列,每一列代表起动过程特征参数,聚类个数K为2,即故障数据为一类,健康数据为另一类。第4节中介绍的3种质心选择方法的聚类结果以及Silhouette相似度量值如图9所示。

图9中,方法1与方法3的聚类结果相同,故障数据个数均为15;方法2的聚类结果中,故障数据个数为“1”,且该故障数据发生的日期为2019年8月22日。由于实际飞行记录中,只有2019年8月22日当天发生故障,且之前的数据默认为健康数据。因此,方法1与方法3的聚类结果故障误报率较高,方法2的聚类结果误报率为“0”,验证了方法2的K均值聚类的可行性和准确性。且分析图9相似度量值可知,3种方法的正常类中均有一次相似度量值较小的试验,即差异较大,这与图5中出现数据明显异常的两条曲线(其中包括8月22日的故障数据)的现象保持一致,同样验证了基于方法2的K均值聚类算法的有效性和准确性。这种根据样本分布范围均匀地随机生成质心的K均值聚类算法为实现泵调系统健康监测自动化提供了保障。

图9 3种方法的聚类结果

6 结束语

本文基于发参数据研究飞机发动机泵调系统的健康监测方法:

① 从实际发参数据中筛选出飞机A泵调系统起动过程的健康参数,并建立了飞机A泵调系统起动过程的参数基线模型,为泵调系统的健康监测打下坚实基础。

② 基于Mdist技术计算出泵调系统的健康指数,并通过滑动窗口的方法确定了泵调系统起动过程健康监测的预警阈值,为以后泵调系统的退化监测以及起动过程的故障预测提供了有效判据。

③ 通过3种K均值聚类算法对泵调系统起动过程的飞行数据进行故障诊断的结果的对比分析,验证了根据样本分布范围均匀地随机生成质心的K均值聚类算法的可行性与准确性,对实现泵调系统的健康监测自动化具有重要的实际意义。

猜你喜欢
基线聚类样本
基于深度约束的超短基线声速改正方法
一种傅里叶域海量数据高速谱聚类方法
高度角对GNSS多系统组合短基线RTK影响
WSL下基于GAMIT的高精度GPS/BDS基线解算及精度分析
基于知识图谱的k-modes文本聚类研究
基于数据降维与聚类的车联网数据分析应用
GAMIT用于GNSS长基线解算分析
基于模糊聚类和支持向量回归的成绩预测
规划·样本
人大专题询问之“方城样本”