基于飞行参数的飞机结构载荷最优回归模型

2018-11-30 01:58兑红娜王勇军董江刘小冬
航空学报 2018年11期
关键词:共线性回归系数回归方程

兑红娜,王勇军,董江,刘小冬

航空工业成都飞机设计研究所 强度部,成都 610010

结构故障预测与健康管理(Structural Prognostic and Health Management,SPHM)系统[1-4]是实现外场飞机单机寿命管理和自主保障体系的重要手段,对于保证飞机结构安全、充分发挥飞机使用寿命潜力、转变飞机结构由“定时维修”为“视情维修”、降低飞机全寿命期的使用维护费用,具有重大军事及经济效益。SPHM系统的关键技术之一是准确获取外场飞机疲劳关键结构载荷历程,作为后续关键部位疲劳损伤评估和寿命预测的基本输入。

欧美国家在飞机结构健康监控方面的研究起步较早,目前已应用于多型直升机和战斗机[3-9]。其中,F-35的SPHM系统[3-4]以机载飞行参数作为载荷识别的主要手段,并在飞机上布置少量传感器用于载荷直接监测,2种技术手段互为补充。中国在SPHM方面尚处于起步阶段,光纤、压电、智能涂层等传感器已完成实验室验证,但其在飞机结构平台上的工程化应用研究开展较少,技术成熟度相对较低。并且,由于重量、成本和可靠性等限制,外场飞机通常没有加装应变传感器,当前可行的方法是建立基于机载飞行参数的结构载荷识别体系。

以飞行参数为原始输入,获取结构关键部位应力历程的常用思路[8-12]是:先建立飞行参数与部件载荷的回归模型,再建立部件载荷与关键部位应力或应变的传递函数。这2步都涉及到回归模型的构建。第1步通过载荷实测飞机的飞行参数和应变电桥数据,采用神经网络法或多元线性回归法构建“飞行参数-载荷”的回归模型;第2步通过有限元分析和实测/疲劳试验数据,采用多元线性回归法构建“载荷-应力”的回归模型。如何构建鲁棒性好且精度高的结构载荷回归模型是保证载荷识别和寿命预测准确性的关键,也是本文研究的重点。

1 最优模型构建思路

基于飞行参数的飞机结构载荷识别流程如图1所示,对于“飞行参数-载荷”模型,首先采用机动识别技术对实测飞行数据按机动类型进行分类;然后对输入飞行参数进行筛选,确定最优输入飞行参数组合;最后采用神经网络法或多元线性回归法构建模型。对于“载荷-应力”模型,基于有限元分析和实测/疲劳试验数据,采用多元线性回归技术,构建最优回归模型,关键在于输入参数的优选。

机动识别技术详见文献[13-15],本文不作阐述。本文的重点是最优输入参数组合的筛选方法。所谓最优,指的是在保证载荷回归模型拟合优度的前提下,输入参数应尽量少,不仅各参数对载荷的影响均显著,且参数之间的多重共线性较弱,这样才能保证回归模型具有很好的鲁棒性和预测精度。

首先需综合飞行参数的物理意义、典型机动类型、载荷类型等,对输入参数进行初步筛选,详见表1(表中:Ny和Nz分别为重心侧向和法向过载)。接着,采用某种技术途径筛选出最优参数组合,详见下文。

图1 基于飞行参数的飞机结构载荷识别流程Fig.1 Structural load identification procedure based on flight data

表1 输入飞行参数初步筛选Table 1 Initial screening of flight data

2 最优输入参数组合

结合多元线性回归分析[16-19]中的多重共线性诊断、残差分析和筛选变量法,本文提出了一种筛选最优输入参数组合的技术途径,详细步骤如下:

1) 对原始自变量进行多重共线性诊断,依次剔除相关性较大的变量,以减弱自变量之间的多重共线性。

2) 将剩余自变量均引入回归方程,进行残差分析,剔除异常点。

3) 采用逐步筛选变量法,筛选出对因变量影响显著的最优自变量组合。

2.1 多元线性回归分析

多元线性回归方程通常表示为y=Xβ=β01+β1x1+β2x2+…+βmxm,矩阵形式为

若t统计量超过t分布的95%区间范围,则认为回归系数显著。统计量的绝对值愈大,回归系数愈显著。因此,根据t统计量大小,可将模型中所有自变量的重要度进行排序。

2.2 多重共线性诊断

在多元线性回归分析中,自变量之间不可避免地存在一定程度的多重共线性。所谓多重共线性,指的是自变量之间存在线性关系,即存在不全为零的系数λ1,λ2, … ,λm,使λ1x1+λ2x2+…+λmxm+μ=0成立,其中μ为随机误差项。存在严重多重共线性时,回归系数估计值的物理含义将不真实,同时回归系数的显著性检验将失去意义,可能将重要的自变量排除在模型之外,回归方程的预测效果亦是不稳定的,即鲁棒性很差。

对多重共线性进行诊断,实际上是测度多重共线性的显著程度。多重共线性诊断的方法有很多,本文基于2种常用方法进行分析研究:偏相关系数法和辅助回归方程法。

2.2.1 传统诊断方法

2.2.2 新诊断方法

本节分别基于偏相关系数和辅助回归方程,提出2种更为合理可行的减弱多重共线性方法。整体思路是依次剔除与其他变量相关性较大的自变量,关键在于剔除条件的确定。由于回归模型的最终目的是因变量y的拟合优度,因此剔除条件应将自变量对y的影响考虑在内。

多重共线性新诊断方法的流程如图2所示,2种方法的不同之处在于剔除条件。

偏相关系数法的思路是找出偏相关系数Rxixj较大的自变量对xi和xj,将其中对y影响最小的变量剔除。综合考虑自变量之间的相关关系以及自变量对y的影响,将Rxixj值较大的判决设定为:Rxixj>0.95且Rxixj>maxRxiy,Rxjy,其中Rxiy和Rxjy指的是xi和y、xj和y分别在剩余自变量(排除xi和xj)下的偏相关系数,0.95是经验取值。筛选剔除变量的步骤详见图2中左边虚框。

图2 多重共线性新诊断方法的流程Fig.2 Procedure of new multi-collinearity diagnosis methods

筛选出候选剔除变量之后,2种方法接下来的步骤是完全相同的。上述2种剔除方法中,辅助回归方程法的迭代次数少一些,计算效率更高。对于“飞行参数-载荷”模型,原始飞行参数通常超过13个,包括:重量、高度、马赫、速度、重心三向过载、三向角速度、三向角加速度、各舵面偏度等,以上2种方法剔除的变量通常是相同的。对于“载荷-应力”模型,部件载荷通常较少,如:左/右侧弯矩、剪力、扭矩,以上2种方法剔除的变量可能是不同的,应选取回归模型相对更优的作为最优参数组合。

2.3 残差分析

2.4 逐步回归法筛选变量

逐步回归法是基于回归系数的显著度,逐步引入和剔除变量的过程,最终筛选出最优自变量组合。通常将引入和剔除的临界值均取为0.05,详细步骤如下:

1) 初始模型中无变量。

2) 对于当前未引入模型的变量,若t统计量对应的超越概率p小于临界值(即,在足够置信度下可拒绝该变量引入模型后回归系数为0的假设),将p值最小的变量引入模型;重复该步骤,否则,转步骤3)。

3) 对于当前已引入模型的变量,若t统计量对应的超越概率p大于临界值(即,在足够置信度下无法拒绝该变量回归系数为0的假设),将p值最大的变量剔除,转步骤2);否则,结束。

值得注意的是自变量进入模型的顺序并不代表自变量的重要度顺序,重要度需通过最终模型中各回归系数t统计量进行排序。由于逐步筛选变量过程中前面变量是否进入模型与后续变量是无关的,即没有考虑前后变量之间的多重共线性,因此,多重共线性诊断应在逐步筛选变量之前进行,否则很可能将多余变量引入模型,影响显著性检验。

3 算 例

3.1 偏相关系数法

首先,进行多重共线性诊断,过程数据列于表2,仅剔除1个变量。

接着,进行残差分析,经t分布检验,第3、第4样本点异常,应删除。然后,逐步筛选变量,过程数据列于表3,表中数值为相应变量回归系数的t统计量。每一步筛选都引入或者剔除了一个变量。

表2 基于偏相关系数法的多重共线性诊断Table 2 Multi-collinearity diagnosis based on partial correlation coefficient method

表3 逐步回归过程(偏相关系数法)Table 3 Process of stepwise regression (partial correlation coefficient method)

Notes:× represents the term is not currently in the model; / represents the process or calculation is not available in the current sequence; √ represents the term is currently in the model; * representsp-value oftstatistic is greater than the entrance tolerance or the exit tolerance (both 0.05).

3.2 辅助回归方程法

首先,进行多重共线性诊断,过程数据列于表4,共剔除3个变量。

接着,进行残差分析,同样删除第3、第4样本点。然后,逐步筛选变量,过程数据列于表5,表中数值为相应变量回归系数的t统计量。

表5 逐步回归过程(辅助回归方程法)Table 5 Process of stepwise regression (auxiliary regression equation method)

Notes: × represents the term is not currently in the model; / represents the process or calculation is not available in the current sequence; √ represents the term is currently in the model

3.3 讨 论

采用以上2种方法筛选最优参数组合,均引入3个自变量,且x4对因变量的影响均最大,因此应优先保证x4的计算精度和可靠度。

如前所述,当2种方法筛选的最优参数组合不同时,应选取回归模型相对更优的作为最优参数组合。对于本算例,基于偏相关系数法的拟合效果更优(0.999 423>0.998 759)。

筛选最优参数组合的意义并非是提高模型预测精度,因为通常输入参数越多,回归模型的拟合效果越好,而是在确保精度的同时,提高模型的稳定性和鲁棒性,这样,模型中各参数的回归系数才有意义,参数重要度排序结果才更合理和准确。

4 结 论

针对基于飞行参数的飞机结构载荷识别模型,结合多元线性回归分析,重点介绍并提出一种筛选最优输入参数组合的技术途径,具体总结如下:

1) 输入参数的初步筛选需综合物理意义、机动类型、载荷类型等。

2) 最优输入参数组合的筛选步骤是首先减弱自变量之间的多重共线性,然后进行残差分析,删除异常样本点,最后逐步筛选出最优自变量组合。

3) 指出多重共线性传统诊断方法存在一定弊端,提出2种更为合理可行的减弱多重共线性方法,分别基于偏相关系数法和辅助回归方程法,依次剔除与其他变量相关性较大的自变量。最终应选取回归模型相对更优的作为最优参数组合。

4) 以典型战斗机翼身连接框某关键部位在疲劳载荷工况下的应力为样本数据,对最优输入参数组合的筛选步骤展开说明,验证了本文提出的技术途径是合理可行的,且具有很高的拟合优度。

5) 筛选最优参数组合的意义在于确保模型拟合精度的同时,提高模型的稳定性和鲁棒性,这样,模型中各参数的回归系数才有意义,参数重要度排序结果才更合理。本文提出的技术途径具有很高的工程应用价值。

猜你喜欢
共线性回归系数回归方程
采用直线回归方程预测桑瘿蚊防治适期
南瓜SWEET蛋白家族的全基因组鉴定与进化分析
线性回归方程的求解与应用
线性回归方程要点导学
银行不良贷款额影响因素分析
不完全多重共线性定义存在的问题及其修正建议
我国寿险需求影响因素的岭回归分析
线性回归方程知识点剖析
基于生产函数模型的地区经济发展影响因素分析
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较