考虑驾驶仪动态性能的指令滤波反演制导律

2020-12-29 02:33刘佳琪王伟林德福林时尧
航空学报 2020年12期
关键词:观测器制导反演

刘佳琪,王伟,*,林德福,林时尧

1. 北京理工大学 宇航学院,北京 100081 2. 无人机自主控制技术北京重点实验室,北京 100081

伴随飞行器机动性、防御性不断提高,工程上对导弹的制导精度提出了更高要求。而在实际应用中,制导律往往受到导弹硬件性能约束。同时,如何准确获取目标运动状态也是限制制导律性能的重要因素。因此,在考虑硬件性能及制导信息约束的前提下,设计满足精度需求的制导律具有重要的应用价值。

多约束条件下的导弹制导控制系统为典型的非线性系统,现有的比例导引方法针对复杂条件的扩展性较差,而反演控制方式适用于复杂非线性系统且易于添加约束,因而被广泛应用于制导律的设计中[1-3]。实际工程中,三维有限时间收敛制导律具有很高的应用价值[4-6]。文献[7]应用了反演设计方法和输入-状态稳定性理论,设计了一种三维鲁棒非线性导引律,在有限收敛时间内提高了系统的鲁棒性。而反演法在对虚拟项求导的过程中会产生极大的计算量,占用工程中的有限计算资源,被称为“微分膨胀”。目前常用的解决这一问题的动态面控制法将反演法的虚拟控制量通过一阶低通滤波器,获得下一步迭代数据。文献[8-9]将动态面控制技术应用在导弹制导控制系统设计中,消除了“微分膨胀”问题,减少了制导过程计算量。但动态面控制制导(Dynamic Surface Control Guidance, DSCG)律对虚拟控制量过滤作用有限。Ramy[10]和Dong[11]等针对反演控制过程中的“微分膨胀”问题提出了一种指令滤波反演方法,在滤波器中加入阻尼和带宽的限制来过滤虚拟信号。指令滤波反演方法也被应用制导控制问题中[12],文献[13]在高超声速飞行器模型上应用指令滤波反演控制,验证了其对制导信号的有效跟踪控制。

在确定控制方法的前提下,充分考虑飞行器其他部分对制导过程的约束对提高实际制导效果有很大提升[14]。其中自动驾驶仪的动态特性会对实际制导控制回路造成较大延迟,在制导律设计过程中加入自驾仪环节可以有效改善。此外,在追踪目标持续变向机动的过程中,实际额定过载会约束导弹的追踪性能。文献[15-16]在制导律设计过程中充分考虑了导弹自动驾驶仪的动态特性,改善了系统的整体性能。Chwa[17]应用动态面方法解决了输入饱和情况下的控制问题,文献[18-19]也在考虑输入饱和的前提下开展了制导控制设计工作。文献[20]以平面内弹目运动模型为基础,考虑自驾仪动态性能设计了一种过载指令约束导引律,对指令滤波器在非线性系统控制中的应用做出了较为详尽的解释。文献[21]基于指令滤波反推方案,使用已知目标状态信息设计了考虑控制饱和及自驾仪动态性能问题的三维制导律。

目标加速度信息的准确性对制导精度有很大影响,而在实际工程应用中,目标加速度信息往往难以直接获取并直接运用到制导律中。为此本文引入扩张状态观测器(Extended State Observer, ESO)对目标加速度进行估计。扩张状态观测器对非线性制导律中的未知制导信息具有很好的跟踪效果[22]。文献[23]在二维纵向平面的设计了二阶与一阶2个扩张状态观测器分别估计目标加速度与目标视线角速度信息。文献[24]则是将由扩张状态观测器观测的目标加速度信息应用到滑模制导律的设计中。实际制导信息获取、传输过程中,信号噪声 会对制导律以及加速度信号跟踪造成影响,扩张状态观测器也应具有一定的抗干扰能力。

由上述分析,反演控制方法在制导控制方面有很好的可用性,且约束项也对制导律设计提出了实践要求。本文以导弹对目标精确打击为背景,通过扩张状态观测器估计目标加速度。相较于现有的DSCG,本文改进了滤波器结构,显著提高了制导精度。较于传统的有限时间收敛制导(Finite-Time Convergent Guidance, FTCG)律[25],本文设计的指令滤波反演制导(Command Filter Back-stepping Guidance,CFBG)律,具有更快的收敛速度及更高的精度;同时增加了自动驾驶仪动态环节和饱和滤波环节,使该制导方式更具有工程应用价值。

1 制导模型

导弹和目标的相对位置关系在图1的弹目视线坐标系中进行表示,视线坐标系Ox′y′z′由惯性系Oxyz依次绕y轴和z′轴旋转-η、ε的角度得到,惯性系Ox轴同导弹初始速度方向相同。

弹目相对运动方程为

(1)

式中:r为导弹与目标相对距离;ε和η分别为弹目视线倾角和视线偏角;aTr、aTε和aTη分别目标在弹目视线坐标系下x′、y′、z′ 3个方向的加速度;aMr、aMε和aMη为导弹在上述3个方向上的加速度。

图1 导弹与目标相对位置关系Fig.1 Relative position of missile and target

(2)

(3)

在对导弹进行控制的过程中,制导律计算出的加速度指令直接输出给导弹的自动驾驶仪,自动驾驶仪通过调节舵或推进器来跟踪加速度指令。因此,导弹最终获得的加速度相较于加速度指令而言,总存在滞后现象。在应用过程中,使用能较好描述自动驾驶仪动力学特性的二阶系统应用到制导律模型的建立、设计中。自动驾驶仪二阶模型为

(4)

式中:aMi为在制导控制过程中实际获得的加速度;ui为控制信号;ξ为动力学环节阻尼比;ωn为动力学环节固有频率。

在实际应用中,如果制导律产生的控制信号不受约束,会将最大的信号输入到控制系统中。但由于自动驾驶仪的特性以及硬件的限制,并不能对加速度指令进行有效的跟踪。这种情况会产生信号突变的“尖角问题”,给控制系统造成执行负担。在设计制导律模型的过程中,引入一个饱和函数对控制量进行约束,将其控制在系统机构调节能力范围之内,饱和函数为

(5)

式中:uM为已知的控制输入信号的边界(包括上界、下界)。

可得出制导律的数学模型为

(6)

式中:

(7)

式中:f(x1)为因变量;d为目标在视线坐标系下的加速度,通过扩张状态观测器估算获得。在制导律设计过程中,主要对x2,即导弹在视线倾角与视线偏角方向的加速度进行控制。

2 指令滤波反演制导律

2.1 制导律设计

在制导律数学模型(6)中,目标加速度d难以通过观测直接获得,因此需要根据已知状态对d进行估计。根据扩张状态观测器设计原则,以导弹法向速度x1为状态变量求解误差,将目标加速度作为干扰项设计扩张状态观测器(ESO)[24]来估算目标加速度:

(8)

式中:β1、β2为观测器的反馈增益系数;z2可以实现对d的有效跟踪。为保证前后描述的一致性,后文目标加速度仍用d表示。接下来对制导律控制量进行设计。Δz代表实际应用中导弹的制导参数(x1、x2等)输入到扩张状态观测器过程中产生的噪声信号,在仿真实验中会对Δz做更详尽的定义。

根据滑模控制设计原则,对非线性系统的控制量进行设计时,首先定义跟踪误差Si[9]:

Si=xi-xici=1,2,3

(9)

式中:x1c为制导过程中所需的弹目视线切向速度;x2c、x3c为虚拟控制输入量。该制导律模型为三阶非线性系统,需要3个设计环节完成设计。

步骤1由于x1为导弹在视线坐标系Oy′z′面上的2个速度,需要收敛到0,因此x1c定义为0,因此S1实际可以写为

S1=x1

(10)

S1的导数为

(11)

f(S1)可被分为2个部分:

(12)

式中:

(13)

式(13)为一个非线性耦合项并满足以下性质:

(14)

定义一个李雅普诺夫函数为

(15)

对式(15)求导可得

(16)

(17)

(18)

(19)

步骤2定义跟踪误差S2为

S2=x2-x2c

(20)

通过式(6)对S2求导可得

(21)

(22)

(23)

(24)

步骤3定义跟踪误差S3为

S3=x3-x3c

(25)

对S3进行求导得

(26)

为了避免实际应用过程中产生控制输入饱和的问题,除了设计饱和函数sat(u)外,再引入一个辅助的一阶低通滤波器。令

(27)

若Δu=0则不存在控制输入饱和的现象,将Δu通过一阶低通滤波器获得xe:

(28)

式中:xe为通过滤波器后的饱和项,参数τe为

(29)

式中:设计参数K3应满足K3>0。当xe=0时γ(xe)=1,当xe≠0时γ(xe)=0。

综上,控制信号u最终设计为

(30)

2.2 稳定性证明

定理1对于制导律模型(6),在采用指令滤波器(18)、(23),一阶滤波器(28),并进行反演设计时,闭环系统稳定,被控制参数逐渐收敛。

证明滤波器输出式(18)和式(23)在不考虑幅值及速率的附加约束下,经过变换可得

(31)

ESO的稳定性在文献[26]中有详细证明,本文不再给出。由工程经验可知,反馈增益系数、影响系统收敛速度和稳定性,反馈增益系数越大,z2向d收敛的速度越快,但如果系数过大,系统易因超调过大而失稳。具体参数选取在仿真实验中进行详细描述。

已知跟踪误差对时间的一阶导数,定义李雅普诺夫函数为

(32)

代入边界层误差y2并对V1s对时间的一阶导数为

(33)

同理,跟踪误差S2对时间的一阶导数为

(34)

定义李雅普诺夫函数为

(35)

其对时间的一阶导数为

(36)

跟踪误差S3对时间的一阶导数为

(37)

定义李雅普诺夫函数

(38)

其对时间的一阶导数为

(39)

输入饱和情况下定义李雅普诺夫函数为

(40)

其对时间的一阶导数为

(41)

综上所述,在证明滤波过程稳定的前提下啊,对整个闭环系统其他部分定义李雅普诺夫函数

(42)

其对时间的一阶导数为

(43)

通过设计合适的参数,可以使参数满足以下约束条件:

(44)

式(43)可以简化为

(45)

满足:

(46)

通过合理设计参数可以保证系统的稳定性,使系统中速度矢量沿视线倾角和视线偏角的分量逐渐收敛于0,证毕。

3 仿真实验

利用数学仿真来检验设计的指令滤波反演制导(CFBG)律的有效性,通过与动态面控制制导(DSCG)律[9]有限时间收敛制导(FTCG)律[25]对比来突出指令滤波反演制导(CFBG)律的优势。其中DSCG采用相同ESO估计目标加速度,FTCG采用ESO估计弹目视线角速率参与制导,且不考虑自驾仪延迟环节。同时为比较3种制导律的收敛性,以相同的饱和函数sat(u)限制加速度。

导弹和目标的位置、运动状态通常需要地面雷达、基站进行标记。因此仿真中给定状态量都在地面惯性坐标系中进行表示,通过坐标系转换即可得到视线坐标系中的各个变量。仿真参数设计为:仿真步长h=0.001,单位为s,ESO的反馈增益参数与仿真步长有关,设计为:β1=2/h,β2=1/h;CFBG的仿真参数设计为:ωn=20,ξ=0.6,N=4,K1=3,K2=5,K3=7,K4=60,ζm=0.8,ωm=220,uM=[-200 200]。以导弹拦截空中机动目标为背景,设定导弹位置为坐标原点,单位为m;目标位置在T0=(3 000, 3 000,3 000), 单位为m,模拟导弹在末制导过程中无助推环节下对目标的追踪打击。设计较大的初始偏差来检验制导律对导弹的控制效果,设导弹初速度Vm0=800 m/s,沿惯性系轴正向,则导弹与目标初始视线倾角ε0=45°,视线偏角η0=45°。实际应用中,导弹过载受到各方面的限制,设定导弹加速度上限为am,max=200 m/s2。

为探究设计制导律对机动目标的跟踪、制导效果,设计2种不同运动模式的目标运动:在竖直方向上做往返加速的正弦运动和在有限时间内的不规则躲避运动。惯性系中目标初始速度均为VT0,单位m/s;目标正弦运动加速度参数为:aTz=-30sin(πt/2) m/s2,aTx=0,aTy=0;目标不规则运动加速度参数为:t<2 s时,aTx=-10 m/s2,aTy=-10 m/s2,aTz=0;2≤t<4 s时,aTx=-20 m/s2,aTy=0,aTz=0;t≥4 s时,aTx=0,aTy=-10 m/s2,aTz=-10 m/s2。在ESO跟踪目标加速度仿真中,通过随机数模拟噪声信号Δz,随机数符合μ=0,σ2=1的高斯分布。考虑目标加速度量级,增加幅值为5放大器,采样时间为0.001 s。其他仿真实验中定义Δz=0。仿真结果和分析如下:

图2和图3中,图2(a)中曲线为目标和3种制导律下导弹的运动轨迹,图2(b)和图3(b)、图2(c)和图3(c)、图2(d)和图3(d)中12 s后制导数据突变处为导弹命中目标时刻,对制导过程无影响。图2(e)和图3(e)表示控制参数u、sat(u)以及加速度。

由表1、表2的导弹拦截目标脱靶量及图2(a)、图3(a)的导弹拦截目标过程可以看出,3种制导方式都可以控制导弹接近目标并以较小脱靶量命中目标。相较于DSCG和FTCG,CFBG弹道在约0~5 s内偏移量较小,在制导后段,偏移量逐渐增加,符合能量利用原则。目标做正弦运动时,CFBG脱靶量位于中间位置,但如果去除ESO而直接使用目标加速度,则CFBG的命中精度要高于其他2种制导律;目标做不规则运动时,CFBG的命中精度最高。CFBG与DSCG相比改进了滤波环节,引入速率及带宽的约束,使得制导精度有约50%的提高。由图2(b)和图3(b)可知,设计的ESO可以实现对目标加速度的跟踪,除在目标加速度突变时刻有小量延迟外,其他时刻ESO的跟踪精度均较高。ESOI表示在添加信号噪声之后扩张状态观测器的跟踪曲线,可以看到当噪声信号在所观测加速度信号中占比较大的影响下,ESO也能对加速度信号进行准确跟踪。从图2(c)、图2(d)和图3(c)和图3(d)可知3种制导方式都通过零化视线角速率的方式实现对目标的追踪。CFBG和DSCG 2种制导方式下弹目视线角速率收敛更快,在7 s左右实现收敛,FTCG收敛速度略慢于其他2种,尤其是在视线偏角方向上需要在9~10 s的时间段内实现收敛。在目标正弦运动过程中,FTCG在接近目标时视线角速率也发生了类正弦的变化趋势。结合目标不规则运动结果,可以看出FTCG在拦截做法向运动的目标的过程中,追踪反应要慢于CFBG和DSCG。由图2(e)和图3(e)可以看出,未经约束的控制输出u超过最大控制量,经过饱和函数sat(u)约束后成功控制在200以内,但是频率较高,不适合直接输入到导弹模型中。通过低通滤波器可以得到最终相对平稳的加速度指令。

2种目标运动模式下脱靶量和制导参数如表1和表2所示。

图2 目标正弦运动仿真结果Fig.2 Simulation results of target sinusoidal motion

表1 目标正弦运动脱靶量Table 1 Miss distance of target sinusoidal motion

表2 目标不规则运动脱靶量Table 2 Miss distance of target irregular motion

4 结 论

本文基于指令滤波反演控制、有限时间稳定理论、扩张状态观测方法,设计了一种同时考虑自动驾驶仪动态特性、控制输入饱和目标加速度未知问题的制导律。主要工作及结论如下:

1) 为获取目标加速度信息,设计了一种有限时间收敛的扩张状态观测器,可以实现对目标加速度的有效跟踪。

2) 在制导律中加入自动驾驶仪二阶动态环节及饱和过滤环节,并设计了一种指令滤波反演制导律,保证在有限时间内弹目视线角速率零化。

猜你喜欢
观测器制导反演
反演对称变换在解决平面几何问题中的应用
含干扰项的非线性广义系统执行器故障估计*
多飞行器突防打击一体化微分对策制导律设计
THAAD增程型拦截弹预测制导方法
基于观测器的线性系统非脆弱鲁棒控制及仿真
高超声速伸缩式变形飞行器再入制导方法
基于非线性干扰观测器的航天器相对姿轨耦合控制
基于观测器的传感器故障检测方法对比分析
反演变换的概念及其几个性质
盾和弹之间的那点事(九)