基于遗传算法的自主干扰决策方法

2023-09-27 11:31刘琦妍
中国民航大学学报 2023年4期
关键词:点源态势复杂度

朱 卓,刘琦妍,张 策

(1.中国电子科技集团公司第五十三研究所机载产品事业部,天津 300308;2.西北工业大学a.无人系统技术研究院;b.航天学院,西安 710072)

目前,察打一体无人机的主要威胁为红外地空导弹[1-2],其主要包括便携式红外地空导弹和车载式红外地空导弹,并具有抗人工干扰能力较强,射程较远等特点[3-4],无人机基本无法摆脱其攻击,因此,研究用于无人机自主规避红外地空导弹的决策技术是十分必要的。当无人机遭受红外地空导弹攻击威胁时,能通过对自身获得的各项信息进行分析决策,做出最合理的自主规避对抗举措,可以提高其生存能力。

文献[5]研究了导弹迎头攻击时,飞机的最佳防御策略,即做非常规机动并同时发射干扰弹;文献[6]深入研究红外成像导弹的抗干扰机理,建立了目标机的运动和辐射模型以及面源红外诱饵的运动扩散模型和红外图像模型,并选择导弹的战术参数以制定干扰效能评估指标,仿真结果表明,面源红外诱饵可有效干扰二代弹,但针对三代弹和四代弹的干扰成功率较低;文献[7]针对具有一定自主空战能力的无人机,建立了以过载为输入的飞行动力学模型和采用三维比例导引法的导引弹道模型,并结合神经网络为无人机设计了一种规避来袭导弹的机动策略,但其样本库的计算非常耗时,且神经网络只适用于设定好的导弹系统;文献[8]构建了超视距空中对抗训练环境,提出了一种融合专家经验的启发式Q 网络方法,实现了空中对抗机动策略的自主学习;文献[9]利用神经网络直接从无人机与导弹的位置关系预测规避结果,为无人机实时提供规避策略,但其需要大量数据支持;文献[10]提出了一种基于蚁群和Q 学习的融合算法,以提高认知雷达干扰决策的效率和适应性,从而适应未来战场上的集群对抗环境,但其在复杂战场环境下效果不佳。

上述研究从不同方面给出了无人机的作战策略,但在复杂红外对抗情况下,仍需进一步提高无人机对抗决策的质量,使其适应力更强,覆盖面更广。本文提出一种面向典型对抗态势的自主干扰决策模型,首先,基于红外干扰弹投放策略集及典型红外对抗态势建立红外对抗样本库;其次,利用遗传算法及匹配决策模型得到最优典型对抗态势决策集;最后,结合线性插值思想得到一般对抗态势下的干扰弹投放策略,找出针对不同对抗态势的近乎最优的对抗策略方案,创建决策模型,并通过仿真实验验证了本文自主决策模型的有效性。

1 红外对抗样本库

1.1 干扰弹投放策略集

干扰弹投放策略集包含以下因素:投放干扰弹总数、投放组数、组间间隔、每组投放强点源干扰弹数、每组投放多点源干扰弹数、弹间隔、投放方向、投放速度等。

为同时应对红外制导导弹和雷达制导导弹,无人机需装载相同数量的红外干扰弹和箔条弹。本文设定目标无人机单次可携带的红外干扰弹总量为60 枚,包括强点源干扰弹与多点源干扰弹。为避免一次投放全部干扰弹造成无人机多次遇袭时无干扰弹可用的危险处境,限定一次性投放干扰弹的数量不多于12枚,最多投放3 组。投放组数n=1,2,3,每组强点源干扰弹数m=1,2,每组多点源干扰弹数d=1,2,组间隔tn=0,1,1.5 s,弹间隔tm=0.1,0.2,0.3 s。干扰弹投放速度为30 m/s,投放倾角与偏角为[-120°,-60°](以30°为间隔),本文取-60°,按照先投放强点源干扰弹后投放多点源干扰弹的原则,上述参数组成的红外干扰弹投放策略集(部分)如表1 所示。

表1 红外干扰弹投放策略集(部分)Tab.1 Delivery strategy set of infrared decoy(partial)

每一个干扰投放策略确定后,会有一个对应的投放持续时间T,即完成该策略的投放所需要的时长,可表示为

式中k 为每组弹数。

针对任一对抗态势,每次投放都应包含强点源干扰弹与多点源干扰弹,强点源干扰弹可以有效遮蔽无人机目标并使红外制导导弹根据质心跟踪原理偏向强点源干扰弹的方位;如果强点源干扰弹未能成功诱导红外制导导弹偏离目标,多点源干扰弹可以形成多个类目标红外干扰,混淆导引头对目标的判断,致使导弹需要从多个点源目标中选择跟踪目标,从而有效降低选中目标的概率。

1.2 典型对抗态势

不同类型导弹的射程、射高、飞行速度等参数不同,故对应的干扰对抗策略也不尽相同。

红外制导导弹与目标无人机构成的典型对抗态势由导弹和无人机的初始参量构成,包括:飞机高度、弹目距离、导弹运动速度、导弹发射方位角、无人机飞行高度、无人机飞行速度。设置典型便携式导弹对抗态势,无人机飞行高度分别设置为1.0、2.0、3.5 km,无人机飞行速度为0.2 Ma,弹目距离分别为2.0、4.0、6.0 km,导弹发射方位角根据导弹攻击包线分别设置为0°、12°、27°、50°、77°、90°、120°、138°、165°、180°,排除不合理的对抗态势,共组成典型对抗态势80 种,部分态势如表2 所示。

表2 典型对抗态势(部分)Tab.2 Typical confrontation situation(partial)

1.3 红外对抗样本库构建

通过建立具有典型性和覆盖性的红外对抗样本库,可为仿真实验和干扰弹投放策略的选择提供数据支撑,是后续评估干扰策略效果的基础。红外对抗样本库的构成如图1 所示。

图1 红外对抗样本库Fig.1 Sample library of infrared countermeasures

随着导弹发射距离的增加,对应的理想弹道平均时长增加;当水平进入角从0°逐渐转到180°,即导弹从尾后攻击逐渐转向迎头攻击,对应的理想弹道平均时长减小;不同的干扰投放策略对应的投放持续时间不同。因此,在构建红外对抗样本库时,需要考虑干扰弹投放持续时间和导弹完成攻击的理想时间的匹配,以保证红外干扰弹可以全部投放出去,且其在整个对抗过程的大部分时间内均能发挥效用。经实验发现,T应满足以下条件

式中:S 为弹目距离;v弹为导弹飞行平均速度;v无为无人机飞行平均速度。

基于上述分析,可以从红外干扰弹投放策略集中为每种对抗态势选择可行策略集,以贴合实际情况,避免浪费红外干扰弹,并减少红外对抗样本库的样本数量,方便后续计算。

2 典型对抗态势下的干扰弹投放策略

2.1 基于遗传算法思想的对抗策略选择

遗传算法[11](GA,genetic algorithm)是模拟达尔文生物进化论的自然选择和遗传学机理生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法[12]。遗传算法过程如图2 所示,种群像自然进化一样,后生代种群比前代更加适应于环境,末代种群中的最优个体经过解码,可作为问题近似最优解[13]。

图2 遗传算法过程Fig.2 Process of genetic algorithm

本文针对典型态势的最优干扰弹投放策略,结合遗传算法的基本思想,对传统遗传算法进行一定的改进。其核心内容包括以下方面。

(1)参数编码。采用实数编码,减少一般二进制编码最后解码的步骤。

(2)初始群体的设定。初始种群选取参数范围为红外对抗样本库中参数。在获得的初始种群选取范围内,以随机方式获取初始种群,其规模设为40。

(3)适应度函数的设计。以综合复杂度[14]作为适应度函数。

(4)遗传操作设计过程如下。

a 选择算子。计算初始种群的适应值,保留适应值最高的前10 个组合并遗传至下一代,淘汰最低的10 个组合。

b 交叉算子。本文无人机干扰弹投放策略采用实数编码的方式,每个个体的染色体记为干扰弹决策各因素的值,采用单点交叉,示意图如图3 所示。将适应度排名前30 的个体分为奇数与偶数排列的两组,每组共15 个,各选10 个个体分别进行交叉操作,遗传至下一代。

图3 单点交叉示意图Fig.3 Diagram of single point crossing

c 变异算子。优质的典型态势对抗决策已经接近最优,采取的变异范围较小,本文将使用变异算子产生的高斯随机数替换组合染色体后6 位中任一位作为一次变异操作。

(5)控制参数设定。设置初始种群数量为40,迭代次数设置为5 次,交叉概率和变异概率设定为1。交叉概率设置为1,可以加速搜索过程,提高算法效率;变异概率设为1,以保证最优策略的全局性。

迭代结束后,将迭代所得的适应度值最高的策略作为当前典型态势的干扰弹投放策略。择优步骤如图4 所示。

图4 基于遗传算法的择优步骤Fig.4 Optimal steps based on genetic algorithm

2.2 基于典型红外对抗系统的匹配决策模型

针对红外对抗样本库中的每个样本,生成其红外仿真图像序列,计算这些序列的综合复杂度值,利用建立的红外对抗样本库以及计算出的综合复杂度值来进行简单的决策匹配。针对每一种基础对抗态势给出最优干扰弹投放策略的评价准则:①策略符合干扰与混淆的基本思想;②综合复杂度作为评判指标;③每次对抗干扰总数满足全程干扰规划。针对任意一种典型对抗态势选择干扰弹投放策略流程如图5 所示。

图5 策略流程图Fig.5 Strategy flow chart

根据实验分析,与最优策略综合复杂度值差值在0.05 以内的策略均可作为备选策略,选取其中投放干扰弹最少的策略作为当前对抗态势的最优干扰弹投放策略。

3 干扰弹投放策略迁移模型

3.1 线性插值思想

计算得到匹配典型红外对抗态势的最佳红外干扰弹投放策略,需要将其扩展到针对任一态势,构建基于典型红外对抗态势的迁移决策模型。本文根据典型对抗态势得出的有效策略,使用插值法得到非典型对抗态势的策略提案,再根据仿真实验,并结合综合复杂度来评判策略的有效性。三线性插值思想[15]如图6 所示。

图6 三线性插值图Fig.6 Tri-linear interpolation graph

已知C 点坐标(x,y,z),设C000点坐标为(x0,y0,z0),C001点坐标为(x0,y0,z1),C100点坐标为(x1,y0,z0),C110点坐标为(x1,y1,z0),C101点坐标为(x1,y0,z1),C011点坐标为(x0,y1,z1),C010点坐标为(x0,y1,z0),C111点坐标为(x1,y1,z1)。C 点的插值计算形式如下

3.2 无人机红外对抗策略迁移模型

典型对抗态势通过组合共构成36 个区间,示意图如图7 所示。通过判断当前对抗态势处于哪个区间内,即可通过线性插值思想计算得出对应态势的迁移干扰弹投放策略。

图7 典型对抗态势示意图Fig.7 Typical confrontation situation diagram

为了测算通过插值方法计算得到的随机态势的干扰弹投放策略是否为当前态势的优质策略,同样使用遗传算法进行寻优设计。红外对抗决策模型由典型对抗态势策略经过线性插值法与基于遗传算法思想的改进算法组成,流程如图8 所示。

图8 一般对抗态势决策分析流程Fig.8 Decision analysis process of general confrontation situation

上文的干扰弹投放策略只能取整,但通过线性插值思想计算得出的当前态势干扰弹投放策略参数值一般不取整,需结合典型态势投放策略设计参数值,将当前态势计算参数就近取整,作为当前态势干扰弹投放策略。设投放组数n={n1,n2},每组强点源干扰弹数m={m1,m2},每组多点源干扰弹数d={d1,d2},其计算公式如下

其余投放策略因素设置与前文针对典型对抗态势的投放策略相同。与最优策略综合复杂度值差值在0.05以内的干扰弹投放策略作为备选策略,再进一步选取最优策略。

3.3 无人机红外对抗自主决策模型

基于红外干扰弹投放策略集和典型对抗态势计算综合复杂度得到80 组典型对抗态势优质策略集,通过遗传算法思想对优质策略集进行进一步优化,计算得到的最优策略集综合复杂度与优质策略集综合复杂度对比图如图9(a)所示,其中,红点表示经过遗传算法迭代后得到的最优策略综合复杂度值,蓝点表示优质策略的综合复杂度值。两者差值如图9(b)所示。

图9 典型态势综合复杂度对比图与差值图Fig.9 Comparison of synthetic complexity and difference graph of typical situation

从图9 可知,经过遗传算法迭代后得到的最优策略综合复杂度值明显高于未迭代之前的优质策略综合复杂度值,综合复杂度差值均值接近0.2。

故无人机红外对抗自主决策模型以面向典型对抗态势的自主干扰决策模型为基础,结合插值与遗传算法寻优思想,得到面向一般态势的自主干扰决策模型。取36 个典型对抗态势区间,每个区间有20 个随机态势,结合插值思想计算其干扰弹投放策略,并计算相关策略的综合复杂度。随机态势分布图如图10所示。

图10 随机态势分布图Fig.10 Distribution of random situation

计算720 个随机态势的插值迁移策略综合复杂度与通过遗传算法迭代后得到的最优策略综合复杂度,综合复杂度对比图如图11(a)所示,其中,红点表示经过遗传算法迭代后得到的最优策略综合复杂度值,蓝点表示插值迁移策略综合复杂度值。随机态势最优策略综合复杂度与插值迁移策略综合复杂度的差值图如图11(b)所示。

图11 随机态势综合复杂度对比图与差值图Fig.11 Comparison of synthetic complexity and difference graph of random situation

从图11(b)可知,综合复杂度差值大于0.05 的策略约占测试策略总数的10%,其中综合复杂度差值介于0.05 与0.06 之间的策略约占测试策略总数的44%,本文认为综合复杂度差值在0.05 以内的对抗策略均可作为备选策略,所以插值迁移策略与经过遗传算法思想寻优后的策略相比有近90%都可作为备选策略,且计算量小,具有应用可行性。

4 仿真实验验证

为验证本文决策模型的可行性和有效性,进行红外对抗场景仿真实验。导弹发射距离分为近距、中距、远距3 种情况,分别对应2~3 km、3~5 km、5~6 km;将导弹水平进入角划分为尾后、侧向、迎头3 种情况,分别对应0°~45°、45°~135°和135°~180°;无人机飞行高度设为中低空、中高空2 种情况,分别对应1.0~2.0 km、2.0~3.5 km。设计验证实验条件时,使近距、中距、远距对应的实验样本数之比为1 ∶3 ∶1,使尾后、侧向、迎头对应的实验样本数之比为2 ∶2 ∶1,使中低空和中高空对应的实验样本数之比为2 ∶3。通过生成随机数的方式,得到100 条对抗实验条件,这些条件在空间中的分布情况如图12 所示。

图12 实验态势分布图Fig.12 Distribution of experimental situation

针对100 条随机对抗实验态势,通过典型态势最优策略集与插值计算方法计算出当前态势的对抗策略,并与传统干扰弹投放策略进行对比,当来袭导弹从尾后攻击时,远距时采用多点源干扰弹,中近距时采用强点源干扰弹;侧向攻击时,采用强点源干扰弹;迎头攻击时,采用多点源和强点源干扰弹组合使用。

对传统干扰策略采用同一态势下同一投放干扰弹数量进行仿真实验,部分仿真数据如表3 所示,以实验结束时脱靶量大于导弹杀伤半径作为干扰成功标准,统计100 条实验态势与其对应策略仿真结果,传统策略的干扰成功率为59%,本文决策模型的干扰成功率为87%,验证了决策包的有效性。

表3 仿真数据(部分)Tab.3 Simulation data(partial)

5 结语

本文提出一种面向典型对抗态势的自主干扰决策模型,设计红外对抗样本库,并结合遗传算法进行寻优,得到最优典型态势策略集;通过线性插值、综合复杂度与对抗态势和对抗决策之间的映射模型,得到针对不同对抗态势近乎最优的对抗策略方案,并创建决策模型。通过仿真实验,验证了本文决策模型的可行性和有效性。

本文通过非典型态势的策略迁移模型计算发现决策与对应态势最优对抗决策有一定的偏差,后续工作中,将寻找更为优秀有效的计算模型,使一般态势可以得到更优秀的决策模型。

猜你喜欢
点源态势复杂度
2019年12月与11月相比汽车产销延续了增长态势
汇市延续小幅震荡态势
我国天然气供需呈现紧平衡态势
一种低复杂度的惯性/GNSS矢量深组合方法
关于脉冲积累对双点源干扰影响研究
静止轨道闪电探测性能实验室验证技术研究
求图上广探树的时间复杂度
基于标准化点源敏感性的镜面视宁度评价
某雷达导51 头中心控制软件圈复杂度分析与改进
县乡一体化探索呈加速态势