意图驱动的防空武器-目标动态分配方法*

2024-01-18 10:23宋亚飞夏智权
火力与指挥控制 2023年12期
关键词:敌机敌方防空

丁 鹏,宋亚飞*,夏智权

(1.空军工程大学防空反导学院,西安 710051;2.解放军93126 部队,北京 100875)

0 引言

科技水平的飞速发展,极大推动了武器装备的多样化、智能化发展。在现代防空作战中,武器的价值、性能各有不同,如何结合武器性能和目标特点确定最科学、最合理的武器-目标分配(weapon-target assignment,WTA)策略是制胜强敌的关键。因此,迫切需要找到一种WTA 规则,为防空作战指挥决策提供可靠依据[1-3]。

近年来,为了满足武器目标分配决策需求,在军事领域开展了大量相关研究。文献[4]将WTA 与交叉熵-遗传算法结合起来,构建离散概率分布矩阵,使得矩阵满足武器- 目标分配方案,进而根据矩阵得到解的多个样本,并通过实验验证了其有效性。文献[5]构建了一个地面目标攻击WTA(GTAWTA)模型,并设计了一种基于遗传算法的变量值控制方法,以解决一些智能算法由于问题的规模大,而在解决GTA-WTA 问题时太慢或无法获得可行解的问题。LIU 等研究了多个拦截器协同攻击多个地面目标时的多目标分配问题,最大限度地提高攻击效率,根据攻击效能的优势建立了有效合理的适应度函数[6],并提出了一种自适应模拟退火粒子群优化算法,该算法可以提高收敛速度,克服粒子群算法容易陷入局部极值的缺点。文献[7]提出了一种多阶段攻击WTA 方法,结合覆盖状态和覆盖层数,提出了一种多阶段攻击规划方法,建立了多阶段攻击目标函数模型。对交互式防御作战场景进行了仿真,比较了传统WTA 方法和多阶段WTA 方法,并用蒙特卡洛方法验证了目标函数模型。文献[8]根据多种武器与敌方目标之间的战术关系,提出了一种指标函数,建立了多拦截器的目标分配模型,设计了一种改进的混合粒子群优化算法,采用线性加权递减法,来解决全局搜索能力与收敛精度之间的矛盾。仿真结果表明,所设计的算法能够较好地解决多种武器的目标分配问题。文献[9]通过鲸鱼优化算法解决了WTA 问题,并通过引入自适应变量调整位置更新过程,对鲸鱼优化算法进行了改进,实验表明模型提高了分配收益和分配速度。文献[10]考虑了具有自适应分组和视场角度约束的拦截多目标的武器目标分配问题。针对影响分配效率的因素,提出了一种武器-目标分配方法,以实现对所有目标的有效拦截,避免导弹的过度分配。仿真结果验证了该策略具有令人满意的性能。

上述方法都是以我方的防空行动作为主观角度,对于敌方则是仅考虑敌方目标的被动属性,如敌方武器的价值、敌我距离、敌机飞行高度等等。事实上,态势智能认知是分配决策的关键,认知的核心在于对敌方意图的准确判断和对战场变化的迅速理解,从而才能作出准确的预测和决策,并规划和实施有效的作战行动。在防空作战中,受目标特性、对抗环境、拦截资源等因素的影响,战前筹划难以满足实时变化的战场环境,迫切需要在战中根据实时战场态势进行临机规划,目标意图从本质上反映了目标“想干什么”,对实时态势具有重要影响,是武器-目标分配必须考虑的关键因素。因此,本文从防空作战武器- 目标分配对于目标意图识别的迫切需求出发,研究意图驱动武器-目标分配的机理,探索空中目标的意图识别方法,为武器- 目标分配提供智能支撑,提出一种意图驱动的防空作战动态武器目标分配模型。

本文重点研究了防空作战动态武器- 目标分配需求分析、意图驱动武器-目标分配的机理、基于深度学习的空中目标作战意图识别方法、基于意图识别的动态武器-目标分配方法。

1 问题描述

作战意图通过影响实时态势来服务于动态任务规划,作战意图驱动武器-目标分配是将信息优势转化为决策优势的重要抓手和实现途径,也是军事智能化转型的有力牵引。

在防空作战中,各种类型的地空导弹构成了我方的作战力量,多种多样的战机构成了敌作战力量,由于它们的价值和打击能力存在差异,瞬息万变的战场环境也在很大程度上影响战局,敌方采取的不同作战行动对于我方决策至关重要。然而,通过军事专家的作战经验判断进行武器目标分配的方式,存在速度慢、准确率难以保证的问题,因此,迫切需要通过提取相应战场环境信息、敌我目标的静态属性和实时动态信息分析建模,识别出敌方不同作战单元的意图,进而科学合理地确定武器目标分配方法。本文首先通过空中作战意图数据集训练BiLSTM-Attention 网络[11-12],使模型能够准确识别出敌机作战意图,然后根据敌不同作战飞机的意图以及敌机的被动属性、我方武器属性、战场环境信息和实时动态信息,建立意图驱动的武器目标分配模型(intent-WTA),通过费用流算法得到最优的分配方案[13]。模型结构如图1 所示。

图1 武器-目标分配模型结构Fig.1 Weapon-target allocation model structure

1.1 目标特征空间描述

在目标分配过程中,在能够完成防空任务的情况下,敌我武器的价值和武器目标分配方案高度相关,即希望用最小的打击成本,获得最大的打击收益,期望我方武器价值的最小化以及击落敌机价值的最大化。

从命中率的角度看,应当尽可能使用命中率最高的武器来打击敌对我威胁度最大的战机,例如识别出的意图为进攻的战机等,对于识别出掩护意图等对我方威胁程度较小的敌机,可以次要考虑。

我方防空作战所需要的时间成本也是不可忽视的影响因素,如果拦截时间过长,可能导致在拦截成功之前敌机已经达到作战任务。影响时间成本的因素主要有敌机高度、敌我距离,即敌不同战机和我方不同防空力量之间的距离、敌机的飞行速度和我方导弹的飞行速度,为简化起见,本文使用敌我距离和我方导弹飞行速度。

根据文献[14],对于空中敌目标意图识别的特征空间,使用{敌机飞行高度、敌我距离、敌机飞行速度、敌机飞行加速度、航向角、方位角、对空雷达状态、对海雷达状态、敌机类型、机动类型、干扰状态}11 维特征向量。

因此,本文建立的动态武器-目标分配特征空间如图2 所示。包括{敌方武器价值、我方武器价值、我方武器命中率、我方导弹飞行速度、敌机飞行高度、敌我距离、敌机飞行速度、敌机飞行加速度、航向角、方位角、对空雷达状态、对海雷达状态、敌机类型、机动类型、干扰状态}15 维特征向量,并区分为数值型特征与非数值型特征两类。

1.2 目标意图空间描述

战争由于其灵活性,敌机不同作战力量所采取的作战意图存在多样化,本文充分考虑防空作战的特点,针对敌机不同意图对防空武器目标分配的影响,选取了6 种典型的目标意图空间,建立的敌方目标的意图空间包括{突防、佯攻、攻击、侦察、撤退、干扰}。

确定意图空间后,由相关领域专家根据经验确定作战模拟中心得到的作战数据的敌机意图,将专家经验封装成标签来训练BiLSTM-Attention 模型,得到敌机不同作战单元的意图后,以不同敌机对我方的威胁度的方式影响武器目标分配,敌机意图对我方防空作战威胁度由大到小排序为攻击>侦察>突防>干扰>佯攻>撤退。

1.3 武器-目标动态分配描述

防空作战的武器目标分配问题,根据是否考虑时间因素的影响,通常划分为静态武器目标分配模型(static weapon target as-signment,SWTA)和武器目标动态分配模型(dynamic weapon target assignment,DWTA)[15]。SWTA 模型强调在不考虑时间因素的情况下,在单个阶段内一次性求解分配方案,仅将毁伤概率、目标威胁和目标价值等因素作为优化对象,在求解效率上表现较好,但模型过于简单,与作战贴合不够紧密,实战过程中的实用性受限。DWTA 模型则是将分配过程以时间因素划分成多个阶段执行,从而使模型更贴近实战化,更加贴合战场实际。

本文通过采集24 帧的目标特征信息作为一个阶段,识别出敌机本阶段意图,确定本阶段的武器目标分配方案,通过识别下阶段敌机毁伤情况以及敌机意图确定后续分配方案,使模型能够随时结合战场实时情况调整分配方案,实现由意图驱动的动态武器目标分配。

2 模型构建

2.1 基于BiLSTM-Attention 的意图识别模型

为兼顾模型准确率、复杂程度和运行速度,根据采集到的敌机特征,建立BiLSTM-Attention 模型进行意图识别,该模型由输入层、隐含层和输出层3部分组成。

输入层的作用主要是处理数据集中的防空作战数据,并且将处理后的数据输入BiLSTM 层。预处理层将数值型特征数据进行归一化处理,非数值型数据编码后进行归一化处理,以此消除量纲对于模型训练的影响,提高网络收敛速度。对于第x 种特征数据;n 为数据总数。将第x 种特征数据的原始数据值fxi归一化后的结果为,如式(1)所示:

式中,minFx为第x 维特征Fx的最小值;maxFx为第x 维特征Fx的最大值。

将归一化后所得到的数据随机初始化,按8∶2的比例划分为训练集和测试集。

隐含层由BiLSTM 层(LSTM 的基础上引入双向循环机制)、Attention 层(捕捉深层特征的注意力层)和Dense 层(全连接层)3 部分组成[16-18]。

输出层使用softmax 函数通过隐含层的输出转得到可能为各种意图的概率,概率最高的意图即为识别出的敌机意图。具体如式(2)所示:

其中,W 表示权重系数矩阵,b 表示偏置系数向量;yk为输出层的预测标签。

BiLSTM-Attention 意图识别模型的结构如图3所示。

2.1.1 BiLSTM 层

在LSTM 体系中,通过遗忘门、更新门、输出门以及记忆单元实现信息的输入和输出,LSTM 的单元结构如图4 所示。其中,xt表示在t 时刻时的输入特征;ct-1为更新前的神经元;ct为更新后的神经元;ht-1和ht 分别表示前一时刻和当前时刻的输出状态;Γf、Γu和Γo分别为LSTM 结构的遗忘门、更新门和输出门;为候选神经元;σ 为Sigmoid 激活函数。具体如式(3)~式(8)所示,其中,wf、wu、wo、wc为各部分的权重系数矩阵,bf、bu、bo、bc为各部分的偏移系数向量。

图4 LSTM 结构Fig.4 LSTM structure

由于仅仅使用单向的LSTM 只能提取到当前时刻之前的信息,无法学习未来的信息与当前时刻的信息之间的关系。因此,本文引入双向循环机制,提高意图识别的准确率。BiLSTM 模型结构图如下页图5 所示。

图5 BiLSTM 结构Fig.5 BiLSTM structure

具体如式(9)~式(11)所示:

2.1.2 Attention 层

为使结构能关注敌机众多特征中的关键信息,提高识别准确率,本文在BiLSTM 层后引入注意力机制。将BiLSTM 层输出的每个状态作为注意力层的输入,通过注意力打分函数,得到注意力分布,加权平均进行汇总得到注意力值作为输出。注意力机制模型结构如图6 所示。

图6 Attention 机制模型Fig.6 Attention mechanism model

式(12)中,st为状态向量;et表示其确定的能量值;wt、bt分别表示第t 个特征向量相对应的权重系数矩阵和偏移系数向量。式(13)的作用是转换注意力状态,使用式(14)计算得到状态向量Y,将得到的状态向量Y 与全连接层整合后,经过softmax 层识别出敌机意图。

2.2 Intent-WTA 模型

2.2.1 作战方式

在防空作战的动态武器目标分配过程中,将敌我双方分别看作作战的主体,敌我双方均为作战的主动方,每个时间阶段我方根据敌意图的改变,以及我方武器的价值、敌机价值敌我距离、命中概率等因素,确定当前阶段的静态武器目标分配,按时间要素将不同阶段的静态武器目标分配进行组合,从而实现动态武器目标分配,完成作战任务。本文基于以上考虑,提出了意图驱动的武器-目标分配模型(intent-WTA)。

一般情况下,分配过程包括4 个要素:1)作战双方,即我方武器和敌方目标;2)策略集,指的是双方选择的作战策略集合;3)收益函数,指的是我方根据选择的策略获得的收益值;4)均衡解,指的是我方最优策略的组合。如图7 所示,我方武器和敌方目标采取各自的作战策略,经过收益函数计算得到均衡解。

图7 分配过程示意图Fig.7 Schematic diagram of distribution process

2.2.2 收益函数

作战过程中,收益函数要体现我方的目标尽可能击落敌方价值最高的目标、对我方威胁度最大的目标以及距离我方最近的目标,同时也要考虑我方武器代价、命中率的高低对我方取得收益的影响[19]。

假设一次防空作战中,我方武器有M 个,敌方作战单元有N 个,我方武器的代价集合为D,敌方目标的价值集合为K。

其中,Di表示第i 个武器的代价

其中,Kj表示第j 个目标的价值。

我方不同武器的命中率集合为P。

其中,pi表示第i 个武器的命中率。

因此,我方第i 个武器打击敌第j 个目标的收益函数为:

其中,wj表示敌方第j 个目标的威胁度,由BiLSTM-Attention 模型识别出的敌机意图决定;α,β 为常数,分别是武器拦截时间和武器代价对收益的影响系数;lj表示敌方第j 个目标与我方的空间直线距离;vi表示我方第i 个武器的飞行速度。

考虑对我方威胁较小的敌机,可以通过时刻观察监视来保证我方安全,设置阈值,若所有武器打击敌方的收益值低于阈值,我方则不需要使用武器进行拦截。

我方的收益矩阵为:

本阶段我方武器目标分配收益函数为:

其中,hij有0、1 两个取值。hij=1,表示我方的第i 个武器打击敌方第j 个目标;hij=0,表示我方的第i 个武器没有打击敌方第j 个目标。

2.3 费用流算法

2.3.1 带权二分图的最佳匹配模型

武器目标分配问题根据武器集合和敌方目标集合之间互不相交且各自集合内部不存在分配关系的特点,可以看作带权二分图的最佳匹配问题。G=(G,D,E,C,Z)表示带权二分图模型;W 为我方武器集合;D 为敌方目标集合;E 为所有边的集合;C表示边的容量集合;Z 表示边权集合,即武器打击目标获得的收益值。

二分图的所有匹配中,所含匹配边数最多的匹配,称为二分图的最大匹配,其中,边权和最大的匹配就是最佳匹配,通过费用流寻找带权二分图的最佳匹配获得这一阶段的收益值最大和[20],作为本阶段的武器目标分配策略。

2.3.2 最大费用最大流算法

最大费用最大流问题是运筹学中的一类典型问题。在一个网络中的每条边都有“容量”和“费用”两个参数限制的条件下,试图寻找出从源点到汇点的最优流量分配,可以在流量最大的前提下,达到费用最大的要求。

核心思想是总在费用最大的增广路上增加流值,直到流值达到v。

添加附加源S 和附加汇T,从S 向二分图中的每个武器节点连接一条权值为0、容量为1 的有向边,从二分图中的每个目标节点向T 也连接一条权值为0、容量为1 的有向边。然后把原有的边看作容量为1、权值不变的有向边。求解从S 到T 的最大费用最大流,就能得到该二分图的最佳匹配,如图8 所示。

图8 最大费用流模型Fig.8 Maximum cost flow model

可写成如下规划形式:

其中,xij表示每条边通过的流量;v 表示流值;xjs,xsj分别表示源点流入流出的流量;xjt,xtj分别表示汇点流入流出的流量;xji,xij分别表示中间点的流入流出的流量;cij表示每条边的容量。

最大费用最大流的主要计算步骤为:

Step 1 对网络G=(V,E,C,Z),给出流值为0 的初始流;

Step 2 作伴随此流的增流网络G'=(V',E',Z');

Step 3 若G'不存在S 至T 的路径,则G 的流即为最大费用最大流;否则,用标号法找出S 至T的最长路径P;

Step 4 根据最长路径,在G 上增流;

Step 5 根据计算最长路径时的各顶点的标号值L(v),修改G 中边的权重Z(e);

Step 6 将新流视为初始流,转Step 2。

3 仿真实验分析

3.1 静态目标分配实验

3.1.1 实验环境及参数

通过某作战仿真系统中抓取的10 000 个作战样本作为实验数据,针对每个样本采集连续24 帧包括飞行速度、飞行高度、干扰状态、雷达状态等15个特征维度的作战数据。

实验采用Python 语言,学习框架为Keras,运行环境为Pycharm2021 软件、Win11 系统、RTX3070Ti显卡、16 GB 内存。

针对防空作战敌机作战单元的意图识别,首先通过军事领域专家根据其作战经验编写规则,然后根据专家编写的规则生成全部数据集的意图标签,筛选出明显存在错误的标签后由专家进行修订。专家主要包括在空战领域具有较强的权威和足够多作战经验的飞行员、指战员等,确保了样本标签的准确性和作战实用性。数据集中6 种敌机作战单元的作战意图数据占比情况为攻击意图33.6%、侦察意图19.2%、突防意图18.3%、干扰意图11.2%、佯攻意图7.5%、撤退意图10.2%。样本规模为10 000,随机筛选出8 000 个样本作为训练集,剩余2 000个样本作为测试集,训练集与测试集的比例为8∶2。使用准确率作为指标评价BiLSTM-Attention 模型。实验超参数如表1 所示。

表1 模型主要超参数Table 1 Main superparameters of the model

针对意图识别后的武器目标分配,由空战领域专家根据空战经验确定模型参数,随机选取50 组样本统计最优解次数和运行时间,作为评价武器目标分配模型的指标。

随机选取100 组数据验证静态武器目标分配模型的有效性,通过空战领域专家对模型输出结果的合理性进行评定,以合理度(专家评价为合理的数据占测试数据总数)作为评价模型有效性的指标。

3.1.2 意图识别效果评估

BiLSTM-Attention 模型经训练后对测试集的样本进行测试,实验结果表明,模型在测试集的样本上的准确率达到了97.1%,说明在误差允许的范围内,模型结果可以用于武器目标分配。为了体现识别各个意图存在的误差,表2 为混淆矩阵。

表2 意图识别混淆矩阵Table 2 Confusion matrix of intention recognition

由表2 可知,BiLSTM-Attention 模型可以较为准确地识别出敌机的作战意图,特别是对撤退和干扰意图的识别表现出色,可以达到99%;对于佯攻的识别存在与攻击混淆的情况,考虑是两种意图相似性较高,差别度较小导致的,误差在可以接受的范围内。

能否精确地识别敌机意图对于防空作战成败至关重要,为了更加清楚地表现BiLSTM-Attention模型的有效性,使模型更具有说服力,将BiLSTMAttention 模型与LSTM、BiLSTM、LSTM-Attention 模型在此数据集下做消融实验,模型准确率变化情况如图9 所示。

图9 模型准确率变化情况Fig.9 Changes of model accuracy

由图9 可知,BiLSTM-Attention 模型准确率优于LSTM、BiLSTM、LSTM-Attention 3 种模型,且LSTM的识别准确率要明显低于BiLSTM 和LSTM-Attention,说明了引用双向循环机制和注意力机制对于模型性能提升的有效性。

3.1.3 Intent-WTA 效果评估

为验证费用流在武器目标分配过程中的有效性,选取50 组的样本数据,代入费用流模型,统计最优解的次数以及模型平均运行时间,并与粒子群算法(PSO)、文献[21]所用的鲸鱼优化算法(WOA)等智能优化算法和搜索算法进行对比实验,结果如表3 所示。

表3 算法性能对比Table 3 Algorithm performance comparison

从实验结果可知,搜索算法、费用流等精确求解算法求解最优解的效果,明显优于粒子群算法、鲸鱼算法等智能优化算法,但是搜索算法在平均耗时上则是远远大于费用流,特别是在武器数量20×敌机数量20 的分配中,有限时间内无法得到结果,由此可见费用流能够准确、高效地求得武器目标分配的最优解。现代空袭敌机飞行高度低、速度快、暴露时间短,留给指控系统分配决策的时间往往以ms计算,需要争取最快时间进行分配拦截,费用流可以同时满足准确性和实时性的要求。

为验证Intent-WTA 模型的优越性,使用本文所提模型,分别与栈式自编码器(SAE)战术意图智能识别模型、基于LSTM 的战场对敌目标战术意图识别模型搭配粒子群算法(PSO)、鲸鱼算法(WOA)、费用流(Cost Flow)作对比实验,通过选取100 个样本数据对比其合理度,对比实验参数如表4 所示,实验结果如表5 所示。

表4 对比实验参数Table 4 Comparative experimental parameters

表5 对比实验结果Table 5 Comparison of experimental results

由表5 可以看出,Intent-WTA 模型武器目标分配合理度达到了94%,远超过其他模型的组合,较传统SAE+PSO 模型提升超过30%,充分展现了Intent-WTA 模型在防空作战武器目标分配中的优越性。

3.2 动态目标分配实验

为体现Intent-WTA 模型对于防空作战的动态武器目标分配效果,本文从样本数据中选取一组连续的动态时序样本,赋予其性能参数进行模拟动态武器目标分配实验,分析模型有效性。样本数据中共有5 个敌机目标,我方配备5 枚地空导弹武器,90 s 作为一个防空作战阶段。目标相关参数及我方武器相关参数如表6 和表7 所示。

表6 目标相关参数Table 6 Target parameters

具体模拟实验过程如下:

第1 阶段:敌机1 对我方发起进攻,由敌机2和敌机3 执行侦察任务,敌机4 和敌机5 执行干扰任务;我方使用导弹3 拦截敌机1,导弹1 拦截敌机2,导弹2 拦截敌机3,敌机4 和敌机5 收益值未达到阈值,因此,不进行拦截。

第2 阶段:敌机1 和敌机2 被我方击落,敌机3对我方发起进攻,敌机4 执行突防任务,敌机5 执行干扰任务;我方使用导弹3 拦截敌机3,导弹4 拦截敌机4,敌机5 收益值未达到阈值,因此,不进行拦截;

第3 阶段:敌机1~敌机3 被我方击落,敌机4执行突防任务,敌机5 撤退;我方使用导弹1 拦截敌机4,敌机5 收益值未达到阈值,因此,不进行拦截;

第4 阶段:敌机1~敌机4 被我方击落,敌机5撤退,防空作战结束。

实验结果如表8 所示。

表8 动态武器-目标分配实验结果Table 8 Experimental results of dynamic weapon-target allocation

由实验结果可知,Intent-WTA 模型对于识别到意图为攻击的敌机优先考虑拦截,准确体现了防空作战任务的特点,对于识别到作战意图为干扰等威胁度较低的敌机,采取的应对策略在确保我方安全的前提下节约了武器资源。模型对于防空作战的全过程可以实施动态武器目标分配,随时应对复杂多变的战场局势,高效、准确地满足了作战需求。

4 结论

本文针对防空作战中通过军事专家的作战经验,判断进行武器目标分配的方式存在的速度慢、准确率难以保证的问题,通过分析,认识到敌我作战的过程是一种双方博弈的过程,双方都应当是战争的主动方,敌方采取的作战意图对我方的策略有着至关重要的影响,因此,构建了意图驱动的防空动态武器目标分配模型。通过空中作战意图数据集训练BiLSTM-Attention 网络,将专家经验封装为标签,使模型能够准确识别敌机作战意图,通过挖掘意图以及战场环境信息、敌我目标的静态属性和实时动态信息,对于武器目标分配的影响效果建立Intent-WTA 模型,通过费用流算法得到最优的分配方案。通过进行实验,结果显示模型针对不同的作战情况进行武器目标分配速度快、准确率高,且能够体现防空作战动态博弈的特点。本文模型对于作战的实时交互性还略显不足,采用的固定时间间隔检测,不能做到随时检测战场中敌机意图的变化,这将是下一步研究的重点。

猜你喜欢
敌机敌方防空
少林韦陀十八手
美173空降旅与克罗地亚防空团正在进行实战演练,发射FIM-92毒刺防空导弹
4打5,敌方还剩几个人?
防空营打靶记
冲着敌机,开炮!——M1939式37毫米高射炮
LY-70:防空领域的“变形金刚”
水果大作战
新中国建国后击落入侵敌机大盘点
人工智能有助于处置敌方炸弹
偷架敌机开回家