基于深度学习的空空导弹多类攻击区实时解算

2020-02-06 00:30闫孟达杨任农左家亮胡东愿岳龙飞赵雨

兵工学报 2020年12期

闫孟达，杨任农，左家亮，胡东愿，岳龙飞，赵雨

(空军工程大学空管领航学院，陕西西安 710051)

0 引言

空空导弹在现代空战中起着至关重要的作用，能否有效发挥空空导弹的性能，往往会左右空战的胜负。空空导弹攻击区是空战时能否发射导弹的前提条件[1]，是机动决策的重要依据，也是未来无人机空战的决策依据[2]。文献[3]根据空空导弹攻击区和目标最小逃逸区建立了多机空战仿真系统的交战规则。为了使攻击区能更好地指导攻击机进行攻击决策，文献[4]和文献[5]按目标规避形式对空空导弹攻击区进行了分类，但没有解算每一类攻击区距离具体的数值。文献[6]研究了目标强机动对空空导弹攻击区距离的影响，但随着现代空战的发展，尤其在超视距空战中，强机动并不是规避中远距空空导弹最有效的机动形式。因此，研究适应现代超视距空战的空空导弹攻击区至关重要。

攻击区信息是空战态势中极为重要的组成部分，现代空战期望最大限度地发挥导弹的性能，以及更准确地掌握空战态势，对空空导弹攻击区解算的准确性和实时性的要求越来越高。常见的导弹攻击区解算方法有模拟计算法[7-12]、查表插值法和拟合法[13-15]。模拟计算法是指通过弹道仿真模拟导弹发射从而计算导弹攻击区的方法。该方法通常较为准确，但运算时间较长，无法满足实时性。为了提高模拟计算法的实时性，近年来学者们开展了许多相关的研究工作。文献[7]提出了基于背景插值的在线模拟方法，该方法需要预测下一时刻的态势，并且攻击区误差受态势预测误差的影响。文献[8]提出了平移数值算法，但该方法仍需要提前读取标准攻击区数据表。查表插值法是工程实践中常用的方法之一，该方法的精度受机载计算机存储容量以及预装数据量的影响。拟合法主要包括多项式拟合法和神经网络拟合法，多项式拟合由于存在形式及系数难以确定的弊端，近年来相关研究较少。随着深度学习技术的飞速发展，神经网络拟合法成为当前的研究热点。文献[13]利用深度自编码器网络研究了地空导弹发射区的拟合算法，但存在拟合精度不高的问题，且空空导弹攻击区的应用环境要比地空导弹更加复杂。文献[14]利用反向传播(BP)神经网络计算目标大机动与不机动时的空空导弹攻击区，但没有更细致地研究其他条件下的攻击区，且没有考虑实时性的问题。

用各种条件下的空空导弹攻击区表征空战态势是一种有效的空战手段，可以预见，未来对空空导弹攻击区的划分将会越来越细致。然而上述各种方法单次运行只能解算一种攻击区，无法同时解算多种攻击区，因此运算量会随着攻击区种类的增多而成倍增加。

本文利用深度神经网络相关方法建立了一种多函数深度拟合网络(MFDFN)，并提出了一种与之相适应的“整体预训练+局部微调”训练策略，整体预训练体现多函数的融合特征，局部微调体现函数之间的差异性。采用“整体预训练+局部微调”训练策略的MFDFN，其优势主要有以下两方面：

1)准确性。由于融合利用了多函数的数据特征，使得MFDFN的拟合准确度能逼近甚至超越具有相同网络结构的单输出网络。

2)实时性。在不增加网络规模的前提下，实现了用一个网络应对多种攻击区距离的解算，因此运算量相比单输出网络大大减少，实时性要优于多个串行运算的单输出网络，且拟合攻击区种类越多、优势越明显。

1 问题描述

1.1 空空导弹攻击区

空空导弹攻击区一般包含发射包线和杀伤包线两种[16]。发射包线是以目标机为中心的一个空间区域，我方飞机在不同方位发射导弹，能以不低于一定概率命中目标。发射包线体现的是以目标机为中心、我机在不同方位对目标机的杀伤范围，对于超视距空战决策的意义不大。杀伤包线是以我机为中心、位于我机正前方的一个扇形区域，假设目标机保持当前运动状态，我方导弹能命中目标机的目标机最远初始位置[5]。超视距空战主要关注的是目标机相对我机的距离和方位，因此空空导弹杀伤包线对于空战决策而言更具研究价值。典型空空导弹杀伤包线如图1所示。

图1 典型空空导弹杀伤包线示意图Fig.1 Typical envelope of air-to-air missile

1.2 空空导弹攻击区划分

传统的攻击区模型有三线：最大攻击区、不可逃逸攻击区和最小攻击区[6]。传统三线攻击区的划分较为粗略，只能提供导弹发射的限度，已不适应现代空战决策的需求，因此需要对攻击区进行更为细致的划分。

在超视距空战中，影响空战态势的因素主要是相对距离和相对方位。由于相对距离较远，短时间内的大过载复杂机动并不是最有效的规避方式。文献[17]研究了被攻击机的动态安全逃逸区问题，结果表明被攻击机的逃逸转弯角度是影响导弹末端性能的重要因素。因此，对超视距空战而言，影响中远距导弹性能的有效机动类型是进行持续转弯机动后逃逸达到消耗导弹末端能量的目的。根据这个原则，按照目标机逃逸角度将攻击区划分为以下5类：1)最大攻击区，即目标不做机动时导弹的最远攻击距离；2)50°攻击区，即目标做水平转弯50°机动后逃逸时导弹的最远攻击距离；3)90°攻击区，即目标做水平转弯90°机动后逃逸时导弹的最远攻击距离；4)水平不可逃逸攻击区，即目标做水平置尾机动后逃逸时导弹的最远攻击距离；5)最小攻击区，与传统定义相同，主要与引信解除保险时间等因素有关。本文定义的攻击区划分示意图如图2所示。

图2 攻击区划分示意图Fig.2 Division of attack zone

由于在实际空战中最小攻击区的作用主要是提供导弹发射的最小限度，对空战决策意义不大，本文暂不计算最小攻击区的数值，主要研究前4种攻击区。

2 空空导弹攻击区训练样本解算方法

2.1 空空导弹参数模型

空空导弹参数模型建立在载机机体坐标系Oxyz下，影响空空导弹攻击区的参数主要有载机高度和速度、目标高度和速度、目标机动、目标进入角和导弹离轴角[14]，即

R=R(Ht,Ha,vt,va,Nz,Ny,Qz,Qy,φz,φy)，

(1)

式中：Ht、Ha分别为目标机和载机高度；vt、va分别为目标机和载机速度；Nz、Ny分别为目标水平机动类型和垂直机动类型；Qz、Qy分别为目标水平和垂直进入角；φz和φy分别为导弹水平和垂直离轴角。

本文对以上导弹模型做以下3点简化：

1)设定的目标机机动类型均在水平面内，不考虑目标机垂直机动；

2)默认载机和目标机水平飞行，只考虑水平进入角，不考虑垂直进入角；

3)研究的导弹类型为中远距主动雷达制导空空导弹，默认导弹离轴角为0°，即导弹初始速度方向与载机速度方向相同。

从而有

R=R(Ht,Ha,vt,va,Nz,Qz).

(2)

针对本文研究的攻击区特点，为了更好地体现态势信息，建立载机机体坐标系Oxy和目标机坐标系Otxtyt如图3所示，将目标进入角用目标相对方位角α和目标相对航向角φ来表示。

图3 机体坐标系下进入角、航向角及方位角关系Fig.3 Relationship among entry angle，heading angle and azimuth angle in attacker coordinate system

目标相对方位角α定义为：载机机体坐标系下，载机与目标连线和载机机头方向的夹角，规定左偏为负、右偏为正。

目标相对航向角φ定义为

φ=φt-φa，

(3)

式中：φt为目标机航向角；φa为载机航向角。

由图3可得目标水平进入角、目标相对航向角以及目标水平方位角三者之间的关系为

Qz=φ-α，

(4)

则本文计算导弹攻击区的模型为

R=R(Ht,Ha,vt,va,Nz,φ,α).

(5)

根据目标6自由度运动学模型以及动力学模型设定好目标机动类型N，结合弹目相对运动模型以及导弹模型，建立飞行对抗及弹道仿真过程。(Ht,Ha,vt,va,Nz,φ,α)作为态势参数输入，目标机动类型N分别设定为：不机动、50°水平转弯机动、90°水平转弯机动以及水平置尾逃逸机动，利用改进的进退法搜索计算出相应的攻击区距离。

2.2 仿真终止条件

本文进行飞行对抗及弹道仿真时采用如下终止判定条件：脱靶量、弹上能源工作时间和弹目相对运动速度以及导弹末端速度。其中：

脱靶量d是指导弹在飞行过程中与目标的最小相对距离。本文设定脱靶量满足如下条件时导弹命中：

d≤12 m.

(6)

导弹飞行时间t需要小于弹上能源工作时间。本文设定弹上能源工作时间为120 s，即

t≤120 s.

(7)

导弹末端的弹目相对运动速度vm,t应该大于要求的最小相对运动速度，本文设定为150 m/s，即

vm,t≥150 m/s.

(8)

导弹末端的运动速度，即无推力段的速度vm需大于要求的最小速度400 m/s，否则导弹失控，即

vm≥400 m/s.

(9)

本文将以上4个条件作为一次弹道仿真的终止判定条件。

2.3 改进的进退法解算流程

进退法的基本思想是从某一点出发，按一定步长确定函数值呈“高- 低- 高”的三点，如果一个方向不成功就退回来，再沿相反的方向寻找[8]。进退法有搜索精度高、不易陷入死循环的优点，但其搜索速度相对较慢。因此本文结合攻击区的解算特点对进退法进行以下3点优化和改进：

1)优化起始搜索点，先进行一次弹道仿真，根据此时脱靶量设置进退法的起始点。

2)将脱靶量作为搜索条件，设定一个脱靶量需要满足的较小范围，作为搜索的期望目标。

3)定步长与变步长结合，设定一个较小的定步长，并将每一次弹道仿真的脱靶量乘上一个系数作为变步长。这是因为在搜索步长中引入脱靶量可以极大地提高搜索速度。

改进进退法的搜索流程框图如图4所示。图4中，D0为第1次攻防对抗弹道仿真的初始距离，D为进退法搜索起始距离。

图4 改进的进退法计算流程图Fig.4 Flow chart of improved advance-retreat method

其中最后一步输出D之前减去0.5倍的脱靶量，是为了进一步控制误差。

利用上述攻击区解算方法对态势参数进行等间隔采样，构建攻击区样本库。采样间隔和区间如下：

目标机速度和载机速度：采样区间为v∈[190 m/s，330 m/s]，采样间隔Δv=30 m/s；

目标机高度和载机高度：采样区间为h∈[1 000 m，12 000 m]，采样间隔Δh=1 000 m；

目标机方位角：采样区间为α∈[-60°，60°]，采样间隔Δα=20°；

目标机相对航向角：采样区间为φ∈[0°，180°]，采样间隔Δφ=45°，根据对称性，φ∈[-180°，0°]范围内的攻击区距离可由方位角取相反数直接获得，因此φ∈[-180°，0°]范围内不需要采样。

根据以上参数采样规则，每一种攻击区距离得到126 000个数据，即攻击区样本库的维度为(126 000，4)。

3 MFDFN模型

3.1 代价函数及训练策略

深度学习中的拟合问题常用二次损失函数，本文研究的MFDFN要同时拟合4种攻击区距离，则有如下4个损失函数：

(10)

式中：Li为拟合第i种攻击区对应的损失函数，i=1，2，3，4；i为预测值；yi为样本值。

对于m个样本，则分别有代价函数：

(11)

式中：Ji为组合代价函数J的子代价函数。

基于以上4个代价函数，定义组合代价函数为

(12)

式中：等号右边第2项是L2正则项；λ为正则化系数；w为网络权值矩阵；μi为每个子代价函数的权重，不同的权重分配会使组合代价函数有不同的倾向性，从而体现不同的信息特征。

根据多函数拟合问题的特点，本文设计一种“整体预训练+局部微调”多函数拟合网络训练策略(见图5)，在挖掘共性基础上体现不同函数之间的差异性。图5中：xj为网络输入，j=1，2，…，6；w1为第1层网络权值，w2为第2层网络权值；b1为第1层网络偏置，b2为第2层网络偏置；wni为网络输出层n对于第i个输出的权值；bni为网络输出层n对于第i个输出的偏置。

图5 MFDFN及训练策略示意图Fig.5 Multi-function deep fitting network and training method

与深度学习中经典的“预训练和微调”不同，本文提出的“整体预训练+局部微调”是在同一次训练过程中，目的是优化最后一层网络的参数，更好地表征不同输出量之间的差异性。而经典的“预训练和微调”主要是应用在网络的迁移学习中，二者应用目的、应用时机和场合都不相同。本文提出的“整体预训练+局部微调”方法具体包含如下2个步骤：

步骤1进行第1次前向传播，得到组合代价函数J，利用组合代价函数计算网络各个隐含层参数的梯度，进行一次反向传播，更新网络参数。

步骤2进行第2次前向传播，得到4个子代价函数Ji，计算各个子代价函数Ji对最后一层网络参数wni和bni梯度，并更新参数wni和bni的值，其余参数不改变。

训练策略的参数更新传播流程图如图6所示。该训练策略中，一次完整的迭代实际上包含了两次前向传播、一次BP以及一次反向局部微调。第1次BP利用的是组合代价函数，对所有参数进行更新，是网络的基础，体现的是共性。第2次反向局部微调利用的是子代价函数，只更新最后一层的参数，体现的是差异性。图6中：a1为第1层网络输出，a2为第2层网络输出，a3为第3层网络输出；w3为第3层网络权值，w4为第4层网络权值；b3为第3层网络偏置，b4为第4层网络偏置；Δwi为wi的更新量；Δbi为bi的更新量；Δw4i为w4i的更新量；Δb4i为b4i的更新量；y′为网络输出。

图6 “整体预训练+局部微调”训练策略参数更新流程图Fig.6 Flow chart of parameter update in “overall pre-training and local fine-tuning” training strategy

3.2 激活函数

激活函数是神经网络中引入非线性特征的关键所在，对网络的性能有很大影响。常用的激活函数主要有Tanh函数、Sigmoid函数以及修正线性单元(ReLU)函数。Tanh函数、Sigmoid函数容易产生梯度消失[18]，ReLU函数以其运算速度快、不易出现梯度消失的优点被广泛运用[19]。但ReLU函数的最大缺点是输入小于0时会陷入“死区”，为了克服这一缺点，研究人员开发了很多ReLU函数的变体函数。

缩放指数型线性单元(SeLU)是2017年由文献[20]提出的一种激活函数，其特点主要有不存在“死区”、负无穷饱和以及对输出进行了适当放大等。SeLU函数也是ReLU函数的变体，其表达式为

(13)

式中：σ1=1.673 263 242 354 377 284 817 042 991 671 7；σ2=1.050 700 987 355 480 493 419 334 985 294 6，且文献[20]中给出了严格的证明；x为神经元输入。

在本文的数据集上，SeLU激活函数也体现出了其优势。不失一般性，以水平不可逃逸攻击区的数据集为例，使用不同激活函数时的训练效果如图7所示。由图7可以看出，Tanh函数很容易出现梯度消失，过早地陷入了局部最优，ReLU函数训练过程中也有两次陷入局部最优的风险，而SeLU函数的收敛性比较稳定。图8所示为训练4 000代后的误差对比。由图8可以看出，使用SeLU函数时的训练最终误差也要优于ReLU函数。

图7 训练迭代误差下降对比图Fig.7 Reduction in iterative errors among different activation functions

图8 训练4 000代误差对比图Fig.8 Error comparison between ReLU and SeLU after 4 000 iterations

4 模型建立

在对网络进行训练之前，需要对输入数据进行归一化，以消除量纲的影响，即

(14)

式中：xi为原始数据；x′i为归一化后的数据；xmax为x的最大值；xmin为x的最小值。

为了衡量网络的拟合误差表现，对于拟合问题通常用到3个指标，即平方根均方误差RMSE、平均相对误差MAPE和平均绝对误差MAE，定义如下：

(15)

4.1 确定网络结构

深度神经网络的规模即隐含层数和节点数，对网络的性能有直接的影响。一般地，网络规模越大，网络提取特征的能力和逼近能力就越强，理论已经证明，不限制节点数的BP神经网络可以任意精度逼近一个非线性连续函数。但大规模的深度网络会使得训练变得困难[21]，且算法复杂度大幅度增加。考虑到攻击区解算问题的特点，需要在保证模型精度基础上，尽可能减小网络规模，降低算法复杂度。

为验证不同网络结构的性能，用随机抽取的方法将样本库划分为训练集、验证集和测试集，比例设定为8∶1∶1.由于深度神经网络中更深的隐含层代表更高维的特征[22]，更高维的特征数量往往也更少，按照隐含层节点数层层递减的原则，采用手动搜索方式确定网络结构，根据模型在验证集上的表现来调整网络结构。不失一般性，采用水平不可逃逸攻击区数据进行网络结构实验。图9所示为不同网络结构在验证集上的拟合误差对比。图9中图例表示1～4层隐含层节点数，如“200-50”表示2层隐含层，节点数分别为200和50.

图9 不同网络结构性能对比图Fig.9 Comparison of networks with different architectures

由图9中的对比可以得出：

1)网络性能会随着隐含层神经元个数增加而提高，但当神经元个数超过200时，网络性能提升并不明显；

2)网络隐含层数小于3时，收敛性不稳定，有陷入局部最优的风险；但网络隐含层数大于3时网络性能没有明显提升。

鉴于以上两点，再考虑到控制网络规模不易过大，综合考虑网络收敛性以及最终误差，本文确定网络隐含层数为3层，网络结构为6-200-100-50-4，即6个输入量，4个输出量，中间3层隐含层，节点数分别为200、100、50.

4.2 组合代价函数权重确定

在本文提出的“整体预训练+局部微调”训练策略中，整体预训练利用的是组合代价函数，因此组合代价函数的权重是一组非常重要的参数。

权重调整过程如图10所示。由图10(a)～图10(e)可见，首先对权重进行粗调。权重比为1∶1∶1∶1时，网络对4类攻击区的拟合表现较为均衡；权重比为1∶1∶1∶7时，网络对后3种攻击区的拟合效果非常好，仅对第1种攻击区拟合效果较差，之后在以上两种权重比基础上进行微调，如图10(f) ～图10(i)所示。图11所示为不同情况下网络在验证集上的误差对比。综合考虑网络对4类攻击区的拟合效果，确定组合代价函数的权重比为3∶2∶2∶3.

图10 组合代价函数权重选择过程示意图Fig.10 Selection process of combined cost function weights

图11 组合代价函数不同权重训练4 000代后验证集误差对比图Fig.11 Error of validation set after 4 000 iterations between different weights in combined cost function

4.3 其他参数设置

1)Adam算法常用参数。本文采用Adam算法[23]更新网络权值和偏置，文献[23]中分析证明了Adam算法具有较强的收敛稳定性，故本文采用Adam算法的常用参数设置：β1=0.9，β2=0.999，ε=10-8. 其中，β1为一次估计指数衰减率，β2为二次估计指数衰减率，参数ε的作用是防止算法运行过程中出现0.

2)学习率。由于在Adam算法中引入了自适应学习率，初始学习率不需要设置太大，本文设置初始学习率η=0.001.

3)Batch size. 对于数据集规模较大的深度学习问题，常采用小批量梯度下降，即每次训练不是放入全部训练样本，而是把样本分成一个个较小规模的Mini-Batch，每训练一个Mini-Batch计算一次梯度，以提高网络收敛速度。

理论上，Batch size越小，网络收敛速度越快，但同时花费的训练时间也越长。因此折衷考虑，本文设置Batch size为1 024.

5 实验结果及分析

实验硬件平台为Inter(R) Core(TM) i7-8750H CPU 2.20 GHz，16 GB RAM，NVIDIA GeForce GTX1060 6 GB；软件平台为Visual Studio 2010，python3.6，tensorflow1.14.0.

5.1 攻击区划分有效性验证

本文的攻击区划分模型以目标机水平转弯角度为标准，在实战中目标机可能同时进行垂直面的机动。俯冲降高是有效压缩对方导弹攻击区的有效机动方式，但由于低空阻力大，目标机的导弹攻击区缩减更为严重，不利于进行反击，很容易陷入持续的被动，因此在超视距空战中目标机通常不会进行大幅度降高。设定目标机俯角为10°，即目标机动形式为：先进行水平转弯机动，之后持续逃逸并同时进行俯角为10°的俯冲机动，以此验证攻击区的有效性。将攻击区域分别用Ω1、Ω2、Ω3、Ω4表示，如图12所示。

图12 攻击区划分示意图Fig.12 Division of attack zone

在攻击区数据样本库中随机选取1 000条，即1 000种态势下的攻击区数据。在每一种态势下，分别在攻击区域Ω1、Ω2、Ω3、Ω4内随机取5个敌我相对距离D，进行攻防对抗弹道仿真，即对于每一个区域，共进行5 000次仿真实验，命中率统计如表1所示。由表1可以看出，在较远距离的Ω1、Ω2范围内，目标通过机动有很大概率可以摆脱导弹，而在Ω3、Ω4范围内导弹的命中率有所提高。这与实际空战的规律是相符的，在敌我相对距离较远时，发射的前两枚导弹的战术目的大于毁伤目的，使我机在相对距离拉近时能占据有利态势，此时发射导弹能以较高的概率命中目标。因此，本文划分的攻击区模型能在超视距空战由远及近的过程中有着更清晰的战术指导意义。

表1 不同攻击区域命中率统计

5.2 模型准确性分析

为验证5.1节建立的MFDFN模型的拟合准确性，用样本库的训练集在模型上训练4 000代，用测试集评估模型的拟合效果。训练4 000代之后，模型在测试集上的整体误差如表2所示。

表2 训练4 000代后网络在测试集上的整体误差

由表2可以看出，网络对每一种攻击区的拟合误差都比较小。总体来看，平均相对误差仅有0.27%，平均绝对误差仅有58.81 m，说明网络具有较高的拟合准确度。

下面考察网络对于每个样本个体的拟合效果。由于测试集样本数较多，图12中仅展示了测试集中前100个样本的拟合值与理论值的对比。由于抽取样本时是随机的，前100个样本的特征可以在一定程度上代表整体特征。从图12中可以看出，网络对4类攻击区均有着较好的拟合效果，大部分拟合值与样本值基本重合。

相对误差百分比是评价攻击区拟合算法准确性的一个重要指标，表3中统计了4类攻击区拟合值的相对误差百分比分布，并绘制在直方图中(见图13)。

表3 网络拟合值的相对误差百分比统计

图13 网络拟合值与样本值对比Fig.13 Comparison between fitted value and sample value

由表3可以看出，网络对4类攻击区的拟合相对误差小于0.5%的比例为98.20%，相对误差小于1.0%的比例为99.98%，证明了网络的拟合准确性是稳定的。拟合相对误差百分比统计图如图14所示。

图14 拟合相对误差百分比统计图Fig.14 Relative error statistics of fitting value

5.3 模型实时性分析

为了分析模型的实时性，将单输出拟合网络作为对比。首先建立一个结构为6-200-100-50-1的单输出网络，其余参数设置与前文所述相同，针对4种攻击区，将样本库拆分成4个维度为(126 000，1)的样本库，分别对上述单输出网络进行训练，得到4个训练好的单输出拟合网络，分别对应最大攻击区、50°攻击区、90°攻击区以及水平不可逃逸攻击区。

1) 训练实时性。MFDFN和单输出拟合网络的训练时长对比如图15所示。

图15 不同网络训练时间对比图Fig.15 Training time comparison of different neural networks

由图15可以看出，MFDFN的训练时间虽然比单个单输出网络的训练时间长，但由于单输出网络要训练4次，总体上MFDFN减少了一定的训练工作量。

2) 应用实时性。在仿真环境中实际应用时，MFDFN、单输出拟合网络以及弹道解算模型三者运行时间对比如表4所示。

表4 不同模型运行时间对比

由表4可以看出，弹道仿真解算的单次运行平均时间为1.371 s，算出4个攻击区距离平均时间为4.741 s，不满足实时性要求。深度神经网络模型单次运行时间为0.015 6 s，相比弹道仿真减少了2个数量级，能更好地满足实时性要求。MFDFN与单输出拟合网络的单次运行时间基本相同，其优势在于一个网络就能解算出全部的攻击区距离，因此总时间大约为单输出网络的1/4～1/3. 理论上，需要解算的攻击区种类越多，MFDFN的实时性优势越明显。

5.4 多函数拟合网络模型有效性验证

为验证本文MFDFN模型以及“整体预训练+局部微调”训练策略的有效性，将单输出拟合网络以及不采用“整体预训练+局部微调”训练策略的多函数拟合网络作为对比，进行实验分析。3种网络训练4 000代之后的误差对比如图16所示。

图16 3种网络拟合效果对比图Fig.16 Fitting errors of three different neural networks

由图16可以看出，不采用“整体预训练+局部微调”训练策略的多函数拟合网络的拟合误差最大，对于4类攻击区的拟合误差均大于单输出网络的拟合误差。采用“整体预训练+局部微调”训练策略的MFDFN拟合误差明显减小，最大攻击区和90°攻击区的拟合误差十分逼近单输出网络的误差，而50°攻击区和水平不可逃逸攻击区的拟合误差甚至要优于单输出拟合网络，表明本文提出的“整体预训练+局部微调”训练策略一定程度上挖掘了4个函数之间的内在联系，利用了多函数拟合的信息优势，在不增加网络规模、减少训练成本的同时，能达到比单输出拟合网络更好的训练效果。

6 结论

本文研究了超视距空战背景下空空导弹攻击区的划分和解算问题，提出了空空导弹五类攻击区划分模型，根据深度学习理论提出了MFDFN模型以及“整体预训练+局部微调”训练策略。得出以下主要结论：

1) 所提攻击区模型根据目标机逃逸角度将攻击区进行划分，能更好地适应现代超视距空战决策的需求，为飞行员提供更有效的决策依据。

2) MFDFN网络结合提出的“整体预训练+局部微调”训练策略，可以较好地解决多类攻击区的实时解算问题。相比传统的单输出拟合网络，在拟合准确性和实时性两方面都具有一定优势。

本文在划分攻击区时仅考虑了目标机的水平面机动，没有对垂直面机动进行详细的定量分析。如何统筹考虑水平机动和垂直机动且不增加算法复杂度还需要进一步研究。