基于深度学习的战役初始态势认知方法*

2020-05-11 08:11吕学志刘长江
火力与指挥控制 2020年4期
关键词:外线内线态势

吕学志,刘长江,朱 丰

(1.国防大学联合作战学院,北京 100091;2.陆军第九综合训练基地教研部,河北 宣化 075100)

0 引言

在现代联合作战条件下,多源异构海量的战场情报、侦察、监视数据呈现爆炸式增长趋势,已远远超出战役指挥员的态势认知能力。因此,研究战役态势智能辅助分析技术,对辅助战役指挥员全面、深入、高效地把握复杂战役态势,及时有效地作出正确决策,提升作战效能具有重要意义。

认知战役初始态势是战役筹划的前提,对战役进程有着重要影响。如何利用人工智能技术识别战役初始态势是极具现实意义的问题。对于这一问题,战役指挥员通常根据自己的经验知识对敌我战役体系在战役区域中的分布状态和相互关系进行分析判断。在此过程中,很多情况下往往是指挥员“运用之妙,存乎一心”、“只可意会,不可言传”的经验之举,很难通过简单的数据模型进行理论表达和模拟。面对纷繁复杂的战役态势,战役指挥员如何对战役初始态势的经验知识进行建模,以有效获得指挥员的认知经验,是一个亟待研究的重要问题。

国内许多学者将深度学习网络应用到了军事相关领域。张乐等人研究了基于自编码神经网络的装备体系评估指标约简方法,在最大程度确保信息不丢失的情况下,实现了评估指标集的约简化,降低了后续作战效能评估的计算复杂度[1]。李春林、黄月江等人将深度学习方法引入到网络安全方面的入侵检测技术中[2],提出了一种基于深度学习的网络入侵检测方法,使用了大量无标签的数据,明显改善了检测算法的误检率。孙志军等人采用基于深度学习的边际Fisher 分析特征提取算法,提高了雷达识别目际的准确率[3]。周长建等人采用深度学习方法在军事网络态势感知方面作了有益的探索[4]。高晓阳利用深度学习对空天防御态势感知问题进行了研究[5]。朱丰提出了基于深度学习的战场态势高级理解模拟方法[6]。但是,目前利用人工智能技术对战役初始态势认知的研究还比较少见,本文将就此问题展开讨论。

1 战役初始态势

战役初始态势(The Initial Posture of Campaign),是战役开始之前双方战役体系(战役机动部队、战役基地,有时,还有战役防线(要点))在战役区域中的分布状态及其相互关系。对于战役一方来说,是重要的战役环境。

需要说明的是,战役态势的本质是双方的战役体系在确定的时间、确定的空间中的相互关系,而战役体系的主体又是战役力量,因此,战役态势通常通过战役力量、时间和空间3 个要素表现出来。本节中在时间已经确定(即战役行动开始之前)的前提下,战役态势仍然包括了战役力量和空间两个方面。为了简化问题,建立以下假设:双方的战役力量“总体上对称”,力量对比不十分悬殊,可能是2∶1、3∶1 或者4∶1 这些在战役中经常出现的一般情况,但通常不包括20∶1、50∶1 或者100∶1 这些在战役中非常罕见的特殊情况(因为如果是这样,双方在空间上的相互关系就变得不那么重要了)。也就是说,我们研究战役态势时关注的重点是双方之间的空间关系问题。下面关于战役初始态势的研究,都是基于这样一种假设。

由于战役初始态势对战役进程的影响与在该态势中双方战役军团之间距离的关系十分密切,因此,战役初始态势大体上可以区分为远程对峙和近程对峙两类。

1.1 远程对峙

远程对峙战役初始态势,是双方战役体系在相距很远的空间中进行对峙的。在这里,距离上的“远”与“近”与战役体系,尤其是战役军团的机动能力(对于空中战役军团来说,则是其地面部署能力)密切相关。在现代条件下,在陆上,双方战役体系之间间隔了数百至上千千米的距离,在海上、空中,双方战役体系之间间隔了数千千米的距离大体上就可以看作是“远距离”。如果说近代战役初始态势属于远程对峙还不多的话,那么,现代某些陆上(地面)战役,例如第四次中东战争中以军在西奈半岛实施的战役、海湾战争中的地面战役;大多数的海上战役,例如1588 年的英吉利海峡战役、第二次世界大战初期的珍珠港战役、珊瑚海战役、中途岛战役和盟军在北非登陆的“火炬行动”战役;以及某些空中战役,例如第二次世界大战时期的不列颠空中战役、盟军的对德轰炸战役、对日轰炸战役,以及美军对阿富汗塔利班政权实施的空中突击战役等,其战役初始态势就均属于远程对峙。

正如在天文学中,在足够远的距离上,无论多大直径的星球(包括太阳),都只被看作是一个质点一样,远程对峙除了概略地反映战略上的内线与外线关系外,对战役的影响比较简单,主要体现为3个方面:一是实施进攻性战役的一方需要进行远距离的战役机动;二是实施进攻性战役的一方需要建立漫长的战役补给线;三是双方的战役侦察活动组织起来均比较困难(这就是在电子侦察和电子通信出现之前,主动实施战役的一方往往比较容易达成战役突然性的基本原因)。

由于未来战争大多都是局部战争,而且往往只包括一场战役,还由于战役军团机动能力的提高,在现代和未来,远程对峙将成为越来越多战役的战役初始态势。

1.2 近程对峙

近程对峙,是双方战役体系在相距较近的空间中进行对峙的战役初始态势。在现代条件下,在陆上,双方的战役体系间隔在100 km 以内,在海上、空中,双方的战役体系间隔在1 000 km 以内,大体上就可以被看作是“近距离”。近代和现代的大部分陆上(地面)战役,例如第一次世界大战时期的索姆河战役和凡尔登战役,第二次世界大战时期的基辅战役和莫斯科战役,我国解放战争时期的辽沈战役和淮海战役;某些空中战役,例如第二次世界大战期间苏德战争中的库班空中战役和战后几次中东战争中的空中战役,其初始态势均属于近程对峙。

近程对峙的战役初始态势大体上可以通过外线与内线关系体现出来:外线,是一方将对方包围起来的态势;内线,则是一方被对方包围起来的态势。显然,双方的态势是相对的。一方处在外线,对方就处在内线;对方处在外线,该方就处在内线。例如在拿破仑战争中的德累斯顿战役之前,法军处在内线而反法联军处在外线;几次中东战争的战役之前阿拉伯国家军队均处在外线而以色列军队均处在内线;在不列颠空中战役之前德国空军处在外线而英军空军处在内线,等等。

外线与内线的关系还有程度之分。概略地说,大体上可以区分为完全外线与完全内线、典型外线与典型内线和概略外线与概略内线等3 种。完全外线与完全内线是一方将(被)对方完全包围起来的态势,例如我国土地革命战争时期的几次反围剿战役中,国民党军队处在完全外线而红军处在完全内线;日俄战争中旅顺口战役时,日军处在完全外线而俄军处在完全内线;与此相类似的,还有中东阿拉伯国家军队和以色列军队之间发生的多次战役的初始态势;典型外线与典型内线是一方将(被)对方包围,但尚未完全包围的态势,例如第二次世界大战初期的波兰战役、基辅战役和库尔斯克战役,解放战争时期辽沈战役的战役初始态势;概略外线与概略内线则是一方略微呈现出将(被)对方包围的态势,例如第一次世界大战期间的尼维尔战役、马恩河战役和亚眠战役的战役初始态势。进一步说,还可能出现“外线中的内线”和“内线中的外线”这种更加复杂的战役初始态势,这就是:从局部来看,一方的某些部队处在内线,另一方的部队处在外线;但从全局来看,原先处在外线的一方反而处在了内线,而原先有些部队处在内线的一方反而处在了外线。正如解放战争时期豫东战役、孟良固战役之前我军的战役体系与国民党军队的战役体系之间出现的那种初始态势。无疑,上述这些近程对峙的战役初始态势对战役计划、尤其是战役进程发生十分显著的影响。此外,由于地理、海区条件还对战役体系的机动发生显著影响,因此,战役区域中的地理、海区条件也对战役初始态势发生重要的影响[7]。

2 基于深度学习的战役初始态势认知模型构建

图1 战役初始态势认知模型构建步骤

我们研究的目的是让计算机可以模仿战役指挥员来认知战役初始态势。通常,战役指挥员通过理论学习和实践操作对战役初始态势的判断规则有一个认识,然后再根据这些规则对战役初始态势进行区分。然而,战役初始态势涉及众多的因素,人类的判断规则又是模糊的、抽象的,难以用简单的逻辑规则、数学公式描述。深度学习网络为这个问题的解决带来了契机,它可以很容易通过对问题输入、输出的训练学习,来模拟人类认知这种“黑箱”。基于深度学习网络的战役初始态势认知模型的构建主要包括4 个阶段:设计阶段、训练阶段、测试阶段、应用阶段。

2.1 设计阶段

输入与输出数据必须在确定深度学习网络结构之前准备完毕。输入与输出数据的特点又决定了深度学习网络的结构。

2.1.1 输入

输入是认知模型需要的数据与信息。在战役初始态势认知过程中,指挥员需要考虑战役区域中的地理环境、战役体系的分布状态和相互关系。而图像是描述战役区域中地理环境、战役体系分布状态和相互关系的最直观的输入形式。此外,深度学习网络对图像的处理也取得了突破性进展。所以,采用图像来描述战役初始态势是最佳的选择。接下来,需要考虑如何用图像来描述战役初始态势。由于图像是由像素构成的,可以用像素不同的值来代表不同的地理环境、军种、红蓝方等信息。假设,图像的大小为28*28,每个像素取值范围为[0,1];0表示海洋;1 代表陆地;0.2 表示蓝军陆军;0.3 表示蓝军海军;0.4 表示蓝军空军;0.6 表示红军陆军;0.7表示红军海军;0.8 表示红军空军。红蓝方一个像素相当于师规模。建立好这些规则之后,就可以对一些战役初始态势进行抽象了,将其作为模型的原始战役初始态势样本。由于不同战役所处的年代不同,编制体制也不尽相同,部队规模不是很好衡量。我们作了一个简单的假设,10 000 人的陆军部队相当于1 个师,100 架飞机相当于1 个空军师,1 个航母编队相当于1 个海军师。图2 是斯大林格勒战役的初始态势图。图3 是利用上述规则抽象得到的初始态势灰度图。

图2 斯大林格勒战役的初始态势图

图3 抽象处理后的战役初始态势图

由于现实世界中的战役初始态势样本是有限的,而深度学习网络模型的构建又需要大量的样本集,这就需要利用原始战役初始态势样本集随机生成大量战役初始态势样本集。那么,如何利用原始战役初始态势样本集随机生成大量战役初始态势样本集呢?我们认为,战役初始态势图的旋转,或者少量地增加或减少兵力规模都不会改变其态势类别。所以,将增减兵力规模和旋转态势图作为随机生成战役初始态势样本集的两个基本步骤。具体流程图如图4 所示。

图4 随机生成战役初始态势样本集流程图

其中,Num_rbi为第i 张原始初始态势图中有兵力部署的像素个数;Num_ri为第i 张原始初始态势图中有红方兵力部署的像素个数;Num_bi为第i 张原始初始态势图中有蓝方兵力部署的像素个数;i是图片的下标,j 是根据一张图随机生成的样本的下标;N 是图片数量,M 是根据一张图生成的图片数。S 是图片中有兵力部署的像素平均数。

2.1.2 输出

输出是根据指挥员判断得到的战役初始态势的类别,即近程对峙、远程对峙,近程对峙又分为完全外线、完全内线、典型外线、典型内线,以及概略外线、概略内线。得到战役初始态势类别的过程也叫作打标签,可以采用单人打标签的方法,也可以采用多人共同打标签的方法。打标签的人应该是具有一定军事专业知识的指挥员或者专家。

2.2 深度学习网络

深度学习的概念起源于人工神经网络,由人工神经网络中含多隐层的多层感知器发展而来。深度学习将低层特征进行组合,以发现数据的分布式特征表示,形成更加抽象的高层表示属性类别[8]。深度学习方法分为有监督学习方法和无监督学习方法两类,在此方法下构建了不同的学习模型。典型的深度学习模型有卷积神经网络(convolutional neural network,CNN)、深度置信网络(deep belief network,DBN)和堆栈自编码网络(stacked autoencoder network,SAN)等。卷积神经网络是一种在监督体制下进行的深度学习,其网络结构与实际的生物神经网络非常相近,一些实验证明其在语音识别和视觉图像识别方面独具优势,因此,本文采用CNN来建模。

2.2.1 CNN 的基本思想

卷积神经网络(CNN)由猫视觉皮层的研究发展而来,是一种多层的监督学习神经网络。隐含层的卷积层和亚采样层是实现卷积神经网络特征提取功能的核心模块,采用误差梯度设计并训练卷积神经网络,通过频繁地迭代训练提高网络的精度[9]。CNN 有3 个核心架构:局部区域感知、权重共享和子采样。

1)局部区域感知。在卷积神经网络中,将输入图像划分成局部区域(即局部接受域),从局部接受域中提取图像的初级视觉特征,如物体的特殊点、边界和转角等,后续各层通过组合这些初级特征得到更高层的特征。两层之间采用局部连接方式,即利用层间局部空间相关性,将相邻每一层的神经元节点只与和它相近的上层神经元节点连接,从而极大地降低了神经网络架构的参数规模。

2)权重共享。在卷积神经网络中,卷积层的每一个卷积滤波器重复地作用于整个感受野中,对输入图像进行卷积。卷积结果构成了输入图像的特征图,以达到进一步提取图像局部特征的目的。由于每个卷积滤波器共享相同的权重矩阵和偏置项,这使得输出的特征图和输入图像的平移变化相同。由于需要训练的权重参数数目通过权重共享大幅减少,因此,对训练样本的需求也极大降低。

3)子采样。在获取图像的卷积特征后,要通过子采样方法对卷积特征进行降维。将卷积特征划分为n×n 个不相交区域,用这些区域的最大(或平均)特征来表示降维后的卷积特征。这些降维后的特征更容易分类。子采样有2 个优点:①减小了计算复杂度;②采样单元具有平移不变性,即使图像有小的位移,提取到的特征依然保持不变。子采样因其对位移的鲁棒性成为一种高效的降低数据维度的采样方法。

2.2.2 CNN 的整体网络结构

卷积神经网络是一个多层非全连接的神经网络,每层由多个二维平面组成,而每个平面由多个独立神经元组成。卷积神经网络包含两种特殊的网络结构:卷积层和亚采样层。因为有此特殊的网络结构,所以卷积神经网络擅长对图像的处理,其简单的结构示意图如图5 所示,其中卷积层和亚采样层可以有多层。卷积神经网络是通过卷积层和亚采样层的相互配合来学习原始图像的特征,并且通过BP 算法来调整参数,完成权值的更新,最终完成学习的任务。

图5 卷积神经网络结构示意图

由图5 可知:CNN 通过卷积层提取特征,通过亚采样层降低维度,然后以相同的组合形成更加抽象的特征,最终通过全连接层形成对图像的描述特征。具体构造方法分为3 步。

1)卷积层的构建。卷积层中含有多个特征平面,完成特征抽取的任务,其中每个特征平面都代表着上一层的某方面的特征,特征平面由神经元构成,同一个特征平面的所有神经元共享同一个连接权值。特征平面上的每个神经元只接受其相应感受野所传输的信号。根据卷积的数学定义,其主要有标准型与离散型,其中卷积神经网络中卷积层的网络结构采用的是离散型[10],在卷积神经网络中表示如式(1):

其中,Mβ表示输入特征的一个选择,k 表示卷积核,γ 表示网络的层数,b 表示每个输出特征映射所添加的偏置,但是对于特定的输出映射,输入的特征映射可以应用不同的卷积核卷积而得到。f 是卷积层神经网络元所用的激活函数。

2)亚采样层的构建。卷积层后面通常都会紧跟着一个亚采样层,亚采样层的表示如式(2)所示[11]:

其中,sub(·)表示亚采样所用的函数,B 和b 都是输出特征的偏置。f 的含义与卷积层类似,表示亚采样层神经元的激活函数,可以取与卷积层一样的激活函数,也可以选择不用激活函数。由于输入的样本通过卷积层在特征空间进行重构,从而映射到了高维空间,得到的是高维特征映射,是不能够直接作为特征使用的。因此,要通过亚采样层来进行降维,如果不对数据进行降维,则容易造成过拟合,而且还会导致维数灾难[12]。亚采样层的特征平面上的每个神经元也是共享同一链接权重的。卷积神经网络通过权值共享大幅度减少需要训练的权值数目,从而大大降低对训练样本的需求。

3)分类层的构建。在分类任务中,最后一层通常是一个全连接层,将每一个单像素图像和输出层的每一种可能的分类相连接。由于softmax 回归是解决多分类问题的一种方法,是基于逻辑回归而来,因此,本文最后一层的激励函数使用softmax 回归函数,其中每一个神经元的输出代表分类结果的可能性。

2.2.3 CNN 的训练方法

卷积神经网络的训练分为2 个阶段。

1)前向传播阶段。从样本集中抽取一个样本(Xi,Yi),将Xi输入网络,经过逐级变换,信息从输入层传送到输出层,实际的输出如式(3)所示:

其中:w(γ)表示第γ 层的权值;b(γ)表示第γ 层的偏置;Fγ()是第γ 层的激活函数,一般采用反正切函数或sigmoid 函数,本文采用sigmoid 函数。

2)后向传播阶段,也称为误差传播阶段。CNN中误差的反向传播过程分为输出层的误差反向传播和隐层的误差反向传播2 个过程。输出层的误差反向传播过程误差计算如式(4)、式(5)所示:

其中:Ei是第i 个样本的误差;Oik是第i 个样本输出层第k 个神经元的输出;Tik是第i 个样本输出层第k 个神经元的期望输出。

隐层的误差反向传播又包括亚采样层的误差反向传播和卷积层的误差反向传播。亚采样层的误差与输出层的误差计算方式类似,即分别计算该层当前神经元的输出误差与该神经元的输出、增益和偏置的偏导,并以此调整相应的增益和偏置。而卷积层的误差反向传播过程比较复杂,一般采用文献[9]的方法解决。

3 示例

图6 战役初始态势录入程序界面

我们选择了不列颠战役、中途岛战役、克尼格累茨战役、六日战争、奠边府战役、奥斯特里茨战役、对马海战、斯大林格勒战役、普拉西战役、滑铁卢战役、特拉法加海战、第二次海湾战争、色当战役(1870)、色当战役(1940)、葛底斯堡战役、阿拉曼战役、马恩河战役、魁北克陷落、君士坦丁堡之围、维也纳之围等20 次世界上著名的战役[13],然后根据战役初始态势图绘制原始的战役初始态势图。利用Matlab 编程,制作了“战役初始态势录入”程序(操作界面如图6 所示),可以通过点击鼠标绘制战役初始态势图,简化了绘制的过程[14]。利用该程序可以编辑战役初始态势图,在灰度图描述地理环境(陆、海)、红蓝方兵力(军种以及规模)的部署,并为态势初始图打标签(即近程对峙、完全外线、完全内线、典型外线、典型内线,以及概略外线、概略内线)。之后,根据前文介绍的算法,利用原始的战役初始态势图随机生成10 000 张战役初始态势图训练样本和4 000 张战役初始态势图测试样本。图7 是原始战役初始态势图和随机生成战役初始态势图的对比。对比发现,随机生成战役初始态势图对原始战役初始态势图进行了旋转,兵力规模也有所减少,但是并没有改变态势类型的判断(即远程对峙)。

图7 态势图对比

本文使用由Rasmus Berg Palm 编写的利用Matlab 工具箱DeepLearnToolbox 对卷积神经网络进行了训练与测试[15]。所使用的卷积神经网络结构如图8 所示。C1 是一个卷积层,有6 个5×5 的卷积核,由6 个大小为24×24 的特征图构成。特征图中每个神经元与输入中的邻域相连。C1 有(5×5+1)×6=156 个可训练参数。S2 是一个亚采样层,有6 个12×12 的特征图。特征图中的每个单元与C1 中相对应的特征图的2×2 邻域相连接。每个单元的2×2 感受区域并不重叠,因此S2 中每个特征图的大小是C1 中特征图大小的1/4(行列各1/2)。S2 层有6个可训练参数(每个特征图一个偏置)。C3 也是一个卷积层,它同样通过12 个5×5 的卷积核去卷积S2,然后得到12 个8×8 的特征图,有((5×5)×6+1)×12=1 812 个可训练参数。C3 中的每个特征图是连接到S2 中的所有6 个特征图的,表示本层的特征图是上一层提取到的特征图的不同组合。S4 是一个亚采样层,由12 个4×4 大小的特征图构成。S4 层有12 个可训练参数(每个特征图一个偏置)。全连接层有偏置4 个,权重为(4×4×12)×4=768个,最终输出是4 个分类。

图8 卷积神经网络结构示意图

在训练过程中每次选择50 个样本进行更新,随机梯度下降,每次只选用50 个样本进行更新,迭代次数为10,误差变化如图9 所示。当训练次数达到500 次时,误差已经小于0.05,当训练次数达到20 000 次时,误差已经小于0.017 7,可见卷积神经网络的精度是非常高的。利用训练好的神经网络,就可以对战役初始态势图进行认知了。利用Matlab 编写了小程序,界面如图10 所示。可以对原始的战役初始态势进行认知,也可以对用户自己绘制的战役初始态势图进行认知。

图9 误差变化

图10 战役初始态势认知界面

4 结论

战役初始态势不仅影响着整个战役进程,而且对战役筹划的影响也极为显著。以深度学习为代表的人工智能技术突飞猛进,为利用人工智能技术实现自动识别复杂的战役初始态势,模拟战役指挥员的经验知识带来了契机。因此,本文就此问题进行初步探索性研究。对战役初始态势的概念及其类型进行了介绍;探讨了基于深度学习的战役初始态势认知模型构建,对模型构建步骤、输入和输出的设计进行了探讨,对卷积神经网络的基本思想、结构、训练进行了介绍;在示例中介绍了样本数据的录入程序、卷积神经网络的具体结构与应用程序,验证了方法的可行性与有效性。所提出的战役初始态势认知方法可以在一定程度上获得指挥员对战役初始态势的经验知识。当然,本文仅是研究的一个起点,还需要在今后研究过程中进一步完善。比如,提高战役初始态势抽象图的描述能力,改变卷积神经网络的结构和训练参数,获得更好的性能和实用性。

猜你喜欢
外线内线态势
历史虚无主义的新近演化态势与特征
2022年全国农作物重大病虫害呈重发态势
2019年12月与11月相比汽车产销延续了增长态势
2019 年男篮世界杯中国队外线队员投篮能力的研究
左利手运动员在水球比赛阵地进攻战术中的作用
2012—2013赛季NBA总决赛双方防守内线无球队员技术的研究
第31届奥运会中国与四强男篮内线球员配合能力的对比研究
内线消息常坑人
5月份工业经济运行态势良好