无监督神经网络的潜艇对空战术意图识别*

2018-05-02 03:17张天赫彭绍雄邹强王栋
现代防御技术 2018年2期
关键词:权值意图神经元

张天赫,彭绍雄,邹强,王栋

(海军航空工程学院,山东 烟台 264001)

0 引言

在战场态势分析中,敌方的战术意图[1]是指挥员决策的重要依据之一,对敌方战术意图判断的准确性和及时性将直接影响我方作战指挥决策的正确性和有效性。传统作战中,主要依靠人为判断的战术意图[2]识别过程已经不能适应现代战场上的信息化作战需要,迫切需要智能化手段来实现战术意图的识别。

在美国国防部JDL实验室2004年发布的最新数据融合层次模型[3-4]中,意图识别作为高层数据融合过程成为战场态势评估和威胁评估中的重要组成部分。21世纪以来,随着数据融合技术的发展,该技术已经成为国内外军事决策领域研究的焦点。

军事中的战术意图识别领域[5],也就是依据从各种信息源得到的信息,结合敌方兵力的部署、战场环境的分析、敌方战斗编队和战场警戒程度、我方所承担的作战任务,来识别敌方战术意图和作战计划的过程。

现有的各种方法难以对军事目标的战术意图的进行有效的识别和推理。为此,本文研究提出了基于无监督学习神经网络模型[6],尝试对潜艇对空战术意图识别问题给出另一种解决思路。

1 无监督神经网络

1.1 竞争神经网络的结构

竞争神经网络[7]是一种典型的、应用非常广泛的无监督学习神经网络,其结构如图1所示。竞争神经网络由输入层和竞争层组成。与RBF等神经网络类似,输入层仅实现输入模式的传递,并不参与实际的运算。竞争层的各个神经元以相互竞争的形式来赢得对输入模式的响应,最终只有一个神经元赢得胜利,并使与该获胜神经元相关的各连接权值和阀值向着更有利于其竞争的方向发展,而其他神经元对应的权值和阈值保持不变。

1.2 SOFM神经网络结构

自组织特征映射(self-organizing feature mapping,SOFM)神经网络[8]是Kohonen于1981年提出的。其主要思想是在学习过程中逐步缩小神经元之间的作用邻域,并根据相关的学习规则增强中心神经元的激活程度,从而去掉各神经元[9]之间的侧向连接,以达到模拟真实大脑神经系统“近兴奋远抑制”的效果。

如图2所示,SOFM神经网络的结构与竞争神经网络的结构类似,是一个由输入层和自组织特征映射层(竞争层)组成的两层网络。在SOFM神经网络中,不仅与获胜神经元对应的权值和阈值得到调整,其邻近范围内的其他神经元也有机会进行权值和阀值调整,这在很大程度上改善了网络的学习能力和泛化能力。

2 目标战术意图识别步骤

2.1 竞争神经网络学习算法

(1) 网络初始化[10]

如图1所示,输入层由R个神经元构成,竞争层由S1个神经元构成。为不失一般性,设训练样本的输入矩阵为

式中:pij为第j个训练样本的第i个输入变量;Q为训练集样本数,并记

pi=(pi1,pi2,…,piQ),i=1,2,…,R.

则网络的初始连接权值为

IW1,1=(ω1,ω2,…,ωR)S1×R,

式中:

网络的初始阈值为

同时,在学习之前需初始化相关参数。设权值的学习速率为α,阈值的学习速率为β,最大迭代次数为T,迭代次数初始值N=1。

(2) 计算获胜神经元

随机选取一个训练样本p,根据

(1)

设竞争层第k个神经元为获胜神经元,则应满足

(2)

(3) 权值、阈值更新

神经元k对应的权值和阈值分别按照

(3)

b1=e1-ln[(1-β)e1-ln b1+β×a1]

(4)

(5)

(4) 迭代结束判断

若样本还没有学习完,则再另外随机选取一个样本,返回步骤(2)。若N

2.2 SOFM学习算法

SOFM神经网络与竞争神经网络的算法相似,仅在权值调整部分有较大差异。

(1) 网络初始化

(2) 计算获胜神经元

与竞争神经网络采取相同的方式。

(3) 权值更新

根据

(6)

获胜神经元k及其邻域Nc(t)内的所有神经元进行权值更新。

(4) 学习速率及邻域更新

获胜神经元及其邻域内的神经元权值更新完成后,在进入下一次迭代前,需要更新学习速率及邻域,即

(7)

(8)

式中:「x⎤表示对x向上取整。

(5) 迭代结束判断

与竞争神经网络采取相同的方式。

3 实验分析

本文给出了一种结合特征参数识别和事件检测的潜艇对空战术意图识别方法[11],由于潜艇在执行任务过程中,空中目标的意图识别意义重大,直接决定了其是否发现我方潜艇,进而知晓是否对我方采取行动。而利用目标特征参数(如目标编队组成(声纳信息)、区域警戒程度、距离、运动角度)[12]与作战态势及目标的战术意图息息相关。本文选取了攻击、搜潜、驱离、巡逻4种战术意图[13]作为输出变量。其中基本目标信息和作战区域警戒程度如表1,2所示。

表1 基本目标信息

表2 编队目标信息

当双方在某区域相遇时,区域的警戒程度对作战双方是否会采取更加激烈的应对手段起到重要的作用,其区域警戒程度与战术意图之间的模拟关系[14]如表3,4所示。

表3 作战区域警戒程度

表4 警戒程度与战术意图间的关系

编队的构成越复杂则其战术意图越具有攻击性,表5选取了典型的编队构成情况,其对应关系[15]如表5所示。

表5 目标类型与目标战术意图之间的关系Table 5 Relationship between target type and target tactical intention

目标对潜艇的威胁程度随着距离的减下而越来越大,表6设定了双方距离阈值[16]及其对应的战术意图。当反潜直升机与反潜巡逻机和潜艇作用距离在2 000 km以上时,潜艇较难探测到目标,且目标对潜艇不构成威胁,因此不进行讨论。

表6 目标距离与目标战术意图之间的关系Table 6 Relationship between target distance and target tactical intention

目标运动角度越小,其威胁越大,表7设定了目标运动角度的阈值及其对应的战术意图。

由上述表格,专家评估给出每组数据对应的目标战术意图,目标战术意图由数字1,2,3,4分别表示攻击、搜潜、驱离及巡逻。现采集到某类型数据样本39组,由于获取的样本数量较少,为保证建立的模型具有较好的泛化能力,这里从每个战术意图组内选出4个样本作为测试集,余下的35个样本作为训练集。其中部分样本数据由表8给出。

表7 目标运动角度与目标战术意图间的关系Table 7 Relationship between target motion angle and target tactical intention

表8 部分系统训练样本

为了减少输入变量间的变化较大(不属于同一数量级)对模型性能的影响,在模型建立之前对输入变量进行归一化处理。下面将系统训练样本进行归一化处理[17],归一化使用Matlab自带的归一化函数mapminmax进行归一化处理,归一化后的部分训练样本数据见表9。

实际的战术意图[18]用y来表示,获胜神经元编号(竞争神经网络)用x1来表示,获胜神经元编号(SOFM神经网络)用x2来表示,由于网络在训练的过程中采取的是随机抽取训练样本的方法,因此每次运行的结果都会有所不同。某次的运行结果如表10所示。从表10中不难发现以下几点:

(1) 对于竞争神经网络,第1种目标战术意图与竞争层第2个神经元相对应;第2种战术目标与竞争层第2个神经元相对应(仅有第18号样本对应的是竞争层的第4个神经元);第3种军事目标与竞争层第4神经元相对应;第4种军事目标与竞争层的第1个神经元相对应(仅有第28号样本对应的是竞争层的第4个神经元)。因此对于第1,2,3,4种军事目标依次对应的获胜神经元是第2,2,4,1神经元,据此对应关系推断,可以发现测试集中36,37,38,39号样本分类正确。

表9 部分归一化后的系统训练样本

表10 竞争神经网络与SOFM神经网络预测结果对比

(2) 对于SOFM神经网络[19],第1种目标战术意图对应的获胜神经元编号为4,7,8;第2种目标战术意图对应的获胜神经元编号为3,6,7,11,12,14,15;第3种目标战术意图对应的获胜神经元编号为2,9,10,13,14,16;第4种目标战术意图对应的获胜神经元编号为1,2,5。据此对应关系可以发现测试集中除了第38号样本,其余3个样本对应的获胜神经元编号在训练集中对应的获胜神经元编号集合内,因此,可以判定其正确率为75%。

注意到,若测试集中某个样本的预测获胜神经元编号为7,则难以断定其属于第1种目标战术意图或是第2种目标战术意图。同理,若测试集中某个样本的预测获胜神经元编号为14,则同样难以预测其属于第2种目标战术意图或是第3种目标战术意图。图3为神经元网络拓扑学结构图,代表本次仿真生成神经元的结构。

这里需要强调,若测试集中的某个样本的预测获胜神经元编号从未出现过训练次数(本文未出现该情况),则难以圈定其属于哪一类样本。因为在训练的过程中,其神经元从未赢得获胜机会,一直处于抑制状态,即成为所谓的“死”神经元。

图4中神经元的编号方式是从左至右,从上至下,神经元编号逐渐增加,即左下角的神经元编号为1,右上角的神经元编号为16,而神经元编号与其获胜次数间的具体映射关系如表11所示。

图5表示竞争层邻近神经元的连接情况,灰色的表示神经元节点,红线表示神经元之间有连接。

图6为竞争层各个神经元与其周围邻近神经元间的距离分布图,相邻神经元间填充区域的颜色表示2个神经元间的距离远近程度。颜色越深(越接近黑色),表明神经元间的距离越远。从图中可以看出5号与6号神经元之间的距离较远。同时,从表9可以看出5,6号获胜的神经元分别对应第4,2种目标战术意图,这表明不同类别的神经元之间距离较远。同理可以观察到,同一类别对应的获胜神经元之间的距离较近,例如在第1种目标战术意图所对应的4,7,8神经元间的距离就较近,其余类别的目标战术意图分析方法类似,此处不再赘述。

图7表示每个输入向量和竞争层神经元之间的权重连接情况。权值最小的颜色块为蓝色,权值为0的颜色块为黑色,权值最大的颜色块为红色。

神经元编号12345678获胜次数22115133神经元编号910111213141516获胜次数21523211

图8为输入数据与权重图,其将输入的向量用绿色的圆点标注,并通过每个神经元的权重向量和用红线连接的相邻神经元显示出SOM如何分类输入空间[20]。

4 结束语

从表10及分析结果可以看出,与竞争神经网络相比,SOFM神经网络的性能更好,泛化能力更强。这是因为,竞争神经网络在学习时,每次仅有一个神经元赢得获胜机会,只有获胜神经元的权值得到调整,而SOFM神经网络虽然每次亦只有一个神经元赢得获胜机会,但其及其邻近范围内的神经元对应的权值同时进行修正,朝着更有利于其获胜的方向调整。同时,SOFM神经网络逐渐缩小其邻域范围,逐渐“排斥”邻近的神经元。这种“协作”与“竞争”相结合的模式使得其性能更加优越。

潜艇在水下面对复杂多变的战场环境,尤其受到来自空中目标的威胁,及时准确的判断空中目标的意图,对我方决策者采取合理应对措施,提高潜艇的生存概率都具有重要意义。下一步,将增加竞争层中“死”神经元,增加其阈值的调整幅度,进一步提升模型的准确性。

参考文献:

[1] 秦富童,岳丽华,万寿红.应用BP神经网络的目标识别效果评估[J].计算机工程与应用,2010,46(5):148-156.

QIN Fu-tong,YUE Li-hua,WAN Shou-hong.Performance Evaluation in Automatic Target Tecognition Using BP Neural Network[J].Computer Engineering and Applications,2010,46(5):148-156.

[2] 葛顺,夏学知.用于战术意图识别的动态序列贝叶斯网络[J].系统工程与电子技术,2014,36(1):76-83.

GE Shun,XIA Xue-zhi.DSBN Used for Recognition of Tactical Intention[J].Systems Engineering and Electronics,2014,36(1):76-83.

[3] JOHANSSON F,FALKMAN G.Implementation and Integration of a Bayesian Network for Prediction of Tactical Intention into Ground Target Simulator[C]∥Proc.of the 9th International Conference on Information Fusion,2006:1-7.

[4] TIAN Yu,ZHANG Ai-qun.Simulation Environment and Guidance System for AUV Tracing Chemical Plume in 3-Dimensions [C]∥2010 2nd International Asia Conference on Informatics in Control,Automation and Robotics,2010:407-411.

[5] 苏琦,于敬人,金国栋.一种潜艇对水面舰艇编队攻击意图建模方法[J].四川兵工学报,2014,35(9):147-149.

SU Qi,YU Jing-ren,JIN Guo-dong.A Modeling Method of Attack Intention of Submarine for Vessel Formation[J].Sichuan Ordnance Journal,2014,35(9):147-149.

[6] 钱江,许江湖.基于BP神经网络的空中目标威胁排序[J].现代防御技术,2001,29(6):56-58.

QIAN Jiang,XU Jiang-hu.Threat Sequencing for Aerial Target Based on BP Neural Network[J].Modern Defence Technology,2001,29(6):56-58.

[7] 何隆玲,胡桂明,李维维,等.基于PSO-RBF神经网络的雷达目标识别[J].现代防御技术,2014,42(5):115-120.

HE Long-ling,HU Gui-ming,LI Wei-wei,et al.Rader Target Recognition Based on PSO-RBF Neural Network[J].Modern Defence Technology,2014,42(5):115-120.

[8] KANG Hai-yan,LI Chen.Research and Design on Personalized DL Based on J2EE[C]∥2008 IEEE Pacific-Asia Workshop on Computational Intelligence and Industrial Application.Wuhan,China:IEEE,2008:527-531.

[9] 刘伟伟,胡兴平,卢晓敏,等.基于SOFM神经网络的SAR图像目标识别[J].现代防御技术,2016,44(4):56-60.

LIU Wei-wei,HU Xing-ping,LU Xiao-min,et al.SAR Image Target Recognition Method Based on SOFM Neural Network[J].Modern Defence Technology,2016,44(4):56-60.

[10] 朱波,方立恭,张小东.基于贝叶斯网络的空中目标意图识别方法[J].现代防御技术,2012,40(2):109-113.

ZHU Bo,FANG Li-gong,ZHANG Xiao-dong.Intention Assessment to Aerial Target Based on Bayesian Network[J].Modern Defence Technology,2012,40(2):109-113.

[11] DONG Y K,KWAE H Y,JU H K,et al.Prediction of Leak Flow Rate Using Fuzzy Neural Networks in Severe Post-LOCA Circumstances[J].IEEE Trans.on Nuclear Science,2014,61(6):3644-3652.

[12] WAI R J,MUTHUSAMY R.Fuzzy Neural Network Inherited Sliding-Mode Control for Rodot Manipulator Including Actuator Dynamics[J].IEEE Trans.on Neural Networks and Learning Systems,2013,24(2):274-287.

[13] 陈绍顺,王君.基于前向型神经网络的空袭目标类型识别模型[J].现代防御技术,2002,30(2):57-60.

CHEN Shao-shun,WANG Jun.Model of Air Striking Targets Type Recognition Based on Forward Neural Network[J].Modern Defence Technology,2002,30(2):57-60.

[14] WU G D,HUANG P H.A Vectorization Optimization Method Based Type-2 Fuzzy Neural Network for Noisy Data Classification[J].IEEE Trans.on Fuzzy Systems,2013,21(1):1-15.

[15] 吴文龙,黄文斌,刘剑.潜艇对水面舰艇编队攻击意图推理研究[J].火力与指挥控制,2010,35(9):101-105.

WU Wen-long,HUANG Wen-bin,LIU Jian.The Researching on the Inference about Fleet’s Attack Intention by the Submarine[J].Fire Control&Command Control,2010,35(9):101-105.

[16] 陈浩,任卿龙,滑艺,等.基于模糊神经网络的海面目标战术意图识别[J].系统工程与电子技术,2016,38(8):1847-1853.

CHEN Hao,REN Qing-long,HUA Yi,et al.Fuzzy Neural Network Based Tactical Intention Recognition for Sea Targets[J].Systems Engineering and Electronics,2016,38(8):1847-1853.

[17] HATAKEYA N,FURUTA K.Bayesian Network Modeling of Operator’s Intent Inference[C]∥IEEE 7th Human Factors Meeting,2002:55-60.

[18] 陆光宇,丁迎迎.水下平台对敌意图识别技术研究[J].指挥控制与仿真,2012,34(6):100-102.

LU Guang-yu,DING Ying-ying.Study on Intention Recognition to Foe of Underwater Platform[J].Command Control &Simulation,2012,34(6):100-102.

[19] CARVALHO R N,COSTA P C G,LASKEY K B,et al.PROGNOS:Predictive Situational Awareness with Probabilistic Ontologies[C]∥Proceedings of the 13th International Conference on Information Fusion,Edin-Burgh,UJ,Jul.,2010:214-218.

[20] CARVALHO R N.PO:Represention and Modeling Methodology[D].Virginia:George Mason University,2011.

猜你喜欢
权值意图神经元
原始意图、对抗主义和非解释主义
一种融合时间权值和用户行为序列的电影推荐模型
陆游诗写意图(国画)
制定法解释与立法意图的反事实检验
基于5G MR实现Massive MIMO权值智能寻优的技术方案研究
AI讲座:神经网络的空间对应
一种基于互连测试的综合优化算法∗
仿生芯片可再现生物神经元行为
这个神经元负责改变我们的习惯
研究人员精确定位控制饮酒的神经元