基于数据挖掘的战场目标综合识别技术

2016-06-28 08:01李小花
指挥控制与仿真 2016年3期
关键词:数据挖掘

李小花,李 姝

(中国电子科技集团公司第三十研究所,四川 成都 610041)

基于数据挖掘的战场目标综合识别技术

李小花,李姝

(中国电子科技集团公司第三十研究所,四川 成都610041)

摘要:分析了现有战场目标识别技术存在的问题,提出了基于数据挖掘的战场目标综合识别总体框架,对目标识别知识表示、目标特征知识挖掘、作战模式知识挖掘以及目标综合识别智能化推理等关键技术进行了研究,并说明了各关键技术在战场目标识别中的应用示例,可为提高战场目标识别的自动化、智能化水平提供借鉴。

关键词:数据挖掘;目标特征知识;作战模式知识;综合识别

对战场目标的快速、准确识别是战场指挥控制系统发挥决策优势的前提。目前,对战场目标的识别大多基于武器装备性能数据库,通过模式匹配,获取目标类型的判别结果,而武器装备性能数据库需要进行不断更新和完善,因此往往对新目标无法进行有效识别。近几年,目标识别领域引入数据挖掘技术,通过对海量历史情报数据的挖掘自动获取目标识别知识,从而实现基于知识库的目标智能化识别,已引起广泛关注,且取得了部分理论研究成果,但与实际应用还存在一定差距。一方面,目前对历史情报数据的挖掘大都针对不同情报数据库分别进行挖掘,并未将不同类型的情报信息关联起来,从而使得挖掘出的知识无法进行目标的综合识别;另一方面,未考虑相近地点、相近时间出现的多个目标的相关性,而这种相关性往往是进行目标有效识别的重要线索。

基于此,本文以雷达情报和电抗情报为例,提出了基于数据挖掘的战场目标综合识别总体框架,对战场目标识别知识表示、目标识别知识挖掘和目标综合识别智能化推理等关键技术进行了初步探讨,并给出了应用示例。

1基于数据挖掘的战场目标综合识别总体框架

数据挖掘是从大量的历史数据中抽取出潜在的,有用的知识(模型或规则)的过程[1]。将数据挖掘技术应用于战场目标识别,通过对存储在数据库中的海量历史目标情报数据,运用关联分析[2]、聚类[3]、分类[4]等多种数据挖掘算法获取有价值的目标识别知识,从而为实时目标的综合识别提供自动化、智能化手段。

基于数据挖掘的战场目标综合识别总体框架如图1所示。

基于数据挖掘的战场目标综合识别包含情报信息获取、目标识别知识挖掘、目标综合识别推理及目标识别结果反馈等主要过程,图1中的具体工作原理如下:

1) 情报信息获取:从情报源获取到各种战场目标情报信息,包括雷达情报信息、电抗情报信息等,并将情报信息存入历史目标情报数据库中;

图1 基于数据挖掘的战场目标综合识别总体框架

2) 目标识别知识挖掘:通过采用数据挖掘算法从历史目标情报数据库中挖掘产生目标识别知识,挖掘方式包含两种:目标特征知识挖掘和作战模式知识挖掘;

3) 目标综合识别推理:对接收到的各种实时情报信息,结合目标识别知识库中的目标识别知识,通过智能化推理技术进行推理,从而对实时战场目标进行综合识别,并将识别结果记录到历史目标情报数据库中;

4) 目标识别结果反馈:基于外界系统的目标识别需求,如字段、格式等,返回所需的目标识别结果。

由此可见,实现基于数据挖掘的战场目标综合识别的关键在于目标识别知识库设计、目标识别知识挖掘和目标综合识别推理三个方面。

2基于数据挖掘的战场目标综合识别关键技术

2.1战场目标识别知识表示技术

对于基于数据挖掘的战场目标识别而言,知识库设计是否合理是影响目标识别效果的关键因素之一。知识库设计包含知识的表示、组织和存储等,其中,知识表示是基础,因此,本文重点探讨知识表示技术。

目前已经有许多知识表示方法得到了国内外学者们深入的研究,其中,使用较多的知识表示方法主要有:谓词逻辑表示法,产生式表示法、框架表示法、语义网络表示法、面向对象表示法、基于本体的知识表示法等[5]。在众多的知识表示方法中,产生式表示法是最常用的知识表示法,它强调条件满足即产生相应的结果,符合目标识别推理的要求,而且具有表示充分、模块化和自然性等特点。因此,本文基于产生式表示法,并对其进行改良来进行目标识别知识的表示。

标准的产生式规则为

IF[E1&E2&…&En] THEN[H]

(1)

其中,E1,E2,…,En表示前提条件,H为结论,意思是:当前提条件均满足时,得出相应的结论。

标准的产生式规则是一种精确的规则表示形式,而对于实际作战应用中,往往不能获取到完全精确的规则,即规则并不是100%可信。因此可在标准的产生式规则基础之上增加模糊因子,用于表示规则的可信度或规则强度,使得结论更加客观。另外,考虑战场目标情报类型的多样性和复杂性,对产生式规则中的前提条件可引入权值[6],即重要性属性,从而提高结论推导的正确性,因此产生式规则可进一步改良为

IF[E1(W1)&E2(W2)&…&En(Wn)] THEN[H] (CF)

(2)

其中,Ei(i=1,2,…,n)表示条件,Wi表示Ei在此规则中的重要程度,即权值,H为结论,CF为该规则的可信度或规则强度。当Wi=1,且CF=1时,式(2)就变成了“非模糊产生式规则”,即标准的产生式规则,因此,采用加权模糊产生式规则可以使规则库统一化。

在式(2)中,对于通过数据挖掘等智能化方法获取的知识,Wi可以通过相应的算法自动获取;而对于从领域专家获取的经验性知识,一般具有模糊性、不确定性等特点,需要采用相应的技术手段来确定Wi的取值。由于模糊逻辑在处理不确定性问题中所表现出的固有优势,因此,可通过引入模糊逻辑的有关理论和技术来表达知识的模糊性和不确定性,从而确定Wi的取值。

2.2战场目标识别知识挖掘技术

战场目标识别知识挖掘主要分为目标特征知识挖掘和作战模式知识挖掘两种途径,下面分别进行说明。

1)目标特征知识挖掘

目标特征知识挖掘通过挖掘目标情报的特征参数,比如雷达情报中目标运动速度、加速度、高度/深度、发现距离等,电抗情报中目标雷达类型或辐射源参数,如射频类型、射频值、扫描周期等,从而获取到目标各属性特征与目标类型之间的关联规则。

图2 目标特征知识挖掘基本原理

如图2所示,历史情报数据可分为样例数据和测试数据,样例数据用于进行目标特征知识挖掘,测试数据用于对挖掘结果进行评估。目标特征知识挖掘的基本原理如下:

① 目标情报关联:基于历史雷达情报和电抗情报样例数据,通过目标情报中目标标识及发现时间等参数,将同一目标的雷达情报和电抗情报进行关联,从而形成目标综合情报信息;

② 数据预处理:进行数据过滤(如去除关键字段为空的记录)、缺省值填充(如取非空值的平均值)、重复记录消除、数据类型转换等,通过数据预处理,将目标综合情报信息转换为适合进行数据挖掘的形式,形成相对精简的综合情报数据集;

③ 目标属性约简:选择与目标类型密切相关的属性特征,如敌我属性、环境属性、运动速度、高度/深度、加速度、雷达类型以及辐射特性参数等,形成待挖掘的综合情报数据集;

④ 目标特征知识挖掘:利用经典的分类挖掘算法,如:C4.5[7]、CART[8]、CMAR[9]等挖掘情报信息中各类目标的综合特征,并形成规则集,如当运动速度δ1>P1、运动高度δ2

IF[δ1>P1&δ2

⑤ 知识评估:通过历史情报数据库中的情报测试数据对挖掘出的目标识别知识进行评估,如果评估结果达到预期值(由专家或用户输入),比如识别可信度>98%,则对目标识别知识库进行更新,否则,重新执行目标属性约简和目标特征知识挖掘的过程,直到达到预期值;

⑥ 知识库更新:将当前新产生的目标识别知识存入目标特征知识库中,存储过程中需进行知识冲突检测,并通过知识比对避免存储重复或冗余的知识。

2)作战模式知识挖掘

作战模式知识挖掘依据历史目标情报信息中与目标类型及类型组合相关属性,如目标所在的地点(经度、纬度)、发现时间等,挖掘情报信息中相近地点多个目标联合出现的习惯,从而提炼出类似编成编组的作战模式特征,并形成规则集。

由于作战模式知识挖掘需要使用目标的位置信息,因此,主要针对雷达情报进行挖掘。

图3 作战模式知识挖掘基本原理

如图3所示,作战模式知识挖掘基本原理如下:

① 数据预处理:与目标特征知识挖掘过程类似,通过数据预处理,将雷达情报信息转换为适合进行数据挖掘的形式,形成相对精简的数据集;

② 确定在相近时间点出现的目标:给定时间点相差度阈值λt,若任意两个目标的发现时间相差度<λt,则将这两个目标归为同一事务(即待挖掘的数据子集合)Ti(i=1,2,…,n),否则,新增一个事务Ti+1,以此类推,形成事务集合T;

③ 确定在相近地点出现的目标:给定距离相差度阈值λJD和λWD,对于T中的每一个事务Ti(i=1,2,…,n),若任意两个目标的经度相差度<λJD且纬度相差度<λWD,则将这两个目标归为同一事务Tij(j=1,2,…,m),否则,新增一个事务Ti,j+1,以此类推,形成最终事务集合T′,对于T′中的每一个事务Tij,包含了同一时间段内,同一区域的目标平台;

④ 作战模式知识挖掘:基于专家或用户输入的挖掘参数(如支持度阈值和可信度阈值),通过采用经典关联规则挖掘算法,如Apriori[10]、FP-growth[11],从最终事务集合T′中,提取多个目标在同一时间段、同一区域出现的关联规则;

⑤ 知识评估:对挖掘出的关联规则进行评估,若未达到预期(如每条规则的可信度均大于95%),则调整挖掘参数,重新进行挖掘,直到达到预期值;

⑥ 知识库更新:将当前新产生的目标识别知识存入作战模式知识库中,存储过程与目标特征知识存储过程类似。

2.3目标综合识别智能化推理技术

目标综合识别智能化推理技术利用挖掘产生的目标识别知识,通过采用合适的推理机制,进行智能化推理,从而给出目标的综合识别结果。由于获取到的目标识别知识包含目标特征知识和作战模式知识,因此,需根据不同目标识别知识的特点,有针对性地设计相应的推理算法。为简化起见,假定先后获取到目标1和目标2两批不同目标的情报数据,且分别包含雷达情报数据和电抗情报数据,对这两批目标进行综合识别推理的基本流程如图4所示。

目标综合识别智能化推理基本流程如下:

1) 对获取到的目标1实时情报(包含雷达情报和电抗情报)进行预处理,主要包括缺省值填充、数据格式转换等,从而形成预处理后的雷达情报数据和电抗情报数据;

2) 根据目标1的目标标识和发现时间等信息对雷达情报和电抗情报数据进行关联,形成目标1的综合情报数据;

3) 基于目标特征知识库,对目标1进行基于目标特征知识的智能化推理,并输出目标1的识别结果;

4) 对获取到的目标2实时情报(包含雷达情报和电抗情报)进行预处理,处理过程与目标1类似;

5) 根据目标2的目标标识和发现时间等信息对雷达情报和电抗情报数据进行关联,形成目标2的综合情报数据;

6) 基于目标特征知识库,对目标2进行基于目标特征知识的智能化推理;

7) 判断目标2的识别结果可信度是否大于给定阈值,若是则输出目标2的识别结果,否则执行下一步;

8) 判断目标1,2是否在相近地点、相近时间发现,若是则执行下一步,若否则输出目标2的识别结果;

9) 基于作战模式知识库,对目标2进行基于作战模式知识的智能化识别,并输出目标识别结果,至此,对两批目标的识别结束。

由此可见,基于目标特征知识的智能化推理既适合对单个目标进行识别,也适合对多个目标分别进行识别;基于作战模式知识的智能化推理适用于对多个目标进行识别。此外,采用基于作战模式知识的智能化推理进行目标识别有一个前提条件,即已经采用其他方法,如基于目标特征知识的智能化推理,对前一批目标进行了识别,对于后续目标,当采用其他方法得出的目标识别结果可信度未达到阈值要求时,可通过基于作战模式知识的智能化推理来提高目标识别准确率。

3应用示例

下面通过一个简单的示例来说明基于数据挖掘的战场目标综合识别关键技术在战场目标识别中的应用。

假定目标识别知识挖掘及推理识别相关参数要求如下。

目标情报关联参数:

时间点相差度阈值λt≤30s;

地点相差度阈值:经度λJD≤0.1,纬度λWD≤0.1。

作战模式知识挖掘参数:

支持度阈值=0.8,可信度阈值=0.95。

目标识别准确率:CF≥95%。

1)目标识别知识表示

目标识别知识采用模糊产生式规则进行表示,为简化起见,假定所选取的属性重要程度均相同,即将权重均设置为1,因此,产生式规则可表示如下:

IF[E1&E2&…&En] THEN [H] (CF)

(3)

其中,Ei(i=1,2,…,n)表示条件,H为结论,CF为该规则的可信度。

2)目标识别知识挖掘

假设雷达情报数据库和电抗情报数据库已分别存放大量历史雷达情报和电抗情报数据。现获取到两种类型的情报数据集LD和DK,分别如表1和表2所示,以及已进行准确分类的目标综合情报测试数据集CS。

首先,对LD和DK进行目标特征知识挖掘,具体过程如下:

① 在LD和DK情报数据集中,分别针对每条记录,将目标类型、发现时间和地点相同的目标记录进行关联,形成综合情报数据集ZH1,如表3所示。

图4 目标综合识别智能化推理基本流程

批号敌我属性环境属性目标类型经度纬度/(°)速度/(m/s)高度/m航向/(°)发现时间001敌海XX级驱逐舰114.226.55.1440117.012015-12-0111:50:10002敌海XX级护卫舰114.2326.494.630117.012015-12-0111:50:15003敌空XX反潜直升机114.4825.5871.6663360117.012015-12-0111:50:20004我海XX驱逐舰123.0123.4415.9470123.122015-12-0313:20:01005我海XX护卫舰123.123.3913.3750123.122015-12-0313:20:11006我空歼轰-XX123.8823.78444.44412500123.122015-12-0313:20:15…………………………

② 对ZH1,选择与目标类型密切相关的属性特征,如敌我属性、环境属性、运动速度、高度/深度、以及雷达类型等,形成待挖掘的综合情报数据集ZH2,如表3中阴影字段。

③ 利用经典的分类模型挖掘算法C4.5[7]进行挖掘,将产生的分类模型转化为规则的形式,如下所示。

Rule1: IF 敌我属性=敌 & 环境属性=海 & 速度≥5.144 & 高度=0 &雷达型号=ld1,THEN 目标类型=XX级驱逐舰,CF=95%;

Rule2: IF 敌我属性=敌 & 环境属性=海 & 4.63≤速度<5.144 & 高度=0 &雷达型号=ld2,THEN 目标类型=XX级护卫舰,CF=93%;

Rule3: IF 敌我属性=敌 & 环境属性=空 & 速度≥71.666 & 高度=3360 &雷达型号=ld3,THEN 目标类型=XX反潜直升机,CF=97%;

RuleN:…

④ 利用测试数据集CS对分类模型M进行评估,达到预期效果,即目标识别准确率≥95%,则执行下一步,否则,返回到步骤②,现假定已达到预期效果。

表2 历史电抗情报数据集DK

表3 综合情报数据集ZH1和ZH2

⑤ 将当前产生的分类模型M存入目标特征知识库中。

然后,对雷达情报数据集LD进行作战模式知识挖掘,具体过程如下:

① 根据批号为001和002的目标数据可知,前一目标的发现时间t1=11:50:10,后一目标的发现时间t2=11:50:15,由于|t1-t2|<λt,将这两个目标归为同一事务T1={XX级驱逐舰, XX反潜直升机};

② 按照① 的方法对LD中所有记录进行处理,形成事务库T={{XX级驱逐舰, XX级护卫舰, XX反潜直升机},{XX驱逐舰, XX护卫舰, 歼轰-XX},…};

③ 根据批号为001和002的目标数据可知,前一目标的经度JD1=114.2,纬度WD1=26.5,后一目标的经度JD2=114.23,纬度WD2=26.49,由于| JD1-JD2|<λJD且| WD1-WD2|<λWD,则将这两个目标归为同一事务T11={XX级驱逐舰, XX反潜直升机};

④ 按照③ 的方法对T中的每一个事务Ti(i=1,2,…,n)进行处理,最终形成事务库T′={{XX级驱逐舰, XX级护卫舰},{XX反潜直升机},{XX驱逐舰, XX护卫舰},{歼轰-XX},…};

⑤ 采用经典算法APriori[10]进行关联规则挖掘,形成规则集合R:

Rule1:IF XX级驱逐舰THEN XX级护卫舰,CF=98%;

Rule2:IF XX级护卫舰THEN XX级驱逐舰,CF=98%;

Rule3:IF XX护卫舰THEN XX驱逐舰,CF=97%;

Rule4:IF XX护卫舰THEN XX驱逐舰,CF=97%;

RuleN:…

⑥ 知识库更新:将当前新产生的关联规则存入作战模式知识库中。

3)目标综合识别智能化推理

假设接收到未知目标类型的两批次实时雷达情报LDA、LDB和实时电抗情报DKA和DKB,具体字段值如表4和表5所示。

首先,对目标A和B分别进行基于目标特征知识的推理识别,具体过程如下:

① 将实时雷达情报和实时电抗情报进行关联,形成实时综合情报,如表6所示;

② 提取分类模型M中包含的特征字段,如表6中阴影部分字段;

③ 利用分类模型M对关联后的情报信息进行识别,根据规则Rule1可知,目标A为XX级驱逐舰,可信度为95%,根据规则Rule2可知,目标B为XX级护卫舰,可信度为93%。

表4 实时雷达情报

表5 实时电抗情报

表6 实时综合情报

由于对目标B识别结果的可信度小于给定的预期值95%,因此,继续对目标B进行基于作战模式知识的智能化推理识别,具体过程如下:

① 目标A的发现时间tA=11:55:12, 目标B的发现时间tB=11:55:23,由于|tA-tB|<λt,可判断目标A和B是在相近时间发现;

② 目标A的经度JDA=113.11,纬度WDA=25.14, 目标B的经度JDB=113.2,纬度WDB=25.18,可知|JDA-JDB|<λJD且|WDA-WDB|<λWD,从而可确定目标A和B是在相近区域发现;

③ 获取作战模式知识集合R;

④ 搜索R中的所有规则,发现规则Rule1满足条件,从而推断出目标B为XX级护卫舰,可信度为98%;

⑤ 输出对目标A和B的识别结果。

4结束语

本文提出的基于数据挖掘的战场目标综合识别技术可以作为目前基于特征匹配的目标识别技术的有效补充。一方面,可应用到空海一体化联合作战中,为联合情报中心进行多源目标识别提供自动化、智能化手段,提高目标综合识别准确率和指挥人员决策效率;另一方面,为未来从以“网络为中心”向以“数据为中心”的作战模式转变提供技术储备,支撑未来战场大数据分析能力。但要将该技术应用于实际作战中,还需要解决一些问题,比如如何进行目标识别知识的高效存储、如何进行知识的有效更新、如何提高识别效率等,均有待进一步深入研究。

参考文献:

[1]张雪梅,高翔. 目标识别中的数据挖掘与可视化技术[C]. 杭州:中国声学学会2005年青年学术会议,2005.

[2]亓文娟,晏杰. 数据挖掘中关联规则Apriori算法[J]. 计算机系统应用,2013,22(4):121-124.

[3]蔡程宇,娄渊胜. 聚类算法在数据挖掘领域的研究[J]. 哈尔滨商业大学学报(自然科学版),2015,31(2):237-241.

[4]丁浩. 数据挖掘中常用分类算法的分析比较[J]. 菏泽学院学报,2015,37(5):47-50.

[5]孙嘉睿.浅谈知识表示方法[J]. 信息系统工程, 2015(11):139-139.

[6]杨蓓,缑西梅,艾艳. 专家系统中的模糊知识表示及推理研究[J]. 郑州大学学报(理学版),2004,36(2):31-33.

[7]Quinlan J R. Improved Use Of Continuous Attributes In C4. 5[J]. Journal of Artificial Intelligence Research,1996,4(1):77-90.

[8]Breiman L, Friedman J H. Estimating Optimal Transformations For Multiple Regression & Correlation[J]. Journal of the American Statistical Association, 1985, 80(391): 580-598.

[9]LI Xiang,LI Tao. Classification Algorithm of Kernel-based In Adaboost[J]. Computer Knowledge & Technology, 2011,7(28):6970-6979.

[10]Agrawal R,Srikant R. Fast algorithms for mining association rules[C].Proc. 20th int. conf. very large data bases, VLDB. 1994,1215: 487-499.

[11]AGRAWAL R,IMIELINSKl T,SWAMI A.Mining association rules between sets of items in laFge databases[C]∥Proc the ACM SIGMOD International Conference on Mallagement of 126.com Data.Washington, DC,1993.

Investigation on Technologies of Battlefield Integrated TargetIdentification Based on Data Mining

LI Xiao-hua,LI Shu

(The 30th Research Institute of CETC,Chengdu 610041,China)

Abstract:Based on the analysis about the problems of battlefield target identification, this paper describes the architecture of the battlefield integrated target identification, and researches the corresponding key technologies such as knowledge representation of the target identification, knowledge mining of the target features, knowledge mining of the battle model, and intelligent inference of the integrated target identification, and shows the application of which on battlefield target identification, All these researches can provide automatic and intelligent measure for the battlefield integrated target identification.

Key words:data mining; knowledge of target features; knowledge of battle model; integrated identification

文章编号:1673-3819(2016)03-0016-08

收稿日期:2016-03-17

作者简介:李小花(1983-),女,重庆人,硕士研究生,工程师,研究方向为信息融合、信息安全等。

中图分类号:E919

文献标志码:A

DOI:10.3969/j.issn.1673-3819.2016.03.003

修回日期: 2016-03-24

李姝(1974-),女,高级工程师。

猜你喜欢
数据挖掘
基于数据挖掘探讨慢性肾衰竭处方规律
基于数据挖掘技术的非均衡数据分类研究
基于数据挖掘和海流要素的船舶导航改进研究
改进支持向量机在特征数据挖掘中的智能应用
基于数据挖掘的船舶航迹自动识别系统
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
基于数据挖掘的学业预警模型构建
基于数据挖掘的入侵检测技术在网络安全中的应用与研究
软件工程领域中的异常数据挖掘算法