基于知识图谱的战略智能体BDI模型

2023-02-10 12:29李童心王维平李小波
系统工程与电子技术 2023年1期
关键词:三元组战略目标图谱

李童心, 王维平, 王 涛, 李小波

(国防科技大学系统工程学院, 湖南 长沙 410073)

0 引 言

战略是研究军事力量运用与建设全局性指导规律的理论,随着人类对军事力量运用与建设指导规律认识的逐步深化而不断发展。战略的基本成分包括战略目标、战略方针和战略手段[1]。战略目标是国家为了实现总的政治目的而对军事斗争提出的基本要求,是在一定时期内军事斗争的基本指向和全局上所要达到的最终结果,主要是解决“做什么”的问题;战略方针是指导军事斗争和军事力量建设全局的总纲领、总原则,主要解决“怎么做”的问题;战略手段是实现战略目标的力量及其作用方式,主要解决“用什么做”的问题,即用什么进行军事斗争和怎样进行军事斗争,是战略指导者根据战略目标和战略方针的要求,使用军事力量,开展军事斗争的具体行动。从很大程度上来讲,战略是目标和手段的统一,战略手段是战略研究中最为重要的内容。没有战略手段的战略是不存在的,也是毫无意义的,战略目标和战略方针规定战略行动的目标、方向、纲领和准则,以及实现目标的基本途径,但还不是行动本身,只有通过战略手段,才能将其付诸实施,使其得以贯彻落实。如何系统、有效地刻画、建模分析和评估对手的战略,是军事战略指导需要关注的重点,是新形势下的军事力量建设与运用的重要参考,也是值得研究的重要问题。

战略目标的实现需要相关建设项目来支撑:① 科技和人才是打赢信息化战争的关键,建设项目是发展科技、培养人才的重要手段,项目投资可以直接反应对手对相关领域的重视程度;② 一方面,项目投资是对手战略目标的重要体现,另一方面,对手的战略目标也需要通过投资相关项目付诸实施;③项目投资涉及到政治、经济、地理、科技、外交、文化等相关领域,有利于系统、宏观地研究对手战略目标;④ 和平与发展仍然是当今时代的主题,特别是对我国而言,虽同对手在诸多领域进行激烈斗争,但并未有任何军事或战争行动,直接通过军事行为研究对手战略目标素材较少。故本文将对手的项目投资视为其战略手段,并建模、分析和评估建设项目与战略目标的关系。

在新形势下,军事战略研究涉及的空间和领域越来越广,关注的问题越来越多,虽然有海量的数据,但是存在数据利用难、组织难的问题。同时,随着对战略目标研究的深入,对科学性、时效性的要求也越来越高,但是传统的研究方法和手段比较单一,大都以定性分析、主观判断为主,定量分析、检验手段少,并且很少有研究把战略目标与建设项目结合起来进行分析,缺少项目和战略目标分析的统一框架[2]。如何对战略目标与建设项目数据进行有效的组织、挖掘和关联,并分析建设项目与战略目标的关系,是一个重要问题。

本文创新性地提出了战略智能体信念-愿望-意图(belief-desire-intention, BDI)模型作为研究建设项目与战略目标的逻辑框架,采用知识图谱存储建设项目和战略目标的相关知识,最终用知识图谱推理等技术实现战略智能体BDI模型,为战略目标与建设项目预实践研究提供了一种新思路。本文首先提出战略智能体BDI模型框架,然后介绍知识图谱技术在建设项目和战略目标研究中的应用,最后详细介绍知识图谱相关技术在战略智能体BDI模型中的应用,研究建设项目与战略目标的关系。

1 战略智能体BDI模型

1.1 BDI模型

本文提出战略智能体BDI模型的思想来源于BDI模型[3]。BDI概念的哲学观点源自Bratman,这一模型的特点在于通过简单的形式,较清晰地揭示人类自主体的结构。从构成上说,自主体是信念、愿望、意图的三元组(B、D、I)。从过程上说,自主体完成它的推理要经过如图1所示的阶段[4]。

图1 BDI模型框架Fig.1 BDI model framework

由图1可知,自主体在得到感知的环境信息后,基于已有信念,通过信念修正函数,形成新的信念集合。自主体的选择生成函数基于已有的信念,形成相应的愿望。自主体的过滤函数,根据当前的信息、愿望和意图,确定新的意图,以便在多种可能行为中做出选择。最后,自主体借助行动选择函数,根据意图确定接下来要执行的行动[5]。

1.2 战略智能体BDI模型框架

将BDI模型的思想引入到建设项目和战略目标的研究中,本文提出了战略智能体BDI模型框架,与BDI模型从信念、愿望到意图的自顶向下的分析思路不同,本文提出的是从项目、体系、能力到目标的自底向上的分析逻辑框架[6],如图2所示。其中,战略目标的实现以军事方面的能力为核心,同时包括政治、经济、地理、科技、外交、文化等相关领域在内的综合能力。这种能力既可以是现实能力,也可以是潜在能力;既可以是硬实力,也可以是软实力。其作用方式,既可以是战争行动,也可以是非军事行动,既可以通过威慑,也可以通过实战。能力的实现需要相关体系来保障,不同的体系组合形成能力。而一个体系是由相关建设项目构成的,多种项目支撑起体系构建。通过项目-体系推理机,可以推理出建设项目的所属体系类别;通过体系-能力推理机,可以推理出不同体系组合构成的能力;通过能力-目标推理机,可以从当前能力建设推理出战略目标。

图2 战略智能体BDI模型框架Fig.2 Strategic agent BDI model framework

战略智能体BDI模型把项目和战略目标放在了统一框架下进行分析,提出了从项目、体系、能力到战略目标分析的逻辑框架,本文在第2节引入信息抽取和知识图谱技术,以此实现所提的模型。

2 知识图谱技术

知识图谱技术的发展为研究建设项目与战略目标带来了契机。知识图谱是一种知识表示形式[7],知识表示是对人类知识或现实世界事实的形式化建模[8],有效的知识表示方法能够实现知识从人类可读到机器可读的转换[9],能够支持数据的查询、扩展、融合、关联和推理[10]。合理的知识表示不仅使问题更容易解决,而且具有更高的效率[11]。

通过构建知识图谱,可以自动化地从非结构化数据中抽取实体、关系等结构化知识[12-14],将知识图谱引入到建设项目与战略目标的研究中,可以有效解决目前的困境。首先,知识图谱的模式层可以有效表示领域专家知识[15],这部分知识定义并约束了实例层数据,同时可以作为先验知识,指导信息抽取和后续的其他任务[16-18];其次,知识图谱可以系统化地建模各领域的知识,并将众多领域知识表示在统一的框架之下,同时也能将战略研究关注的众多问题置于统一的框架下进行分析研究,有利于系统、全面地分析对手建设项目与战略目标的关系[19];再次,知识图谱建模的是结构化、机器可读的知识,有利于知识的快读检索、知识共享和知识关联分析;最后,由于各建设项目往往是孤立存在的,通过知识图谱推理等技术可以进一步挖掘建设项目间的潜在关联关系。同时,知识建设项目的属性、关联关系等信息可能存在错误,通过不同数据源间的关联验证和知识纠错技术,可以发现并纠正知识图谱中的错误信息,为研究建设项目与战略目标的关系提供更加丰富、准确、完整的信息[20-22]。

本文的主要研究基于知识图谱的推理机实现。为了提高知识图谱的推理效率,本文引入知识图谱嵌入技术,也称为知识表示学习,将知识图谱中包含的实体和关系嵌入到连续的向量空间中,从而在保持知识图谱内在结构和信息的同时简化操作,提高计算效率,可以用于知识图谱补全、关系提取、知识推理等各种下游任务,得到了广泛的关注。随着知识规模的不断扩增,传统的资源描述框架(resource description framework,RDF)知识表示方法难以应对大规模知识的表示问题。因此,为了更好地表示知识的特征,本文需要利用知识表示学习技术来表示知识的潜在特征。

在描述知识表示学习相关技术之前,本文首先对知识表示技术中的相关符号进行说明。其中,G表示一个知识图谱;E和R分别表示实体和关系集合;T表示三元组集合;ei表示实体集合中的第i个实体,rj表示关系集合中的第j个关系。除此之外,ei也可以根据实体在知识图谱三元组中的位置分为头实体h和尾实体t;τ=(e1,r,e2)或者τ=(h,r,t)表示一个三元组;ei和rj分别表示实体和关系的低维向量(矩阵);de和dr分别表示实体和关系空间的维度,|E|和|R|表示实体关系集合的长度。

定义 1(知识图谱嵌入)给定一个知识图谱G=(E,R,T),知识图谱嵌入可以表示为一个步骤映射f:ei→ei∈Rde,rj→rj∈Rdr。其中,de≪|E|,dr≪|R|。

在知识嵌入模型中,最关键的就是设计映射函数f,进而可得到更好的实体关系潜在特征。一般而言,知识图谱的嵌入主要基于知识图谱中已经存在的三元组,也有一些方法需要用到知识图谱中的属性、文本描述等信息。给定一个知识图谱,知识图谱的嵌入首先需要将实体和关系表示成低维空间的连续向量,然后定义一个得分函数来评估这个三元组成立的概率,最终实体和关系的嵌入可以通过最大化全局概率获得。目前,知识图谱嵌入的方法主要分为3类:基于平移的距离模型[23-26]、基于张量分解模型[27-28]和基于神经网络的模型[29-34]。除此之外,在这些方法的基础上,还有一些模型利用图谱中的辅助信息来进一步增强知识图谱嵌入[35-37]。

通过将知识图谱及其推理技术引入到建设项目数据和战略目标的研究中,再结合战略智能体BDI模型,可以有效解决新形势下战略研究面临的挑战。然而,本文构建的建设项目与战略规划领域的知识图谱是特定领域知识图谱,相较于开放领域知识图谱,存在较大的差异,尤其表现在建设项目涉及的诸多因素存在较大的不确定性,包括对预测和估算的各项投入、产出数据的不确定性以及项目间关联关系的不确定性等。传统的知识图谱无法表示数据间的不确定信息,本文对知识图谱中的每个三元组赋权重,即置信度分数,表示三元组成立的可能性,称其为不确定知识图谱。本文研究的推理机主要针对建设项目与战略规划领域的不确定知识图谱进行推理。

3 基于知识图谱的战略智能体BDI模型

本文经过前期的调研,得到了美国战略和预算评估报告、美政府问责局审计报告、兰德公司战略研究报告等公开的评估案例数据,其中包含了大量的表格数据、网页数据与文本报告。经过数据预处理,本文获取了对方的国防建设项目经费投入投向等结构化数据、对各个项目详细描述的半结构化数据,以及相关战略与能力评估报告的文本类数据。基于这些数据,本文提出基于知识图谱的战略智能体BDI模型框架,形成从建设项目到战略目标的一体化分析流程,最终得到相对完善的国防建设项目-战略目标图谱,如图3所示。

图3 基于知识图谱的战略智能体BDI模型框架Fig.3 Strategic agent BDI model framework based on knowledge graph

3.1 三类知识图谱

国防建设项目图谱用来表达对手项目预算在各重大战略领域的实际投入分布情况。具体而言,国防建设项目图谱以项目为中心,包含众多概念、关系和属性的领域知识图谱。其基于这样的假设:对手在某战略领域的投资预算越大,则在该领域的战略意图越明显。因此,关联分析不同战略领域的项目预算分布,可为感知、识别和判断对手战略意图提供重要基础和参考。国防建设项目图谱构建是领域知识图谱,主要包括项目本体建模和项目图谱构建,与一般的开放领域知识图谱(采用自底向上的方式构建)不同,通常采用自顶向下的方式构建,包括模式层(用本体表示)和实例层。模式层由领域专家参与构建,表达了国防项目投资分析领域内广泛认可的知识和公理,定义了领域内概念分类体系、关系、属性、数据类型和知识边界,同时严格定义和约束了实例层数据,是国防建设项目图谱的重要组成部分。实例层由大量的国防项目投资实例数据组成,比如国防经费投入投向数据等。

战略评估图谱以战略目标和能力建设为中心,用来表达和刻画战略目标间的关联关系,以及战略目标与其支撑项能力建设的关联关系。这些关联关系可能是间接的、隐式的,需要通过关联分析和知识推理的方式获取。战略评估图谱也是领域知识图谱,其构建过程与国防建设项目图谱类似,不同之处在于构建战略评估图谱的数据源为文本类非结构化数据,需要从中抽取出需要的实体和关系知识。

国防建设项目-战略图谱是由上述两类知识图谱经过融合后得到的知识图谱。

3.2 推理机

推理机是指一系列的推理规则和推理算法的有机组合。为了提高建设项目知识图谱的推理效率,需要将知识图谱中的实体和关系表示到向量空间,但是直接将针对开放领域知识图谱的表示学习方法用于建设项目知识图谱的向量化会存在很多缺陷:一方面,当前知识图谱嵌入主要研究的是基于确定性知识图谱的表示学习,对不确定知识图谱嵌入的研究很少,而本文采用置信度分数表示每个三元组的可靠性程度,包含了丰富的背景知识,将其引入到知识图谱的表示学习中至关重要;另一方面,本文构建的知识图谱是领域知识图谱,其背后隐藏了大量的规则知识,大多数现有方法仅基于事实三元组执行嵌入任务,针对其中包含的逻辑规则并未进行深入研究。而逻辑规则包含了丰富的背景知识,对下游的知识图谱推理应用具有重要价值。现有的知识表示学习方法较少地全面考虑不确定性和图谱背后的逻辑规则,将这些方法直接用于本文构建的知识图谱的表示学习,会导致大量先验信息的损失,进而对后续推理任务产生不利影响。

针对以上问题,本文参考文献[38]提出的不确定知识图谱的嵌入方法,提出融入权重和逻辑规则的建设项目领域知识图谱表示学习方法,在知识表示学习的过程中同时考虑权重信息,并把逻辑规则嵌入到学习模型当中,以保证在向量化的过程中损失的信息更少,提高下游推理的准确性。

3.2.1 嵌入权重信息

首先,考虑利用每个三元组的权重信息,本文建立嵌入模型的三元组置信度得分,并把每个三元组训练得到的权重与其真实值进行比较。一个三元组的可信度定义如下。

定义 2(可信度)给定一个关系事实三元组l,可信度g(l)∈R表示这个关系成立的可能性。可信度可被视为是未被标准化的置信度得分s,其值的大小代表了s的大小。

给定一个三元组l=(h,r,t),其相应的嵌入向量为h,r,t,参考TransE模型[39]基于距离的思想和DistMult模型[40]基于语义相似度的思想,本文建模了两种可信度函数:

(1)

g(l)=r·(h∘t)

(2)

为了把可信度转换为置信度得分,采用转换函数φ(·)把g(l)映射到置信度得分f(l)。

f(l)=φ(g(l)),φ:R→[0,1]

(3)

本文考虑了两种映射函数:一种是采用逻辑函数,一种采用线性有界函数。

(4)

φ(x)=min(max(wx+b,0),1)

(5)

3.2.2 嵌入逻辑规则

为了更好地评估置信度得分,应该充分利用知识图谱中存在和不可见的关系事实。为了更合理地评估不可见的关系事实的置信度,本文充分利用知识图谱背后包含的规则信息,采用概率软逻辑把逻辑推理嵌入到模型当中。逻辑规则是由规则头和规则主体以head←body的形式定义的。规则头是一个原子,例如一个头实体或尾实体可变的三元组,其规则主体通常是原子的集合。例如:

(A,similarTo,C)←
(A,similarTo,B)∧(B,similarTo,C)

(6)

式(6)是一条非常简单的传递性规则,其语义是,如果项目A与项目B是相似的(研究类似的问题),项目B与项目C是相似的,那么可以推理出项目A与项目C是相似的,来进一步补全实体A和C之间的关系。规则推理具有很好的解释性和准确率,本文的规则来源主要有两个方面:首先,针对建设项目领域知识图谱,可以通过领域专家的先验知识,采用人工的方式构建;另一方面,通过规则挖掘系统基于不完备知识库的关联规则挖掘算法,是利用知识图谱中的频繁模式挖掘规则的方法。由逻辑规则可以产生基本规则,即规则头和规则体中的三元组包含的是具体的实体。

与布尔逻辑不同,概率软逻辑将每个三元组与区间为[0,1]的软真值关联起来,这与本文中的置信度分数相对应,使模糊推理成为可能。把软真值的赋值过程称为解释,本文把三元组l的软真值解释为I(l)。对于知识图谱中已经存在的关系事实,其置信度得分也存在;对于看不见的三元组,可采用前面定义的基于嵌入的置信度得分函数:

I(l)=sl,l∈L+

(7)

I(l)=f(l),l∈L-

(8)

式中:L+表示知识图谱中可观测到的三元组集合;L-表示知识图谱中不可见的三元组集合;sl表示已有三元组的置信度分数。

l1∧l2=max{0,I(l1)+I(l2)-1}

(9)

l1∨l2=min{1,I(l1)+I(l2)}

(10)

(11)

pγbody→γhead=min{1,1-I(γbody)+I(γhead)}

(12)

当规则头I(γhead)等于或高于其规则体I(γbody)时,此规则γ才是合理的。定义基本规则与达到合理性的距离如下:

dγ=1-pγ=max{0,I(γbody)-I(γhead)}

(13)

对于知识图谱中不可见的关系三元组l=(h,r,t)∈L-,定义基本规则γ0:

(14)

dγ0=f(l)

(15)

3.2.3 定义损失函数

最后,本文把置信度得分信息与逻辑推理同时嵌入到损失函数当中,训练最优化函数,得到最终的实体和关系的嵌入向量。

首先,要计算知识图谱中可见的关系事实的损失,设L+是知识图谱中可见的关系事实集,目标是最小化真实的置信度得分sl与预测得分f(l)之间的均方误差:

(16)

其次,不可见关系事实的损失为

(17)

式中:Γl表示三元组l作为规则头的基本规则集;ωγ表示规则γ的权重。

最后,得到联合目标损失函数为

(18)

本文给出了两种可信度函数和两种映射函数,可以组合出4种不同的模型。通过最优化联合目标损失函数,得到4种模型最优的实体和关系的向量表示,通过不同的评估指标,可以选择最终的知识图谱,将其嵌入向量,以实现推理。

3.3 3种推理机

基于知识图谱的战略智能体BDI模型重点研究了基于知识图谱相关技术实现项目-体系推理机、能力-目标推理机以及体系-能力推理机。

项目-体系推理机从国防经费投入投向等结构化数据出发,通过本体建模(主要包括项目编号、项目简短描述、年份、类别、研发需求经费、白宫授权经费、参议院授权经费、国会变更经费和国会授权经费等项目信息)和图谱构建,构建国防建设项目图谱;再从相关项目信息的半结构化数据中抽取出有关项目体系的文本信息,人工提取与领域体系相关的特征,基于此对单个项目进行分类,找出各个项目对应的体系类别,并通过实体链接技术加入到项目图谱中。项目-体系推理机的实现重点在于基于知识图谱技术对项目进行分类,使数据从项目层链接到体系类别信息。

能力-目标推理机从相关战略与能力评估报告的非结构化数据出发,通过实体和关系抽取、多源数据融合、图谱构建、知识图谱内部的补全和推理等,构建战略评估图谱。能力-目标推理机直接从文档报告中,通过一系列知识图谱构建技术,把能力与战略目标映射起来。能力-目标推理机的实现重点在于从文本中联合抽取能力与战略目标实体,并将其链接到知识图谱中。

体系-能力推理机是对已构建的两类知识图谱进行知识图谱融合[41-42]、知识图谱质量提高、知识推理[43],最终得到国防建设项目-战略图谱。体系-能力推理机可实现最终的目的,完成从建设项目到战略目标的映射,并且可以用项目知识图谱补全战略目标的缺失信息。更进一步,利用项目信息对战略目标中的错误信息进行修正,完善国防建设项目-战略目标图谱建设,为新时期制定对等或反制对手的军事战略方针提供重要参考和指导。体系-能力推理机的实现重点在于两类知识图谱的融合机制,本文通过人工设计战略领域体系与建设能力的对应关系,对项目和战略图谱进行融合,最终得到的国防建设项目—战略知识图谱,如图4所示。

图4 国防建设项目-战略知识图谱Fig.4 National defense construction project-strategic knowledge graph

4 结 论

本文采用信息抽取和知识图谱技术挖掘和存储建设项目和战略目标的相关知识,基于建设项目-体系-能力-战略目标的一体化分析流程,创新性地提出了基于知识图谱的战略智能体BDI模型,并将其作为研究建设项目与战略目标的框架,可以有效解决新形势下战略研究面临的挑战,为战略目标与建设项目预实践研究提供了一种新思路。然而,仍存在一些问题需要进一步研究:① 缺少该领域的语料库,且大量数据没有标注,采用人工标注耗时耗力;② 针对该领域,专家往往只是针对某部分表达专业知识,缺少全面地描述信息,难以支撑模式层(本体)知识构建;③ 目前采用的都是公开领域的信息抽取方法,缺少针对该领域的专有实体、关系的抽取方法;④ 基于项目-战略知识图谱,不仅需要补全已知项目缺失的战略目标信息,还需要通过表示学习,预测新项目的战略目标。

猜你喜欢
三元组战略目标图谱
碳达峰、碳中和战略目标下煤炭洗选技术的发展
特征标三元组的本原诱导子
绘一张成长图谱
京东方大学堂:提升组织业绩 推动战略目标实现
关于余挠三元组的periodic-模
一个时态RDF存储系统的设计与实现
补肾强身片UPLC指纹图谱
主动对接你思维的知识图谱
“第一生产力”是实现“四个全面”战略目标的内在动力
推行综合平衡记分卡的战略目标与实践