基于符号语义映射神经网络模型的知识图谱表示学习算法

2020-04-20 06:24宁梦飞
计算机与网络 2020年2期
关键词:知识库图谱语义

宁梦飞

对于构建知识图谱并加以应用来讲,图的分布式表示尤为关键,本文經过对比目前广泛应用的图示学习模型,对现有模型存在的不合理问题进行分析,并提出基于符号语义映射的神经网络模型,应用于学习图分布式表示。发现该模型能够以知识图谱内存在的实体类关系数据为依据,运用循环神经网络完成对符号组合的语义编码,并最终向目标符号完成映射。

1引言

知识图谱作为基于资源描述框架所构建的语义知识库,在表示存储中用实体、关系和尾实体三元组形式,实现了关系联结实体的网状知识结构。本文将用三元组表示事实,head表示头实体、rel表示关系、tail表示尾实体。目前该领域相关研究中主要基于不同假设划分为两类模型:矩阵分解模型和随机游走模型。尽管这两类建模思路,应用于标准数据集测试效果显著,但是仍然存在较差泛化能力、模型理论基础不完备等问题。所以开展对基于符号语义映射神经网络模型的知识图谱表示学习算法研究。

2符号语义映射模型

2.1符号系统描述

多关系知识图谱可以视作三维二元张量,建立其中切片对应rel关系类型的邻接矩阵,通过运用三元组表示事实,头实体用head表示,尾实体用tail表示,实体集用表示,关系类型集合内存在的某关系类别用rel表示。

2.2基础模型概述

本文设计的该模型主要为了解决两方面问题:一是如何基于“导演、战狼”标识,完成合适分类表示的构建;二是如何构建可靠预感机制,区分答案集内与“导演、战狼”标识易混淆的成员。基于Seq2Seq模型内所获灵感,该模型已被证实能够经符号序列生成组合表示可行,所以具备较强解码能力可以向对应符号系统直接映射组合表示。所以本文设计了基于SSME的模型能够为知识图谱内实体关系学习维实值向量表示嵌入关系如图1所示。

2.3 SSME模型

为了能够对同映射框架中的实体预测及关系预测任务加以处理,如上建立SSME基础模型,并引入附加符号溯源任务模块,负责学习由组合表示目标关系类型的映射模式。本文称基础模型为实体预测模块,此模型为关系预测模块,基本结构为编码器结构部位。由于该模块结构比较接近于基础模块,但是该模块达到的输出向量太小,且两模块参数都彼此独立存在,所以可以将不同视角完成映射方式构造表示,定义模型损失函数定义公式如下:

式中,等式后的两个相加部分分别表示每模块平均交叉熵损失,且能够互相叠加所以解释交叉熵损失,作为针对既定输入情况下观察目标的概率负对数似然。展开模型训练过程中量模块参数能够根据如上公式实现反向传播更新。

3实验分析

3.1实验数据

对SSME完成知识图谱扩容任务评估,通过运用基准数据集FB15K及WN18作为基准数据集,形成FB15K-237及WN18RR的扩张数据集,其中知识库子集用FB15K表示,其中大多数数据都与密切相关电影及体育主题。由Word Net知识库内采样所得WN18数据集,主要包括了词汇关系、语义概念,该类实体主要用严格等级方式组织。并且本研究还建立了基于复杂网络研究领域内图的多标签分类(MLC)任务对SSME模型有效性进行评估。

3.2实验设置

由于篇幅仅说明本次实验的2个目的,一是对SSME模型基于知识图谱扩容任务有效性加以验证;二是对SSME模型基于大型复杂网络内嵌入学习能力进行验证。

3.3知识图谱扩容任务

经测试所得数据集试验结果,根据该结果能够发现4个数据集中,SSME模型较其他模型具备较强指标优势,包括1、3、10P@N指标。假若考虑FB15K中P@1预测精准度,较ConvE模型、CompIEx模型,SSME模型明显超出19.10 %、32.33 %,十分明显模型优势。表示了SSME训练得到嵌入学习能力,能够有效提升Freebase知识库等下游应用程序性能。

4结束语

综上所述,经过本次对基于符号语义映射神经网络模型的知识图谱表示学习算法的研究。通过建立SSME模型发现该模型,能够以知识图谱内存在的实体类关系数据为依据,运用循环神经网络完成对符号组合的语义编码,并最终向目标符号完成映射。

猜你喜欢
知识库图谱语义
基于CiteSpace的我国文化“走出去”研究的知识图谱分析(2001-2020)
韩国语“容入-离析”关系表达及认知语义解释
我国机构知识库内容质量服务探讨
图表
相关度排序的知识库检索排序方法研究
最精确人类大脑图谱出炉
基于Lucene搜索引擎的研究
位置与方向测试题
中国知名官方智库图谱