基于本体的语义检索方法研究

2020-10-09 12:27王亚宁徐学文陈黎明鲁华杰
科教导刊·电子版 2020年19期
关键词:本体研究

王亚宁 徐学文 陈黎明 鲁华杰

摘 要 伴随着信息技术的发展,网络信息检索越来越受到重视,网络信息检索给用户收集信息带来了极大的便利。传统的网络信息搜索方式主要是以关键词搜索为主,虽然这种方式有很高的查询几率,但是却不能够做到精准搜索。本体注重对概念和概念之间关系的描述,是一种语义检索的算法和模型,其通过一元的概念描述和二元的角色描述,应用到信息检索系统的过程当中去,能够解决当下信息检索系统中语义处理不足的问题。本篇文章重点研究了基于本体的语义检索方法,并对领域本体这是信息库的搭建、储存以及语义推理等关键性技术进行了分析,并辅以具体实例对Jena推理机的机制进行了说明。

关键词 本体 语义检索 研究 语义关联

中图分类号:TP391.3文献标识码:A

0前言

随着社会的发展,Web已经成为了一个可检索化的的资源空间,搜索引擎技术日趋成熟,但是目前的搜索方式还是以关键字搜索为主,这种方式虽然简便快捷,但是缺乏对检索内容知识的理解,导致检索的结果大多是无用的网页。很显然,这种传统的检索方式已经不能够满足用户的需求了,所以探寻新的检索方式就成为了当下研究的重点。本体是一种有良好概念层次结构和逻辑推理的检索方法,能够对概念的内涵以及之间存在的关系进行阐述,通过本体可对语义进行精确搜索,而不是模糊的关键字搜索。其主要作用原理是将页面信息与知识结构规则相联系,获取更精准度的搜寻结果。本篇文章主要针对能够将语言查询转变为语义描绘的本体模式进行了研究,为用户提供更加精准的搜索资源。

1当下语义检索的主要现状

语义检索技术在近几年正朝着语义的查询扩展、个性化的查询和语义关联的几个方向发展。

语义的查询扩展主要是通过本体技术提高检索的准确率,主要思想是利用本体的知识将用户输入的关键字进行扩展。主要通过在本体库中查询关键字,并扩展关键字的相关概念进行检索。个性化信息查询是指通过对用户的个性特征获取个性化知识并应用到信息的搜索过程当中,对于两个不同的搜索用户的相似搜索要求,应反馈两个不同的查询结果。语义关联分析是指发现用户感兴趣板块之间的联系,这种方法主要分析了实体关系和模板之间的相似程度,而如何对有意义和无意义资源进行区分,也成为了语义关联分析研究的重要方向。

2系统化的体系结构

本次实验的系统主要采用的架构是B/S结构,其结构过程主要是用户通过浏览器向系统服务器发送查询要求,服务器通过关键字进行基于本体的信息检索过程,最终反馈检索结果给用户,其核心部分主要是在服务器上,几种种最主要的工作流程是:(1)剔除用户检索语言中不重要的部分,归纳其概念并应用到本体检索中去;(2)通过本体分析对用户查询的关键词进行语义推理与本体的扩展,最终的关键字反馈到SQL语句构造板块;(3)利用SQL语句构造模块将语句进行构造,并将信息反馈给结果处理模块;(4)将数据库中的信息通过检索排序算法反馈给用户。

3主要技术设计的实现

3.1领域本体知识库主要生成过程

本体知识库的生成过程能够将检索计算与语义推理进行运行,这个过程主要包括本体模型的构建过程本体的编码以及本体数据储存。

3.1.1构建本体模型的过程

本体是由多个概念和关系组合的,而构建模体就是要将这些概念和关系进行具体化的定义。本体工程化的创建主要包含自顶向下的开发,自顶向上的开发,以及从中间开发三种类型的开发方法,本篇文章主要是采用自顶向下的开发方法,在通用模型里构建相同的种类并进行细化。

在本体的语言规范当中,公理构造词句主要是对概念和实力之间的关系进行说明,本篇文章主要利用同位关系以及包含关系扩展查询推理。包含关系:主要对概念以及概念的上下位关系进行定义,用户在搜索一个概念时,也会检索其下位的关系概念,在包含关系中的OWL中运用rdfs:SubClassOf进行定义能够使检索的结果更加精确。同位关系:主要对主体和客体之间的等价系列进行定义,当查询条件中出现主体时,客体也可作为替代出现,在OWL中主要运用owl:equivalentClass进行具体定义。例如在手机领域的本体库当中,“Apple”与“苹果”就是属于同位关系,当用户在搜索“苹果”时,“Apple”就可以充当客体而出现,从而提高了搜索的精准率。

3.1.2本体的编码

本篇文章采用的本体编辑工具主要是Protege3.4beta,这种方法可以不考虑具体的本体描述语言,从概念上对领域本体模型进行设计,不仅如此,这种工具还可以对本体的类别、属性以及实例进行编辑。

3.1.3本体数据储存

本地文件储存:将本体库处存在本地文件当中,这种储存方式十分便捷,并且有助于文件的修改和备份,主要适用于小型的本体库;关系数据库储存:将本体库储存在关系数据库之中,主要储存本体库中的三元组数据,这种储存方式主要适用于大型的本体库,这也是本篇文章选用的本体数据储存方式。

3.2系统文本预处理模块

文本预处理模块主要是接收来自用户的自然言语,并将自然言语分解为词汇结合,对于词汇中没有意义的词进行合理的过滤,例如“是”、“过”、“的”等对于表达影响较小的词。用户对每个领域知识的查询都有相应的关键词进行对应,并且系统提供了问题的选择,每个分类的查询模板都会在系统界面上进行显示。用户输入的信息会分割成一个个词汇,主要利用的是中文基本词库进行下阶段的语义推理。

3.3语义推理

本体检索系统的核心部分就是语义推理,是区别关键字检索的有效方式。其主要是由推理程序所构成的,分析器首先对关键词进行查询,然后再根据推理规则与本体知识库完成用户检索信息的推理。本篇文章的语义推理主要是通过同位以及下位逻辑关系推理进行实现。

3.4系统检索功能的实现过程

系统检索功能主要是依靠Jena进行实现,对于OWL本体来说,Jena类与接口分别为类OntModel以及OntDocumentManager与本体接口OntClass,本体系统查询对于语义查询的关键主要是实现等同和包含逻辑关系推理机制,这也是和传统关键词检索方式存在的主要区别。

语义检索的具体查询过程:(1)使用Lucene分析器对用户输入的查询信息进行转换和过滤,得出具体的关键字;(2)将关键词和本体库中的相关定义或概念进行匹配,找到与关键词定义或概念相符合的关联类;(3)根据具体的查询条件找出能够与用户的搜索信息相匹配的类的实例,或者是实力的其他对应关系,最终将扩展后得到的关键字反映给搜索引擎模块。

4结语

本篇文章主要对本体技术运用到信息检索系统中的方法进行了研究,并构建了语义检索系统的初步模型,对模型的关键技术进行了研究和实践,作为信息检索的重要研究问题,应该從自然语言的理解以及挖掘数据方式等技术进行开展。虽然本体技术运用到信息检索系统当中会提高用户搜索的准确性,但是目前对于这方面的技术并不成熟,许多语义Web技术都有待进一步的研发,所以针对本体技术在信息检索系统中的具体应用,还需要进一步研究和实践。

参考文献

[1] 周兵,孟慧君,王栋.基于本体的语义相关度研究[J].现代计算机:专业版,2018,632(32):12-15.

[2] 汤再江,徐享忠,薛青等.作战行动本体构建及基于本体的语义推理[J].计算机仿真,2018,35(06):7-11+404.

[3] 于超,王璐,程道文.基于本体的教育资源语义检索系统研究[J].吉林大学学报:信息科学版,2018,36(02):98-103.

[4] 刘锋.基于领域本体的文本语义挖掘方法现状分析[J].湖南农机,2018,45(03):242.

猜你喜欢
本体研究
Abstracts and Key Words
FMS与YBT相关性的实证研究
2020年国内翻译研究述评
辽代千人邑研究述论
对姜夔自度曲音乐本体的现代解读
视错觉在平面设计中的应用与研究
EMA伺服控制系统研究
新版C-NCAP侧面碰撞假人损伤研究
基于本体的机械产品工艺知识表示
《我应该感到自豪才对》的本体性教学内容及启示