职业能力导向下高职专业领域知识图谱模式的构建研究

2023-07-10 05:54韦量杨吉才卜一川
广西教育·C版 2023年4期
关键词:知识图谱

韦量 杨吉才 卜一川

【摘要】本文论述职业能力导向下高职专业领域知识图谱模式的构建,认为知识图谱是当今知识工程的先进技术,将其应用于自适应系统的领域模型构建有助于智能化、个性化教学的发展,提出高职专业领域的本体构建流程,即经过专业领域体系分析、本体构建、本体表征三个步骤,设计职业能力导向下的高职专业领域知识图谱模式结构并使用Protégé软件对本体模型进行编辑与设计,实现对专业领域模型层本体的构建。

【关键词】知识图谱 领域模型 高职专业教学

【中图分类号】G64 【文献标识码】A

【文章编号】0450-9889(2023)12-0004-06

知识图谱(Knowledge Graph,KG)最初是以科学知识计量为对象,通过图示化展现知识的结构关系,属于科学计量学的研究范畴(陈悦、刘则渊,2005)。为了优化搜索引擎和提高用户体验,2012年Google公司首次在搜索引擎中加入知识图谱功能,受到工业界和学术界越来越多的关注。随着自然语言处理、深度学习等人工智能技术的突破,知识图谱被大量应用于网络搜索、医疗、电商、金融等行业领域中,并在智能推荐、智能问答、智能分析与智能决策等系统中发挥重要的作用。

近年来,随着云计算、大数据、人工智能、5G等新一代信息技术的发展,我国教育信息化不断深入发展,中国教育数字化转型的步伐不断加快,各种智能化技术正在引发新一轮教育变革,传统的教育方式正在向智慧教育与个性化教育转型与演化(胡钦太、刘丽清、郑凯,2019)。智慧教育、个性化教育的实现离不开底层自适应学习系统的有效支撑。领域模型是自适应学习系统的基础和核心组件,用于在系统内实现知识以及知识之间关系的表征和管理,用于解决系统内学习者“学什么”的問题。多年来,自适应学习系统的发展受限于领域模型的发展瓶颈。知识图谱是当今知识工程的先进技术,以有向图的形式对知识进行形式化表达和组织,从而将知识构建为一种计算机可理解、可计算、可推理的语义网络,进而实现对知识的有效组织和管理(诸云强、孙凯、胡修棉等,2022)。知识图谱的出现为自适应学习系统的领域模型构建带来新的机遇和新的支撑技术。当前,将知识图谱应用于智慧、个性化教育体系的研究成为国内学界与业界的研究热点。

知识图谱模式是对领域内概念类、概念类属性及概念间关系的一种抽象表达,是知识图谱构建的核心(董晓晓、周东岱等,2022)。经过文献对比分析发现,研究者多关注知识图谱在普通教育领域的构建研究,缺少对高等职业教育领域知识图谱的构建研究。高职教育注重提升学生的职业能力,以培养高素质技术技能人才为目标。已有的教育知识图谱,缺乏对职业能力的刻画,难以满足高职专业教学需要。基于此,本文在文献梳理分析基础上,以职业能力为导向探索高职专业教学领域知识图谱模式的构建,旨在进一步推动高职教育领域知识图谱的研究与应用,以期将知识图谱应用于高职专业教学、自适应学习系统,促进智能化、个性化教学发展。

一、知识图谱及其在教育领域的应用分析

(一)知识图谱概述

知识图谱是基于语义网络的可视化知识库,是知识被抽象为概念类或实体、属性、关系的集合,是由表示概念类或实体的节点、表示实体属性或实体关系的边组成的有向图。三元组是知识图谱常用的表示方式,即KG=(E,R,S),其中E={e1,e2…e|E|}表示实体集合,共包含|E|种不同实体;R={r1,r2…r|R|}表示关系集合,共包含|R|种不同关系;S?E×R×E代表知识库中三元组集合(徐增林、盛泳潘、贺丽荣等,2015)。

知识图谱按知识组成层次可分为模式层和数据层,其构建方式主要有自顶向下和自底向上两种方式。自顶向下指在构建知识图谱时先定义本体和数据模式,再将实体添加到知识库。而自底向上与自顶向下相反,先从各类数据提取实体,从中选取置信度较高的实体加入知识库,再定义本体和数据模式(徐增林、盛泳潘、贺丽荣等,2015)。按应用领域划分,知识图谱可以分为通用知识图谱和领域知识图谱。目前,国外知名的通用知识图谱有Freebase、YAGO、ConceptNet、wordnet、DBpedia、Wikidata等,而国内知名的通用知识图谱有zhishi.me、cnSchema.org、OpenKG.cn、XLORE等,其广泛应用于智能搜索引擎和大规模知识库。当前,国内知名的领域知识图谱比较少,特别是教育领域知识图谱还处于探索起步阶段,缺乏统一的标准。

(二)教育知识图谱构建现状分析

教育知识图谱可视为知识图谱在教育领域的应用,指对教育领域的知识及知识之间关系以有向图方式进行形式化表征与组织,使知识能被计算机可理解、可计算、可推理,从而实现对知识的有效组织、管理与应用。在自适应学习系统中,使用知识图谱构建领域模型有助于实现知识的序列化,同时可以为学习者提供适切学习资源和学习路径等自适应服务。

当前,越来越多的学者聚焦于教育知识图谱的构建研究。张春霞等人以数学类课程为研究对象,构建了数学课程本体,设计了基于数学课程本体的数学课程知识图谱构建方法。钟卓等人提出了能够建立知识、问题、能力三者间映射关系的教育知识图谱KQA模型及其构建方法。李艳燕等人提出学科知识图谱在智慧教育中的构建路径及其在智慧教育中的六大应用场景。李振等人提出一种教育知识图谱概念模型EKGCM模型与一种基于智能处理技术的构建方法。

梳理和分析现有教育领域知识图谱构建的研究发现,国内研究者多关注普通教育知识图谱模型构建的研究,缺少对高职教育领域知识图谱构建的关注,少数涉及高职教育领域知识图谱的研究,其中以仅涉及某一课程知识图谱的研究为多,缺乏对高职专业领域知识图谱模式的构建研究,同时存在对职业能力描述不足的问题。

职业教育有别于普通教育,其首要属性是职业性,以职业的任职要求作为职业教育的逻辑起点。高职以职业能力为导向,倡导以能力本位课程模式作为课程教学模式,主要培养服务区域发展的高素质技术技能人才,在培养过程中注重思想道德教育、知识传授和职业技能培养,强化学生的职业能力并增强学生的职业适应能力。虽然普通教育领域知识图谱模型构建具备一般性,但缺乏对高职专业课程教学规律、关系和规则等教学因素的考虑,难以有效促进高职专业领域知识图谱的构建研究。

二、高职专业领域知识图谱模式的构建

(一)构建流程

高职专业领域知识图谱是指以职业能力为导向,按照高职专业的培养目标,使用知识图谱对专业面向的职业岗位群所需的知识、技能及其关系进行表征与组织,并应用于专业教学、自适应学习系统。其构建流程按照知识组成层次分为模式层构建和数据层构建两个阶段。

模式层,又称为本体层,是知识图谱的核心,本体构建的主要方法有METHONTOLOGY法、TOVE法、骨架法、五步循环法、七步法等(黄健,2019)。七步法适用于各领域的本体构建,具有较强的通用性,因此本研究在七步法构建思想的基础上进行简化,其构建流程如图1所示,经过专业领域体系分析、本体构建、本体表征三个步骤,对高职专业课程知识技能体系的概念类、关系、属性进行系统化定义与表征,实现对专业教学领域模型层本体的构建。专业领域体系分析主要梳理高职专业教学领域的知识技能体系,确定本体构建目标和领域范围,设计本体架构,明确本体核心概念。本体构建是指根据本体核心概念定义概念层次结构,明确其属性与关系等。本体表征指使用Protégé工具对本体进行形式化表达。

数据层,又称为实例层,在模式层的规则约束下,提取本体所对应的实体、实体属性与关系。数据层构建阶段主要包括知识抽取、知识融合、知识加工等三个步骤。知识抽取指从多种数据源中获取数据并经过数据预处理后抽取实体及其属性、关系等。知识融合是指对抽取的知识实体及其属性进行对齐融合,并进行关系匹配,消除语义歧义与异构。知识加工指为了确保知识准确性而对知识实体及其属性、关系等进行质量评估,并在现有知识上通过知识计算推理方法补充遗漏的知识实体及其属性、关系。

(二)构建方法

本体论是构建知识图谱本体的理论基础,其通过元本体定义概念类以及概念类之间的关系,实现知识的共享与复用。高职教育是以市场需求为导向,针对职业岗位群适时调整人才培养方案,以思想政治教育与技术技能培养融合为目标。因此,本研究根据高职教育教学基本原理与规律,遵循高职专业教学标准,借鉴斯坦福大学提出的本体构建七步法,对高职专业领域知识图谱模式进行构建。

1.专业领域体系分析

(1)明确本体构建目标和领域范围

要明确本体构建目标,首先要明确专业培养目标。不同层次的教育具有各自的教育特点和不同的培养目标。高职专业教学以职业为逻辑起点,以就业为导向,面向职业岗位群需求,培养高素质技术技能人才。因此,使用职业分析方法进行专业课程开发,科学分析、描述和确认职业岗位群的工作任务与职业能力,厘清高职专业所面向的职业岗位群的知识技能体系,是专业人才培养方案的培养目标,是专业课程体系、专业教学标准的制定依据,是专业教学内容开发和组织的来源。明确专业培养目标,才能解决高职教育“为谁培养人、培养什么人、怎样培养人”的根本问题。

其次,分析专业领域知识图谱的应用需求确定其领域范围。本研究构建专业领域知识图谱的目标是对专业课程体系的知识技能结构进行规范化表征与展示,用于构建自适应学习系统的领域模型,并在在线学习平台上实现知识技能体系的可视化,辅助教师进行精准教学设计,是自适应学习系统自动评估学生的能力水平并为学习者提供适切学习资源、学习路径等个性化服务的基础,以促进个性化、智能化教学的发展。此外,为了解决高职专业领域知识图谱对职业能力描述不足的问题,通过分析学习任务活动的实施与完成情况,进而实现对职业能力的量化和评估。因此,其知识图谱不仅需要表征知识的语义信息,还需要表征与之相关的职业技能、学习资源、学习路径、学习任务等语义信息。

最后,考虑是否可以复用现有本体。分析现有知名的通用知识图谱和领域知识图谱的本地库发现,目前没有标准的资源库可以直接用于高职专业教学领域本体的构建,而当前高职专业教学领域的本体和知识图谱的研究还处于起步阶段,尚未完善。为了实现本体的共享与复用,可以参考教育部教育信息化技术标准进行本体构建。

(2)本体架构设计

首先,列举高职专业教学领域涉及的重要概念与术语。通常,学生、教师、教学内容是高职专业教学构成的基本要素。教学内容指在专业课程教学活动组织过程中用到的素材和动态生成的信息,包括用于教学活动的学习资源及基于此的知识技能体系。职业能力是联系职业要求与职业教育内容的纽带,能力本位的课程模式主张直接通过对完成岗位任务所要运用的知识和技能的学习来培养职业能力(徐国庆,2022)。而能力本位课程内容是通过对职业岗位工作内容的科学分析与拆解形成的工作任务,学生通过学习并完成工作任务实现职业能力的培养。在高职专业教学中,通过对学习资源的开发与组织形成工作任务或者学习活动,让学生在完成工作任务或学习活动的过程中达成培养能力的目的。

其次,从列出的本体重要概念与术语中概括、确定本体核心概念。综合以上高职专业教学领域涉及的重要概念与术语列举分析,为了能更好地对专业课程以及專业面向的职业岗位群所需的知识、技能及其关系进行表征与组织,将高职专业领域的本体核心概念划分为学习资源本体、课程本体、专业本体、职业岗位本体等四类。

具体而言,学习资源本体是对在高职专业课程教学中有助于学习的学习内容或学习活动的抽象概念描述,课程本体是对高职专业课程的抽象概念描述,专业本体是对高职专业知识技能体系的抽象概念描述,职业岗位本体是对高职专业面向职业岗位的抽象概念描述。在本体架构中四类本体核心概念存在相互映射与调用关系。

2.本体构建

(1)建立概念层次结构

在本体架构的规范化定义与表征下,融合职业要求、专业课程教学内容的组织、高职专业教学规律,对高职专业领域知识技能体系按照四类本体核心概念逐级分解定义子本体划分层次。

确定专业本体层次结构。高职专业人才培养方案是组织开展教学活动的规范性文件,是实施专业人才培养的基本依据。教育部发布的《关于职业院校专业人才培养方案制订与实施工作的指导意见》明确提出,为确保培养规格,要确定专业培养目标,明确专业培养的知识、技能和素质要求。由此将高职专业领域知识图谱的专业本体分解为知识、技能、表征价值观和方法论的素质等三个子概念类型。最后使用知识点、技能点、素质点表征知识、技能、素质概念类的最小单位。

我国高职专业课程教学是依据课程标准和课程教材采用课程、章、节的层级化方式组织实施。由此,在课程本体上建立“课程—章—节”概念层次结构。职业岗位本体不再分解定义子本体,后续通过定义概念属性实现对该核心概念特征和关系的语义描述。学习资源是专业教学过程中进行学习任务活动的支撑,其类型丰富多样,常见类型包括文本、音频、视频、课件、图片、测试、教学案例、实训实验等。为了便于统一管理,本研究将文本、音频、视频、课件、图片、教学案例等教学资源归属媒体资源类,因此资源本体按照资源类型划分定义为仿真实训资源、媒体资源和测试等三个子本体。

(2)定义概念属性

概念属性是对概念类固有特征的描述,分为数据属性和对象属性两种类型,前者用于对自身特征的描述,后者用于对概念类与概念类之间关系的描述。数据属性是对概念类语义信息的补充,比如编号、名称等,在一定程度上会影响知识图谱描述信息的准确性。为此,基于知识组织原理和高职专业教学规律,参考国家教育信息化技术标准定义数据属性。

下面将以学习资源本体的概念属性定义为例说明概念属性的定义过程。本研究根据实际需要使用教育部发布的CELTS-3.1学习对象元数据标准的通用类、技术类、教育类和关系类数据项,定义学习资源及其子本体的属性。

①媒体资源子本体的主要属性包括:编号(ID)、名称(Title)、描述(Description)、位置(Location)、资源类型(Resource Type)、交互类型(Interactivity Type)、语义密度(Semantic Density)、典型学习时间(Typical Learning Time)、所属专业能力(Professional Ability)。位置是指媒体资源存放的物理位置。资源类型是指媒体资源具体类型,主要包括文本、音频、视频、动画等类型。交互类型指媒体资源所支持的交互类型,设置其值为主动式、讲解式与混合式,一般而言主动式媒体资源能激励学习者产生有意义的输入或其他表现。语义密度是指媒体资源的语义简练程度,设置其值为低、中、高,与媒体资源的难度无关,可以通过它的大小、持续时间或范围来衡量。典型学习时间是指学习者正常学习该媒体资源所需要的时间,其值事先由教师或者专家设置。所属专业能力是指该媒体资源所包含的知识点、技能点、素质点。

②仿真实训资源子本体的主要属性包括:编号(ID)、名称(Title)、描述(Description)、位置(Location)、技术要求(Technology Requirement)、安装描述(Installation Remarks)、平台要求(Platform Requirements)、交互类型(Interactivity Type)、语义密度(Semantic Density)、难度(Difficulty)、典型学习时间(Typical Learning Time)、所属专业能力(Professional Ability)。技术要求指使用仿真实训资源的技术要求,比如系统要求、软件版本要求等。安装描述指对如何安装仿真实训资源的描述。平台要求指其他关于使用仿真实训资源的软硬件需求信息。

③测试子本体的主要属性包括:编号(ID)、名称(Title)、内容(Content)、答案(Answer)、难度(Difficulty)、平均完成时间(Average Response Time)、所屬专业能力(Professional Ability)、解题分析(Solution Analysis)、测试提示(Test Hints)、测试次数(Test Number)、答对次数(Correct Number)。解析分析与测试提示是在测试过程中为学习者提供的学习帮助。测试次数与答对次数分别表示在学习系统中学习者参与该测试的次数与回答正确的次数。

概念类常见的关系有“前驱—后续”关系、父子关系、兄弟关系、平行关系、关联关系与因果关系等。概念类A与概念类B有明确的先后关系,若概念类B的存在必须依赖于概念类A的存在,则A是B的前驱,B是A的后续。若概念类A包含概念类B,B是A的一部分,则A、B是父子关系。在本研究建立概念层次结构,上一级本体与下一级子本体就属于父子关系。若概念类A、B具有相同的父概念类,则A、B是兄弟关系。

为了更好展现高职专业知识技能结构逻辑和教学活动的内在逻辑规律,明确本体具有以下关联关系:专业本体是课程本体的教学目标,也是职业岗位本体的职业要求,课程本体面向职业岗位本体,课程本体用到学习资源本体,而学习资源本体被用于课程本体。

综上所述,本研究设计的高职专业领域知识图谱模式结构如图2所示。

3.本体表征

本研究使用Protégé软件对本体模型进行编辑与设计,以便能够被计算机存储与处理。Protégé软件是一款斯坦福大学医学院生物信息研究中心基于Java语言开发的源代码开放的本体开发工具。经过专业领域体系分析、本体构建设计好高职专业领域知识图谱的模式结构之后,使用Protégé软件对本体模型进行编辑与设计,如图3所示。

本研究主要针对高职专业领域知识图谱模式构建研究欠缺、职业能力描绘不足等问题,使用知识图谱技术构建运用于高职专业在线教学的自适应系统的领域模型。在斯坦福大学本体构建七步法的简化基础上提出高职专业领域的本体构建流程,经过专业领域体系分析、本体构建、本体表征三个步骤,对高职专业课程知识技能体系的概念类、关系、属性进行系统化定义与表征,提出职业能力导向下的高职专业领域知识图谱模式结构并使用Protégé软件对本体模型進行编辑与设计,实现对专业教学领域模型层本体的构建。

当前,本研究仅完成了高职专业领域知识图谱模式的构建,后续研究的重点是数据层构建,将以具体某一个高职专业为例,通过知识抽取、知识融合、知识加工等步骤实现对该专业在数据层的构建。

参考文献

[1]陈悦,刘则渊.悄然兴起的科学知识图谱[J].科学学研究,2005(2).

[2]胡钦太,刘丽清,郑凯.工业革命4.0背景下的智慧教育新格局[J].中国电化教育,2019(3).

[3]诸云强,孙凯,胡修棉,等.大规模地球科学知识图谱构建与共享应用框架研究与实践[J/OL].地球信息科学学报:1-13[2022-03-08 13:16].

[4]董晓晓,周东岱,黄雪娇,等.学科核心素养发展导向下教育领域知识图谱模式构建方法研究[J].电化教育研究,2022(5).

[5]徐增林,盛泳潘,贺丽荣,等.知识图谱技术综述[J].电子科技大学学报,2016(4).

[6]张春霞,彭成,罗妹秋,等.数学课程知识图谱构建及其推理[J].计算机科学,2020(S2).

[7]钟卓,唐烨伟,钟绍春,等.人工智能支持下教育知识图谱模型构建研究[J].电化教育研究,2020(4).

[8]李艳燕,张香玲,李新,等.面向智慧教育的学科知识图谱构建与创新应用[J].电化教育研究,2019(8).

[9]李振,周东岱.教育知识图谱的概念模型与构建方法研究[J].电化教育研究,2019(8).

[10]黄健.中学Python课程知识图谱构建及应用研究[D].武汉:华中师范大学,2019.

[11]徐国庆.能力本位课程模式的当代意义与发展[J].职教论坛,2022(1).

注:本文系2021年度广西高校中青年教师科研基础能力提升项目“基于数据挖掘的高校在线学情追踪系统”(2021KY1514)、2023年度广西高校中青年教师科研基础能力提升项目“基于智能教育的高职领域知识图谱构建研究与实践——以大数据技术专业为例”(2023KY1568)的研究成果。

作者简介:韦量,广西南宁人,硕士,讲师,研究方向为计算机教学、大数据技术、智能计算;杨吉才,广西南宁人,硕士,副教授,研究方向为计算机教学、职业教育;卜一川,山西怀仁人,在读博士,讲师,研究方向为计算机教学、移动互联应用技术。

(责编 雷 靖)

猜你喜欢
知识图谱
国内外智库研究态势知识图谱对比分析
国内信息素养研究的知识图谱分析
国内图书馆嵌入式服务研究主题分析
国内外政府信息公开研究的脉络、流派与趋势
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的智慧教育研究热点与趋势分析
国内酒店品牌管理研究进展的可视化分析
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展
专家知识图谱构建研究