多异构信息网络融合的在线学习资源推荐

2020-10-30 08:24仲兆满
实验室研究与探索 2020年9期
关键词:异构信息网络教育资源

仲兆满, 施 珺, 管 燕

(江苏海洋大学计算机工程学院,江苏连云港222005)

0 引 言

在Web 2.0 时代,互联网上积累了海量的教育大数据,有的来源于企业、高校构建的权威教育资源平台,有的是教师、学生、专家等各类网民在互联网上生成的数据,包括博客、贴吧、论坛、微信等社交媒体。学习者面对的学习资源已经从权威的“中心化”数据,向大量个体生成的“碎片化”数据拓展。

面对互联网上丰富的学习资源,学习者如何快速、精准的获取自己感兴趣的知识是教学改革迫切需要解决的问题。教育推荐服务的目的在于根据学习者的爱好,使用推荐算法从海量的学习资源中为用户推荐精准的学习资源,是解决“信息过载”的有效途径。

从2000 年开始,国际上就有学者将推荐系统引入到教育改革领域。目前,国内外的诸多学者围绕推荐服务的系统框架、教育资源的建设、学习者模型的构建、推荐算法应用等领域进行了广泛的研究探索。国内的诸多研究成果发表在《中国电化教育》《电化教育研究》《中国远程教育》《现代教育技术》《远程教育杂志》等核心期刊。与此同时,一些教育机构、IT 企业、数据公司开始运用大数据、人工智能、云计算、区块链、物联网等新一代信息技术,研究与开发互联网教育大数据背景下的教学资源推荐系统,包括科大讯飞、网易、百度等大型IT企业。

本文研究的主要内容为:①结合学习资源推荐,定义了多异构信息网络融合的相关概念并进行了形式化描述;②针对学习资源产生于各种互联网媒体的现状,研究了面向多异构信息网络融合的在线学习资源推荐;③对多异构信息网络的学习资源推荐的共性关键模块进行了研究和实践,包括学习者学习兴趣建模、基于学习兴趣相似度的学习资源推荐以及基于学习者相似度的学习资源推荐等。

1 相关研究述评

1.1 教育推荐服务

推荐服务系统是在分析用户历史行为的基础上,构建信息与用户的表示与相似性度量模型,为用户推荐兴趣匹配的信息。亚马逊、豆瓣、当当网、MovieLens、Tapestry、Netflix 等都已成功运用推荐服务系统为用户提供智能化服务。

对学习资源推荐而言,就是要构建学习者与学习资源的表示与相似性度量模型,为学习者推荐兴趣匹配的学习资源。Salehi等[1]提出了基于多维度属性的学习素材推荐系统,将各种推荐算法进行了结合。而后,他们通过对学习资源的建模评分,进一步提升了推荐的精准性[2]。Aher等[3]根据用户的选课历史记录,将集群和关联规则等机器学习算法应用到课程推荐。王剑等[4]提出的e-Learning 协作学习推荐包含课程推荐、协作学习和过程评估及反馈3 个部分。刘静等[5]根据学习者的基本信息、行为信息和需求信息构建学习者模型,基于资源库的基本特征、标签信息和价值信息构建资源模型,在决策系统的支持下为学习者提供个性化服务,进而构建了教育资源个性化推荐的服务框架。李宝等[6]提出了包含数据采集、数据存储、数据处理和展现的个性化学习资源推送框架,将资源最邻近、相似用户矩阵、特征匹配、学习者反馈以及混合推荐技术应用于推荐。丁继红等[7]研究了大数据环境下基于多维关联分析和张量算法的学习资源精准推荐。马秀麟等[8]研究了面向学校教育的个性化资源推荐的关键要素,提出了一种个性化智能推荐模型,确定了影响资源推荐的核心要素和关键因子。

1.2 互联网教育资源

随着信息技术的发展,“互联网+开放教育资源”的模式得以推广,极大地拓展了学习者的时空边界。2001 年,麻省理工学院的OCW(Open Course Ware)项目率先将其自身课程资源在互联网上免费向全世界开放。随后,国际上出现了以在线视频课程资源为主的平台(Coursera 和Khan Academy),全媒体资源共享平台(Openstax 和OpenLearnCreate),教育书籍开放资源平台(WikiBooks)以及资源共享与教学活动度融合的学习平台(OpenLearn)等。这些平台大多支持用户评分、课程热度计算,个别平台支持课程资源的推荐,比如Khan Academy。

从2003 年起,我国加快了开放教育资源的建设。2010 年,《国家中长期教育改革和发展规划纲要》中提出“建设覆盖各级各类教育的教学资源库和服务平台”。2015 年,教育部提出建设“能学、辅教”的教学系统,实现对资源库应用推广。国内也建成了有影响力的在线开放教育资源平台,包括中国大学MOOC、网易公开课、华文MOOC、学堂在线、ShareCourse 和精品课等。

一些学者围绕互联网教育资源的建设取得了一些研究成果。郭光友等[9]围绕教学资源的表征,提出了教学资源的主要属性包括编号、名称、说明简介、关键词、学科归属、通用对象、编著者、创建时间、媒体格式、文件大小等。丁继红[10]提出了基于教育元数据、社会标注和社会网络分析的教育资源聚合模型,基于社会标注的教育资源表示为:

式中:S 为学习者集;T 为标签集;R 为教学资源集;Y为S、T和R之间的关系集。

陈路萍[11]调研了远程教育学习资源的建设现状并提出了建设策略。刘丰源等[12]借鉴区块链的共识验证安全技术,设计了包含资源存储、资源评估和互连的教育资源共享框架。熊明巧等[13]面向社区教育资源,提出了构建社区教育资源的约束、协调及运行机制。孙卓[14]研究了远程学习资源的建设策略,包括学习资源的真实性、针对性、建设体系、评价反馈机制等要素。何文涛[15]借鉴众筹的思想研究了教育资源的整合问题,精英教师、大众教师、学生在整个知识图谱中承担了不同的众筹角色。赵磊等[16]认为MOOC 是“互联网+教育”的有效模式,可以促进教育公平。张俊飞等[17]利用分布式处理技术,设计了针对大文件教学资源的分布式文件系统(HDFS)存储方案和小文件教学资源的DFS存储方案。

1.3 教学资源推荐对象

推荐对象作为推荐服务的核心要素,具有复杂的表征形式,既有静态的背景属性,又有动态的生成内容。构建推荐对象模型,以期给出精准的用户画像,是实现智能化推荐的基础。

对学习资源推荐而言,需要为每一个学习者构建兴趣模型,进而为学习者与学习资源的精准匹配提供支撑。丁旭[18]设计了以学习者为中心的学习行为分析模型,主要分析学习者的需要、兴趣和行为习惯。孙歆等[19]建立了用户的学习行为模型,关注的是用户的主观评价数据收集与分析。Xu等[20]对传统向量空间方法进行了改进,使用递归算法挖掘学习者的兴趣。白雪等[21]在研究教育资源管理与推荐模型时,使用了用户对教育资源的标记、收藏、使用资源的行为等数据。牟智佳等[22]提出了使用个人、学业、关系、偏好、绩效等信息构建学习者模型。马志强等[23]将学习者模型分为知识模型、认知模型、情感模型、行为模型等类别。黄昌勤等[24]使用了动态可视化方法揭示学习者的行为关联。

2 多异构信息网络融合的学习资源推荐

2.1 相关概念

(1)异构信息网络。表示为一个三元组:

式中:V为实体类型的集合;E为关系类型的集合;L为描述语言的集合。对异构网络而言,>1 或者>1。

比如,新浪微博包含用户和博文两种实体类型,用户之间可以建立关注关系,博文之间可以建立评论关系,以中文描述信息为主,是一种典型的异构信息网络。

(2)多异构信息网络学习者融合。异构信息网络HINi,HINj通过学习者的对齐进行融合,LA ={u1Align u2)|l1∈HINi,l2∈HINj,i≠j},l1,l2是同一学习者在不同信息网络的账号。

(3)多异构信息网络学习资源融合。异构信息网络HINi,HINj通过学习资源的对齐进行融合,CI ={c1Align c2)|c1∈HINi,c2∈HINj,i≠j},c1,c2是相同学习资源在不同信息网络的描述。

学习资源在不同异构信息网络的呈现一种是显示模式,即同一学习资源在不同信息网络上的复制;另一种是隐式模式,即采用不同的表达方式对相同的学习内容进行描述,各个描述内容独立,但又关联到了同一学习资源。

2.2 学习资源推荐设计

学习资源推荐服务通过构建用户兴趣模型、挖掘学习资源主题、度量学习资源与学习者的兴趣相似度、度量学习者之间的相似度,为学习者推荐精准的学习资源,从而促进学习资源的有效传播。本文提出的学习资源推荐系统总体设计如图1 所示。

图1 学习资源推荐系统总体设计

图1 所示所设计的学习资源推荐系统核心部件包括:①梳理、采集、构建多异构信息网络学习资源库,为学习者提供学习资源;②学习者学习兴趣建模,包括基于学习兴趣标签的学习者静态学习兴趣,以及基于阅读、收藏历史学习资源挖掘的学习者动态兴趣;③基于学习兴趣相似度的学习资源推荐,从学习资源中挖掘主题,计算学习资源与学习者学习兴趣的相似度,相似度达到一定阈值就进行推荐;④基于学习者相似度的学习资源推荐,有些学习者缺少学习兴趣标签而且学习内容很少,难以有效挖掘学习者的学习兴趣,可以将相似学习者阅读、收藏的学习资源在相似用户间推荐。

2.3 学习资源推荐核心模块设计

2.3.1 学习者学习兴趣建模

(1)学习者静态学习兴趣。指从学习者的兴趣标签中挖掘出的学习兴趣点,记为:

每个学习兴趣点为:

式中:kwi为兴趣词;wi为学习者的兴趣词权重。

(2)学习者动态学习兴趣。指从学习者的学习内容中挖掘出的随时间变化的学习兴趣点,记为:

其中,topici是由多个关键词组成的兴趣点,wi为学习者的话题权重,T ={t1,t2,…,ts}为学习者对兴趣话题topici的时间分布。

学习者的学习兴趣分为两种情况:①长期学习兴趣,由学习兴趣标签反映,比如学习者的学习兴趣标签为“编程、Java 语言、面向对象”;②短期学习兴趣,由浏览、收藏的学习资源反映,比如学习者临时对“区块链”“中美贸易战”等话题感兴趣。

学习者学习兴趣标签,可以让学习者手工勾选或者由学习者自由填写若干关键词,将用户的学习兴趣标签记为:

用户动态学习兴趣模型的更新是实现个性化学习资源推荐的关键。由于学习者的学习兴趣在不断变化,需要根据学习者所累积的学习资源不断调整,以达到准确描述学习者真实学习兴趣的目的。学习者动态学习兴趣更新模型如图2 所示。

图2 学习者动态学习兴趣更新模型

2.3.2 基于学习兴趣相似度的资源推荐模型

基于学习兴趣相似度的学习资源推荐模型如图3所示。

图3 所示模型中,首先,从学习资源中挖掘主题并进行向量化表示,比如采用向量空间模型(VSM),某一学习资源表示为:

式中:kw为学习资源的主题;w 为主题的权重。然后,分别计算学习资源与学习者静态学习兴趣的相似度、学习资源与学习者动态兴趣的相似度。最后,加权静态学习兴趣和动态学习兴趣得到学习资源与学习者的相似度,满足一定的阈值后,决定是否将该学习资源推荐给学习者。对于多个学习资源,按照相似度从大到小排序,选取top-k个学习资源推荐给用户。

图3 基于学习兴趣相似度的学习资源推荐模型

用户阅读、收藏的学习资源可以通过分词构建词汇库。词汇库中的每个词相互独立,可以使用word2vec方法将学习资源向量化表示。word2vec有两种模型Skip-gram和CBOW,CBOW模型通过一个词的上下文词汇来推测目标词汇,Skip-gram模型通过目标词汇推测上下文词汇。对CBOW模型而言,已知词汇w与其上下文词汇context(w),目标函数为:

对Skip-gram 模型而言,已知词汇w 与其上下文词汇context(w),目标函数为:

2.3.3 基于学习者相似度的资源推荐模型

基于学习者相似度的学习资源推荐模型如图4 所示。学习资源推荐模型通过计算学习者之间的相似度达到学习资源推荐的目的,可以有效避免单纯依靠学习资源与学习者学习兴趣相似度推荐方法的缺陷。该推荐模型核心的问题是学习者之间相似度的度量。

图4 基于学习者相似度的学习资源推荐模型

学习者相似度计算模型如图5 所示。

图5 学习者相似度计算模型

学习者间的社交关系指学习者关注的社交圈子情况,相似度计算可以使用Jaccard方式:

学习者间的静态学习兴趣相似度计算可以使用Jaccard方式:

学习者间的动态学习兴趣相似度计算可以使用余弦相似度的方式:

3 应用案例

笔者所在的智慧教育团队多年来一直从事教育资源库建设、课程改革、教学平台、学习推荐等领域的研究。在上述多异构信息网络融合的学习资源推荐模型的指导下,选取了中国大学MOOC、博客、论坛、贴吧等异构信息网络作为学习资源的采集目标,使用搜索采集的网络爬虫策略采集了几个平台的部分学习资源。根据学习者融合、学习者学习兴趣建模、学习资源主题挖掘向量化表示、学习兴趣相似度计算、学习者相似度计算等模型和方法,开发了多异构信息网络融合的学习资源推荐原型平台-“江苏海洋大学学习资源推荐系统”,探索了面向多异构信息网络融合的教学改革,为学生精准获取在线学习资源提供支持。图6 所示为系统的登录页面。

学习者的静态学习兴趣主要通过学习者的兴趣标签反映。学习者在定制学习兴趣标签时,系统既支持学习者从系统标签库中选取,也支持学习者自由输入,输入多个兴趣点时,兴趣点之间用分号隔开。图7 所示为学习者兴趣标签定制页面。

图6 系统登录页

图7 学习者学习兴趣定制页

从各类信息网络采集获取学习资源后,基于学习兴趣相似度的学习资源推荐模型和基于学习者相似度的学习资源推荐模型,向学习者自动推荐的学习资源如图8 所示。

4 结 语

教学改革已经从课堂授课向课外获取拓展知识。在人人都是自媒体的时代,互联网上包含了大量学习资源,已经不再局限于特定的教学平台,而是分散于各类信息网络中,包括微博、博客、贴吧、论坛、微信等社交媒体。如何改革已有的教学模式,为学生提供精准的学习资源,是智慧教育研究的一部分。对学习者而言,推荐系统可以有效解决学习者海量信息背景下的“信息过载”问题,节省他们获取信息的时间和精力。面向学习者的学习资源推荐应注重各类媒体信息的深度融合,已经引起了研究者的广泛关注。本文研究并实践了多异构信息网络融合的学习资源推荐,从相关概念、系统总体设计、核心模块设计等各个方面进行了详细的描述,相关教改成果可为学生精准获取在线学习资源提供支持。

图8 学习资源推荐页

猜你喜欢
异构信息网络教育资源
试论同课异构之“同”与“异”
整合校外教育资源 做好青少年道德教育
吴健:多元异构的数字敦煌
智能化计算机安全监控信息网络技术研究
河南省交通运输厅信息网络监测预警系统
信息网络环境下提高网络统战工作效果的探讨
异构醇醚在超浓缩洗衣液中的应用探索
LTE异构网技术与组网研究
面向数字化教育资源的Flash到HTML5转换研究
自主学习视角下的开放教育资源文献综述(上)