当前海外教育数据挖掘的主要方法与应用

2017-09-30 07:28王乙先杨絮张海罗立成
中国信息技术教育 2017年18期
关键词:教育者数据挖掘建模

王乙先+杨絮+张海+罗立成

教育数据挖掘是在教育领域中,使用数据挖掘技术分析教学系统中的数据,来解决教育研究问题的新兴学科。目前,很多基于计算机的学习系统都能收集大量的可用数据,如学习管理系统、大规模在线开放课程以及智能辅导系统。借助教育数据挖掘中多种多样的方法和应用,既可以改进和提高学习质量,也可以帮助我们提高对学习过程的理解。本文回顾了当前教育数据挖掘的研究与文献,并结合已有研究对教育数据挖掘的应用进行了介绍。这些案例可以帮助我们更好地了解当前世界各国教育数据挖掘前沿的新进展。随着基于计算机的学习和数据可用性的增长,相信教育数据挖掘的使用还会继续增长,从而产生更多更丰富的新型应用。

● 教育数据挖掘的主要方法与应用

教育数据挖掘最常用的方法包括分类、回归、聚类、关联规则挖掘、模型发现、异常值检测、社会网络分析、文本挖掘、顺序模式挖掘及可视化技术。

教育数据挖掘中的应用和任务可以根据不同的属性进行分类。经过文献研究,本文列出了教育数据挖掘的可能应用,并尝试根据其最终目标将教育数据挖掘的应用进行分类。文中已经确定了十三种应用,形成了专门针对教育数据挖掘定制的新分类法,将教育数据挖掘设定为数据挖掘的具体子领域。其中四个应用分组在“学生建模”下,六个在“决策支持系统”下,最后三个表示为“其他”,因为它们与其他应用不同。本文将在与各类应用相关的研究实例帮助下,对这些应用进行描述和说明。

为了更好地分类所识别的应用,我们可以查看每个应用的目标用户。教育环境中的最终用户是学习者、教育者、管理人员和研究人员。

学习者一直是教育数据挖掘在各种应用中的主要目标用户,如分组学生、产生推荐和自适应系统。教育数据挖掘整体的一个重要目标是提高学习质量。在学习过程中,首先要考虑两组用户,即学习者和教育者。学生建模和决策支持系统类别中的大多数应用将教育者定位为最终用户。学生建模能更好地了解学生的学习状态,决策支持系统可以直接帮助教育者做出更好的决策,改善学习过程,同时这也适用于制定更高层次决策的教育机构的管理者。研究人员也代表一类终端用户,因为研究的目的是了解学习过程、开发理论和测试。例如,研究人员可以使用社交网络分析(SNA)来确定在预测学生表现方面有价值的属性。下页表列出了每个应用程序的可能的目标用户。

● 应用于学生建模的教育数据挖掘

学生建模是一个表達学生活动认知方面的过程,如分析学生的表现或行为、隔离潜在的错误认知、表示学生的目标和计划、识别先前获得的知识、维持情境记忆和描述个性特征。

我们运用此定义来对教育数据挖掘中某些应用进行分类,该类别中的应用提供了一种描述学生尝试达成目标的模型。对学生活动和行为进行建模可用于预测和表示学生的一些特征或发现描述学生的结构。因此,学生建模中有两个子类别为预测和结构发现。

1.预测学生表现、学习成果的实现或特点

这类应用的目标是评估描述学生的表现、学习成果的实现和特征,有的研究也关注与其他学生的合作学习的特征。这类应用中回归和分类方法使用最为广泛。例如,Zimmermann 等人引入了基于模型的方法,即使用本科绩效指标来预测研究生绩效;Galyardt和Goldin利用最近的学生使用数据来提高ITS系统的预测精度;Waters等人的研究使用贝叶斯分类识别学生在网络课程中的协作。

2.检测学生不良行为

在这一分类中重点是检测学生的不良行为,如动机低、错误行为、作弊、辍学、学业失败等。在这类应用中主要使用分类和聚类技术,也综合使用了特征选择和异常值检测等技术。Bravo和Ortigosa进行的研究中提出了一种使用生产规则检测电子学习中潜在症状的方法;Dekker等人使用决策树分类器来预测电气工程学中的学生的辍学;Lykourentzou等人使用多机器学习技术如支持向量模型和神经网络来对学生的辍学进行预测。

3.分析和分组学生

这类应用的目标是根据不同的变量来分析或分组学生,对学生进行分组可以根据个人资料信息的各种属性来完成。这类应用中使用较多的数据挖掘方法是特征选择和聚类。例如,Azarnoushetal提出了一种使用基于随机树的不相似度测度进行学习者分类的方法;Kinnebrew等人使用序列挖掘技术来识别不同学生群体的学习行为模式。

4.社交网络分析

这一分类应用的目的是以图形的形式构建学生模型,并显示出不同的可能关系。在社交网络分析中,重点是学习者之间的关系。例如,Reffay和Canier使用社会网络分析来衡量协作远程学习环境中的凝聚力;Reyes和Tchounikine基于使用社会网络分析技术的关系视角研究了学习小组的结构性质。

● 应用于决策支持系统的教育数据挖掘

教育数据挖掘中另一个主要的应用分类是决策支持系统。这一类型的应用主要通过帮助利益相关者做出决策来增强学习过程,如提供反馈、创建警报、规划、生成建议和增强课件等。这些决策支持系统的目标人群主要是教师,也可以是学生、管理者或研究人员。

1.提供反馈

数据分析和可视化在很多应用中充当着重要角色,它们本身也可以向教育者和管理者提供有用的信息来帮助他们进行决策。这类应用的目的是找到并突出显示可能对教育者和管理者有用的课程活动相关信息,并向他们提供反馈。例如,Romero等人进行的研究,他们使用关联规则挖掘,从多项选择测验数据中提取有用信息向教师提供反馈。

2.为利益相关者创建警报

这类应用类似于学生建模分类中的应用,其目的是预测学生的特征并检测不需要的行为,并作为在线工具来通知利益相关者或实时创建警报,当出现低动机、误用、作弊等情况时可能需要警报。这一类别的研究范例是Knowles的研究,他引入了使用统计模型和回归的退学预警系统;另一项研究中,Macfadyen和Dawson为使用绩效预测的教育者制定了一个预警系统。endprint

3.规划和调度

这一类应用的目的是帮助利益相关者进行规划和调度任务,它可以帮助教育者和管理者规划未来的课程、协助入学和咨询等任何涉及计划和安排的任务,并在课程招生规划方面帮助学生。这些研究大多数采用模型发现、聚类分析和分类等方法。Hsia等人根据学生的偏好和职业来确定参加者完成课程的可能性,并以此来加强课程规划。

4.创建课件

课件被称为提供内容、视频、测试和其他学习资料的教育软件。这类应用的目的是帮助教育者根据学生使用的信息自动创建或开发课程资料。在等人的研究中可以找到相关例子,他们提出了一个使用关联规则挖掘和协同过滤来开发、改进和维护基于网络的课程的系统。

5开发概念图

概念图是用于组织和表达知识的图形工具。这类应用的目的是制作各个方面的概念圖来帮助教育工作者界定教育进程,它们可以帮助明确不同的概念彼此间的关系。例如,Agrawal等人的研究通过为学生阅读的概念提供参考,提供了学习电子教科书的导航。

6.生成推荐

推荐可以针对任何利益相关者,如给学生提供课程建议或给教育者提供测试项目建议。推荐系统中最常见的方法是协同过滤、基于内容的方法、基于关联规则的算法和其他混合方法。生成推荐的另一个方法是使用模型发现。例如,Vialardi等人使用绩效预测模型来产生建议。预测模型可以预测每个学生在每门课程中的成功,并向学生推荐最有可能帮助他们获得成功的课程。

● 其他教育数据挖掘应用

1.自适应系统

这类应用与基于计算机的学习中的智能系统的应用有关,我们需要系统适应用户的行为。在许多在线学习系统中,有很多不同需求的学习者,而且随着参与者人数的增加,在线学习系统越来越难以满足所有学习者的具体需求。自适应系统可以帮助我们满足每个学习者的需求。这种适应可以采取适应课程材料、指导步骤、提供提示、排序和生成测试等的形式。例如,Alaofi等人的研究中通过使用学生的个人资料信息来探索数字图书馆的个性化以改善搜索结果。

2.评估

评估是教育环境的一个重要方面,但某些情况下评估并不总是直观的,特别是在基于计算机的学习环境中。这类教育数据挖掘应用的目的是为教育者提供一个评估手段来辅助评估,它是可以在探索性学习环境和基于计算机的课程中完成的。例如,Hao等人提出了一种使用距离函数对基于游戏/场景的任务进行评分的新方法。

3.科学查询

教育数据挖掘的一个用途可以是基于大数据的各种记录来测试,甚至开发新理论。这类应用程序主要以研究人员作为最终用户,但是任何开发或测试的理论都可以在以后针对其他利益相关者的其他应用中使用。endprint

猜你喜欢
教育者数据挖掘建模
品读
季托,金林南:思想政治教育者需培养反思性实践能力
物理建模在教与学实践中的应用
在经历中发现在探究中建模
思维建模在连续型随机变量中的应用
教育者要怀揣梦想上路
求距求值方程建模
教师应努力成为一个“教育者”
数据挖掘综述
软件工程领域中的异常数据挖掘算法