基于大数据群体画像的个性化学习环境构建的研究

2020-04-22 06:51康琦岳鹍
高教学刊 2020年13期
关键词:学习环境个性化大数据

康琦 岳鹍

摘  要:个性化学习环境是网络学习环境的高端形态,是信息化教学时代学习者对网络学习环境的新需求,也是未来教育发展的方向。研究构建了一种结合学生线上学习大数据采集、大数据预处理、语义化标签提取、群体画像挖掘等相关技术于一体的学习者群体画像挖掘路径,深度挖掘学习者画像与学习资源间的隐性关联,实现个性化学习环境构建与用户的精准匹配,达到对学生进行个性化的指导,提升学习效果的目的。

关键词:大数据;群体画像;个性化;学习环境

中图分类号:G640      文献标志码:A         文章编号:2096-000X(2020)13-0052-04

Abstract: Individualized learning environment is the high-end form of the network learning environment, the new demand of learners for the network learning environment in the era of information-based teaching, and the direction of future education development. This research constructs a learner group portraits mining path which combines the technologies of big data acquisition, big data preprocessing, semantic tag extraction, group portraits mining and so on, meanwhile explores the hidden relationship between learner persona and learning resources, thus realizing the precise matching between the construction of personalized learning environment and users, and providing personalized guidance for students so as to improve their learning efficiency.

Keywords: big data; group portrait; personalization; learning environment

随着网络信息技术的迅速发展,慕课以其开放共享、资源丰富、互动性强、突破学习时间和空间限制等优势得到迅速发展。随着慕课的快速发展,海量冗余课程资源带来的“数据泛滥”“知识迷航”等问题,严重影响了学习者的积极性和学习效率,高辍学率也成为了制约慕课发展的一个重要因素。如何针对学习者的个性特性,为其推送与之能力水平、兴趣爱好相适应的学习资源,构建与之匹配的個性化学习环境就成为了研究热点[1-3]。

用户画像是一种基于提取、分析用户历史数据,利用数据化、语义化的标签对用户行为特征进行刻画,实现对用户信息进行全面概括的工具。群体用户画像分析是利用聚类分析的方式,将具有共同特征的用户划归到一个族群,进而有效挖掘用户群体的个性化需求,为其匹配精准化的服务资源。因此,研究提出了基于大数据分析的群体用户画像理念,通过构建群体学习者画像模型,从画像层面深入挖掘用户个性化学习的精准需求,实现个性化学习服务的智能化与精准化,为解决大数据环境下个性化学习环境的构建问题提供有效解决办法[4-6]。

一、基于群体画像的个性化学习环境构建路径设计

个性化学习环境的构建离不开对学习者类型及特点的准确识别和分类,慕课学习者群体画像的形成是基于对学习者海量行为数据如个人学习投入程度、浏览类型偏好、互动参与程度及作业完成情况等数据的采集和挖掘,提炼关键学情信息,加以标准化和标签化处理,形成语义化的用户特征标签,通过聚类分析将具有相似性偏好的用户分组而得到的。聚类后的学习者群体,可以根据其相似的学情特征、兴趣偏好、学习风格等,将学习者划分为不同的学习类型,从而有针对性地为学习者提供课程学习资源、布置练习、设置互动环节等,为学习者定制个性化的学习环境。

为了得到一个全面的学习者画像,研究设计了一个结合大数据采集、数据预处理、标签提取、画像挖掘等相关技术的学习者群体画像挖掘路径。研究首先对学院慕课平台上专业课程的学习者学习大数据进行采集,然后对采集到的数据进行整合、清洗、转化和规约,排除干扰数据,精简处理数据规模;预处理后,基于预处理完成的数据利用主成分分析和因子分析法提取个性化的标签;最后利用提炼出来的个性化学习标签进行聚类分析,使具有相似属性特征的学习者画像聚合形成不同类型的学习者群体,挖掘学习者群体画像与学习资源间的隐性关联,由此实现个性化学习环境与用户的精准匹配[7-10]。

二、基于大数据挖掘的学习者群体画像

(一)个性化学习大数据的获取

研究以学院慕课平台中《会计电算化》课程近3学期,分布在3个年级14个班级的学习者为研究对象,学生学习课程期间的活动行为被系统采集并形成数据集,各类数据具体的内容见表1。研究利用慕课平台具备的数据统计工具将上述数据分别导出为Access数据表文件,为后续的画像挖掘提供基础数据。

(二)个性化学习大数据的预处理

1. 数据整合

研究采用Excel 2016中的Power Query插件中数据获取功能,采用学生线上注册过程中平台自动生成的UID值作为标识值,将平台采集的十四个选项导出的Access数据表进行整合,形成统一的数据表。整合后,每个UID值对一名学生的32项基础及行为数据。

2. 数据清洗

为了不影响后续的数据挖掘,研究主要采用人工和计算机相结合的清洗方式,通过Excel对缺失、重复、异常及干扰数据进行筛查和清洗,筛选和剔除数据集中存在的无关数据和噪声数据,补充遗漏数据。

3. 数据标准化

由于数据中各项指标量纲不一,因此为了消除量纲不同对数据分析的影响,研究利用Z-score方法即标准差标准化方法,对清洗后的数据进行标准化处理,变化后每个指标的均值为零,标准差为1。

4. 数据规约

为了集中关注学生学习行为,研究将主要针对反映学生学习动态的指标进行分析,而暂不将静态指标纳入分析范围。研究采用IBM SPSS Statistics 21.0对标准化后的21项数据进行主成分和因子分析。通过计算得出各指标的累计方差贡献率和方差贡献率,得出主成分分析的相关系数矩阵和方差贡献率表。根据特征值大于1的原则,研究可以提取5个公因子,当提取5个公因子时方差累计贡献率达75.25%,说明5个公因子基本包括了所选择的21个变量的大部分信息量,提取该5个因子作为21个变量的公因子是合理的。

(三)语义化标签的构建

为了使得标签的命名能够具有解释性,采取方差最大法对因子荷载矩阵实施了正交旋转,正交旋转之后的结果显示提取的五个因子都将反映了学生在学习中的某种特征,具体解释如下。

第一个标签在课程访问次数、浏览停留时长、文稿浏览次数、文稿浏览时长、图片浏览次数、图片浏览时长、动画浏览次数、动画浏览时长、视频浏览次数和视频浏览时长等10个变量上具有比较大的载荷。这10个变量主要表现了学生按照教师安排的学习计划,在线上浏览课程各种资源时投入的时间,集中体现了学生对不同类型课程资源学习的投入程度,因此将这一标签命名为学习偏好标签。

第二个标签在周期活跃度1个变量上具有比较大的载荷。这1个变量是学生全学期在线上学习的天数占学期总天数的比例,集中体现了学生学习的持续性和稳定性,因此将这一标签命名为学习投入标签。

第三个标签在作业成绩、测试成绩、讨论成绩、问答成绩和期末考试成绩等5个变量上具有比较大的载荷。这5个变量主要表现了学生按时完成教师线上布置的单元作业、课题随机测试、话题讨论、主观问答题和参加期末考试取得的成绩,集中体现了学生在学习不同阶段的学习效果,因此将这一标签命名为学习效果标签。

第四个标签在搜索次数、资源评论次数2个变量上具有比较大的载荷。这2个变量主要表现了学生为了完成学习任务主要进行资源搜索的次数、学习完成后对教师提供的各类学习资源发表学习心得、提出改进意见的情况,因此将这一标签命名为主动思考标签。

第五个标签在参与讨论率、提交作业率和参与问答率3个变量上具有比较大的载荷。这3个变量主要表现了学生参与教师发布的开放性讨论问题、阶段性测试、开放性问答题的积极性程度,因此将这一标签命名为互动行为标签。

(四)基于学习大数据的画像挖掘

在因子分析的基础上,根据提取出来的学习偏好标签、学习投入标签、学习效果标签、主动思考标签和互动行为标签,对学生进行K-means聚类分析。通过标签聚类, 将412名学生分为6类。通过对聚类后6种类型群体的中心点比较,可以发现这6类群体在学习投入、学习偏好、互动参与、阶段测试等方面存在较为明显的差异,具体画像结果如下。

1号画像群体,学生人数21人,占比5.10%。此群体学生学习投入程度较低,各类资源浏览率均处于最低水平,仅仅能最低限度地参与教学互动活动;基本没有主动学习意愿,学习成绩处于及格水平。

2号画像群体,学生人数39人,占比9.47%。此群体学生学习投入程度一般,资源能基本完成浏览,能完成基本的教学互动活动;主动进行最基础的资源检索,并对课程资源进行简单评价,学习成绩处于中等偏下水平。

3号画像群体,学生人数88人,占比21.36%。此群体学生属于视觉型学习者,学习投入程度较高,能根据学习的需要反复浏览资源,重点关注文稿、图片资源;能积极参与教学互动活动,能主动进行资源检索,并对课程资源进行评价,学习成绩处于良好水平。

4號画像群体,学生人数83人,占比20.15%。此群体学生属于听觉型学习者,学习投入程度较高,能根据学习的需要反复浏览资源,重点关注视频、动画资源;能积极参与教学互动活动,能主动进行资源检索,并对课程资源进行评价,学习成绩处于良好水平。

5号画像群体,学生人数93人,占比22.57%。此群体学生属于动觉型学习者,学习投入程度高,能根据学习的需要反复浏览资源,基本100%的参与教师发布的讨论、作业及问答等互动活动,善于使用搜索功能对资源进行检索,并积极对教学资源进行评价;学习成绩处于良好水平。

6号画像群体,学生人数88人,占比21.36%。此群体学生学习投入程度最高,能根据学习的需要对任课教师发布的文稿、图片、动画及视频资源反复浏览,参与教师发布的讨论、作业及问答等互动活动积极性高;为完成学习任务,能主动进行资源检索,并对相关课程资源进行评价,学习成绩处于优秀水平。

三、基于学习者群体画像的个性化学习环境构建

基于学习者群体画像的构建,结合课程实施,结合上述6种不同类型学习者学习能力和学习风格,教师为学习者定制了适合其学习特点的学习方案。以个性化资源推送方面为例,课程将推送资源按难度分为了基础、中等、专业及拓展四类,按类型分为了视觉型、听觉型和动觉型三类。结合群体画像,课程结合现有信息化资源,不再是简单的将课程资源进行罗列,由学习者自行选取,而是将资源进行了有机组合,构建了6类不同的学习资源包,分类推送给相对应的学习者[11-14]。

对于1号画像学生群体,学生资源浏览完成率较低,但对其中的动画资源表现出了较高的兴趣,其次是视频资源,学生学习这两类资源的时间占据了全部学习时间的58%左右。针对其特点,课程开发了基础学习包,在课前重点推荐动画和视频资源,辅以课件资源,帮助学生理解和掌握相关知识,完成最基础知识的学习。

对于2号画像学生群体,学生在学习过程中的针对性、有效性不强,不能有效把握教师推送学习资源的重点。针对其特点,课程开发了轻型学习包,利用视频、动画资源为主,辅以教师对知识点的总结提炼文稿,配套知识点习题,学生在学习完资源后,可阅读教师总结文稿对学习内容进行内化,内化完成后可通过配套习题检验知识点学习效果。

对于3号画像学生群体,学生属于典型的视觉型学习者,针对其特点,课程开发了视觉学习包,以知识点的讲解文本、图片类资源为主,辅以教师对知识点中的重点或难点的讲解视频,配套知识点习题,通过组合而成的视觉型学习包可帮助此类型学生获得较好的学习效果。

对于4号画像学生群体,学生属于比较典型的听觉型学习者,针对其特点,课程开发了听觉型学习包,以知识点的讲解视频、动画类资源为主,辅以教师对知识点中的重点或难点的总结文稿,以辅助学生获得较好的学习效果。

对于5号画像学生群体,学生属于比较典型的动觉型学习者,针对其特点,课程开发了动觉型学习包,在提供知识点相关学习资源的同时,为提高学生参与度,教师增设了如作业、讨论、问答及案例分析等互动教学环节,促进此类型学生更多主动思考,提升学生学习效果。

对于6号画像学生群体,由于此类型学生具备较好的学习基础和学习习惯,课程知识点掌握水平也较好,学生可根据自己学习需要有选择性的进行资源浏览,因此,对于此部分学生不需要做特定的资源推送,但为了满足这部分学生的提高,教师可将知识点相关资源重新整合,围绕专业核心就业岗位,整合对接实际的实践教学项目,提供给学生用以课后提升。

个性化学习包的构建和推送,充分考虑了学习者的学习基础、学习偏好和认知能力上的差异,在学习资源的提供上给出了多样化的选择,使得资源学习更有针对性,有效提高了学习者的效率;同时,将差异化的互动活动、阶段性测试融入到了不同学习包,为不同学习水平的学习者提供了与之能力相匹配的互动话题和考核内容,有效地检查了不同类型学习者的学习效果。

四、结束语

本研究基于大数据分析方法,主要利用了学习者浏览行为数据、学习活跃度数据、阶段测试数据以及社交互动数据等,通过主成分分析和因子分析,提取有效信息,构建了多维度的个性化学习标签体系;通过聚类分析,将学习者进行了有效分类,形成了较为精准的学习者群体画像,从数据上描绘了其个性化学习需求。在此基础上,将学习者画像模型与精准资源推送服务应用到个性化学习环境构建上,提出了基于大数据群体画像的多种类型学习包的建设与推送服务,为当前信息化教学条件下开展大数据精准服务和个性化学习环境构建提供了应用参考。

需要关注的是,由于学习者的学习过程并不是一个简单线性变化的过程,而是一个动态变化的非延续性过程,因此,在服务各类型学习者时,需要充分考虑到学习者的学习特征和学习能力的变化,对其画像模型不断进行动态修正,以此保证学习者的学习路径与其学习目标、内容和方式的相适应。

参考文献:

[1]吴玉萍.移动学习环境下基于微助教的翻转课堂教学模式[J].教育观察,2019,8(16):9-13.

[2]郑淼,陈真.信息技术环境下高校学生个性化学习研究[J].信息与电脑(理论版),2019(07):252-253+256.

[3]李雪娇.基于学习者画像的在线学习支持服务策略设计研究[D].华东师范大学,2019.

[4]索娜.基于學习风格的个性化学习空间模型构建研究[D].贵州师范大学,2018.

[5]张杜娟.在线学习环境下学习者特征模型研究[D].华中师范大学,2018.

[6]郑明月.基于学习分析的个性化学习资源推荐研究[D].曲阜师范大学,2018.

[7]国宴华.基于探索性因子分析和聚类分析的机场旅客服务需求研究[D].山东大学,2018.

[8]刘应杰.基于数据挖掘的远程教育用户画像构建研究[D].西安电子科技大学,2018.

[9]陈淼.移动学习环境下学习资源个性化推荐模型研究[D].渤海大学,2017.

[10]孙国章.基于移动终端的个性化学习环境建构[J].吕梁教育学院学报,2019,36(01):41-43.

[11]陈佳艳.基于学习行为特征的学习资源个性化推荐研究

[D].南京邮电大学,2018.

[12]高立,谭业发,苏正炼,等.SPOC支持下的个性化教学模式研究[J].教育教学论坛,2018(49):69-71.

[13]王文东,武海妮,侯勉,等.泛在学习环境下MOOC资源个性化应用研究[J].无线互联科技,2018,15(11):83-85.

[14]牟智佳,武法提.教育大数据背景下学习结果预测研究的内容解析与设计取向[J].中国电化教育,2017(07):26-32.

猜你喜欢
学习环境个性化大数据
为小学英语个性化合作学习单做加法
基于大数据背景下的智慧城市建设研究
同桌宝贝
校本课程开发的个性化问题探讨
呼唤雕塑家创作的个性化