大数据环境下MOOC存在的问题及解决方法之初探

2017-07-11 02:44张婷婷卜天然汪峰坤葛静
电脑知识与技术 2017年15期
关键词:大数据

张婷婷 卜天然 汪峰坤 葛静

摘要:针对大数据环境下MOOC教育的特点,指出国内MOOC教育存在学习者盲目选择课程视频、视频知识点内容重复和退学率高三个问题,提出了解决方法。分别从建立智能关联推荐系统、建立基于内容的视频检索查重系统、建立机器化测评系统三个角度阐述。

关键词:大数据;MOOC;智能关联推荐;视频检索查重;机器化测评

1.简介

大数据(Big Data)是指“无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合。”4V(即Volume、Variety、Value、Velocity)为大数据的典型特征。

随着互联网和大数据时代的到来,教育知识的传播由原来的口传和纸媒的一对多模式转变为开放化的双向学习模式,大规模网络开放课程MOOC(Massive Open Online Course)也随之兴起。MOOC通常由有着共享精神和传播知识意愿的个人或组织提供面向全社会的免费的教学视频,并辅以其他多种形式的教学手段,比如:交互性论坛、师生远程交流、互助小组、模拟实验等等。

以开放性和共享性为特点的MOOC具有很多优势:(1)只要有网络和终端设备即可学习。(2)课程免费,学习成本低。(3)突破时间空间的限制。(4)对学习者不设门槛。(5)激发学习兴趣,为终身学习提供可能性。MOOC迅速掀起了全球教育理念的变革,很多知名高校,比如哈佛大学、麻省理工学院、斯坦福大学、东京大学等都加入到MOOC视频团队中。

国内高校的公开课在2013年首次登陆M00C平台,实践时间相对较短,经验缺乏,一些问题逐渐显露。

2我国MOOC存在的问题

2.1盲目选择课程视频,缺乏对学习者的内容推荐体系

大数据时代的到来促进了MOOC的产生和快速发展,带来了学习方式和学习理念的大变革,使得大规模在线学习成为可能。比如:大规模多种类的在线课程的提供、大规模的用户注册、大规模的论坛用户讨论、大规模的用户接入等等。

传统的课堂教学学生规模有限,通常控制在20-40人,教师可以在短时间内对学生的个人情况做基本了解,比如学生的性格特点、学生的教育经历、学生的家庭地址等等,这样教师就可以根据学生的个人特点调整教学方案,有针对性地给部分学生“开小灶”,最大限度地提高教学质量。

相比于小规模的传统教学,学习者的层次跨度较大,学习动机各有差异,对于MOOC的需求也不尽相同。有的学习者把M00C视频作为传统课堂教学的知识延伸,他们更希望能跳过基础讲解直接进入核心知识的学习;有的自学者把MOOC作为交流讨论的平台,他们往往不在意视频的质量而更注重学习社区的交流氛围,更希望MOOC教师能定期与自己交流答疑;有的学习者把MOOC作为学科入门的途径,由于自身的“零基础”,他们希望MOOC教师能讲解的更基础和细致;有的学习者只是把MOOC作为自身掌握情况的检验工具,他们可能跳过视频而直接做测验题。

正是由于学习者的需求多样性和差异性,他们无法在大数据时代的浩瀚MOOC课程中快速挑选到符合自身需求的视频资料,造成时间和精力的浪费。因此,针对多样化学习者的内容推荐体系的建立具有实际意义。

2.2视频知识点内容重复,缺乏MOOC视频内容查重体系

传统课堂教学,教师的教授内容遵循教学计划,课程之间极少出现知识点重复的问题。同行之间可以相互交流,对于前后续课程内容的设计可以达成一致。在教学过程中,也可以根据学生的反馈适当调整授课内容。但是MOOC的制作者没有这样的先天优势。

MOOC的制作者通常为个人或者小团队,他们制作MOOC的驱动力可以概括为三个:(1)好奇心驱使下的对于新的教学方法的尝试。(2)认为MOOC可以帮助其实现个人价值。(3)单纯的利他主义。这使得大部分MOOC制作者的著眼点仅限于当下课程的制作,对于其他制作者已经上线或者正在制作的同种课程并没有太多了解。这就不可避免出现大量内容重复的视频,是对MOOC制作者和学习者时间和精力的严重浪费。

考虑到MOOC的“微视频”特性,可以对于申请录制或申请上传的视频内容进行查重处理,避免在MOOC资源库中出现过多的知识点重复,节省社会资源。

2.3退学率高,缺乏对学习者的评价和激励机制

传统课堂教学,学生知识体系的构建都是按照人才培养方案逐步进行的。只要认真听讲,大部分学生都是可以跟上老师的授课内容的,教师可以通过课下答疑和作业批改的方式帮助少部分基础较弱的同学跟上进度。每门课程结束的课程测评也可以激励学生进行持续有效的学习。但是在大数据环境下的MOOC学习中,这样的学习环境不复存在。

研究表明,MOOC有着大规模的注册量,但是学习者的退学率非常高,超过90%。究其原因,大致可分为四大类:(1)缺乏学习的动力。(2)由于自身基础薄弱,不能理解视频内容选择放弃。(3)对于无法理解的知识点找不到可以求助的对象,丧失学习兴趣。(4)学习时间不能保证。

建立针对学习者的评价和激励机制可以帮助大部分学习者提高学习目标、课程内容对于他们的内在激励程度,督促他们保质保量的参与学习,并对自己的知识掌握情况有更清晰的认识。

3大数据环境下解决MOOC问题方法之初探

大数据时代之前,人类历史上所有印刷制品的数据量是200PB(1PB=210TB),日常语言传递的数据量总和大约是5EB(1EB=210PB)。现今,大数据环境下数据量呈爆发式增长,一家大型企业的数据量就可达到EB量级。根据IDC的“数字宇宙”的报告,预计到2020年,全球数据使用量将达到35.2ZB。相比于传统的以文本为主的结构化数据,大数据环境下非结构化的数据(比如:事务日志、音视频、地理位置、图片等)呈主流趋势。随着非结构化数据量的指数级增长,数据价值密度却在降低。以MOOC视频为例,一集15分钟的视频,大部分学习者真正获取到的有用数据不足三分之一。如何快速、高效完成数据“提纯”,避免内容重复,并对学习者进行一定的智能推荐和评价激励是值得探讨的问题。

4小结

国内MOOC实践时间短,经验缺乏,存在三方面的问题:(1)盲目选择课程视频,缺乏对学习者的内容推荐体系;(2)视频知识点内容重复,缺乏MOOC视频内容查重体系;(3)退学率高,缺乏对学习者的评价和激励机制。针对这些问题,提出解决方法:(1)建立智能关联推荐系统;(2)建立基于内容的视频检索查重系统;(3)建立机器化测评系统。

猜你喜欢
大数据
大数据环境下基于移动客户端的传统媒体转型思路