基于MOOC平台数学类课程情感词典的文本分析研究

2021-01-10 16:56刘娟谭均翘张靖红廖玉敏
科教导刊 2021年19期
关键词:情感分析在线教育可视化

刘娟 谭均翘 张靖红 廖玉敏

摘要在新冠疫情背景下网络在线教学成为“停课不停学”的主要方式,MOOC平台被越来越被教育者和学习者所采用,平台积累了大量的课程评论文本。将文本挖掘和数据可视化分析应用于MOOC学习平台,可以充分挖掘利用学习者海量的学习记录,利用Python进行文本的情感分析和可视化方法,提取和分析平台学习者对在线课程的学习感受,可以充分发挥教育大数据驱动课堂教学的改革与发展,并为学习者和教师提出相关建议。

关键词 在线教育 情感分析 可视化

中图分类号:G424文献标识码:ADOI:10.16400/j.cnki.kjdk.2021.19.026

Research on Text Analysis of Emotion Dictionary for Mathematics Courses on MOOC Platform

LIU Juan, TAN Junqiao, ZHANG Jinghong, LIAO Yumin

(School of Statistics and Mathematics, Guangdong University of Finance and Economics, Guangzhou, Guangdong 510320)

AbstractUnder the background of COVID-19, online teaching has become the main way for all kinds of schools in the country to achieve“stop classes and not stop learning”. With the wide application of online teaching, the MOOC platform has been increasingly adopted by educators and learners and accumulated a large number of curriculum evaluation texts. By applying text mining and data visualization analysis to MOOC learning platform it can make full use of massive learning records of learners. This paper uses Python to analyze and visualize the text, and extract and analyze the learning experience of online learners. By using education big data to drive the reform and development of classroom teaching, some relevant suggestions for learners, teachers are proposed.

Keywordsonline education; emotional analysis; visualization

0引言

面对突然到来的2020年新冠疫情,教育部提出的“停课不停学”的举措,全国各类学校暂停线下教学转为线上教学,一时间各大在线教育平台访问量迎来爆发式增长。目前,随着我国国内疫情得到有效控制,线下教育得到逐步恢复,但在后疫情时代在线教育将依旧持续发挥重要的作用。MOOC是中国在线教育重要平台之一,其市场规模和用户人数在逐年增长,截至2019年MOOC平台的注册用户年超过1000万。当前随着人工智能、数据挖掘和机器学习等技术的飞速发展,教育领域的数据处理与应用逐步走向成熟,美国在2012年10月发布《通过教育数据挖掘和学习分析促进教与学》的报告,目的在通过对教育大数据的挖掘和分析来促进美国学校教学系统的变革。我国在2015年由国务院正式发布《促进大数据发展行动纲要》,其中在“公共服务大数据工程”中明确提出大力建设发展教育文化大数据。目前情感分析和观点挖掘已经成为自然语言处理、机器学习等多领域交叉关注的一个研究热点。将文本挖掘和数据可视化分析应用于慕课平台在线课程的主观评论文本,可以全面了解学生对课程的意见和建议,帮助老师和学生之间的双向交流,提升教学质量,也可助力MOOC平台更好的提升服务。

随着大数据人工智能时代的到来,情感分析已经成为数据挖掘的一個热门领域,这种方法主要是通过对文本、图像和音频等非结构化数据进行分析,以此来获取人们的观点、态度以及看法。目前基于教育挖掘文本分析的在线教育课程评价研究相对不多,本文针对在MOOC平台开设最多的大学数学类课程展开文本分析,可以丰富在线教育研究的范围,也可以为全面评价教师在线教育的效果提供更多的视角。

1 MOOC平台发展现状及数学类课程介绍

根据宁夏大学现代教育技术所发布的《国内高校MOOC的学科分布现状研究》,我国高校MOOC的学科分布主要在理学以及工学,这两方面的课程数都在200至250区间,远高于第三多数量的文学课程数,而文学课程数只在50到100区间。MOOC平台的学习方式充分发挥了在线学习的特点,目前已经与北京大学、浙江大学、南京大学等共761所大学达成合作,开设了许多以大学生学习课程为主的内容,其中包含Python语言程序设计、心理学与生活等多方面课程。MOOC平台课程参与人数的分布,由10% 18岁以下学习者、78%的18-28岁在校学生以及12%的28岁以上的老师或学习者构成。

MOOC上开设的公共数学类课程有高等数学,线性代数,概率论与数理统计,微积分等,其中选课人数较多的有西华大学开设的《高等数学(上)》,共112163人参与学习,以及西华大学开设的《高等数学(下)》,共77671人参与学习。公共数学类课程参与人数普遍比其他数学类课程多,其中最受欢迎的线性代数课程为中国科学院大学的《线性代数》,共28780人参与学习,最受欢迎的概率论与数理统计课程为浙江大学的《概率论与数理统计》,共28282人参与学习。开设数学类课程较多的学校有浙江大学,电子科技大学,华东师范大学等,开设的公共数学类课程中,高等数学最多,其次是线性代数。

2研究设计

2.1方法介绍

文本情感分析是指文本作者所表达的主观信息,即作者的观点和态度,也可以被称为文本倾向性分析或文本观点挖掘,其主要任务包括情感分类和属性提取。根据MOOC平台评论文本的特点,每条评论富有情感极性,大部分课程评论是一个句子,所以选本文选取基于情感词典的语句级文本情感分析方法。

目前情感文本分类研究最多的是极性分类,也可以称为褒贬分类,即判断一篇文档或者一个句子所包含的情感是好还是坏。现在流行的情感词典都是通过人工构建,但人工感情词典构建需要大量的人力和物力,所以在文献中更多的利用情感词典。常用的有有BosonNLP情感词典、知网Hownet情感词典、台湾大学NTUSD、清华大学李军中文褒贬义词典等等。其中,BosonNLP情感词典是基于微博、论坛等数据来源构建的情感词典,这些被用于构建BosonNLP情感词典的基础数据与本项目中MOOC平台的课程评论数据,两者之间的形式较接近。因此,选用Bo- sonNLP情感词典为本项目情感分析的基础情感词典。BosonNLP情感词典包括正面情绪词词典、负面情绪词词典、否定词词典以及程度副词词典。

2.2数据采集

利用Python网络爬虫收集数据,采集对象是MOOC平台三门大学数学基础课程高等数学、线性代数、概率论与数理统计中每门开课课程的课程评论数据。爬虫进入到每一门课程的网址,在该网址下获取评论数据,其中包括评论人、评论时间、评论内容以及点赞数等。在爬取的过程中,考虑数据质量,筛选评论数少于等于20条的开课课程。爬取出来的数据结果在Excel文件中展示。其中,高等数学的数据总量为17220条,线性代数的数据总量为15940条,概率论与数理统计的数据总量为9800条。

2.3数据预处理

将收集到的17221条高等数学课程评论数据,17221条线性代数课程评价数据,9801条概率论与数理统计的评价数据进行筛选,筛选出2020年1月1日后的评论进行分词处理,利用python程序对每一条评论进行分词,去除停用词,得到的是每一条评论的词语组成的列表,再将表格导出,用excel进行去重以及去除列表为空的评价,得到的有效评论数为高等数学5978条,线性代数6410条,概率论与数理统计4962条。

2.4建立情感分析模型

在得到预处理数据的基础上,首先,判断每条评论中词语的积极性和消极性,然后,计算每条评论的得分情况,最后,通过得分的正负性来判断该条评论的积极性和消极性。本项目采用BonsonNLP情感词典,该词典中提供了否定词词典、程度副词词典、积极情绪词词典以及消极情绪词词典。假设词语与评论得分是线性的,词语之间相互独立,建立评论得分模型。

2.5数据可视化

将文本数据中的所有词语按词频统计后,利用python按评论情感正负面生成词云图见图1和图2。

从词云图可见,学习者对数学类课程的课程讲解、课程内容、设备使用情况、学习收获等方面有着极高的关注度。

從高度关联词语可见,“讲解”“好好”之间和“清晰”“详细”反映学习者倾向于学习者倾向于讲课详细,生动,有条理的课程内容,喜欢教师详细地讲解书本内容以及清晰有条理的教学方注重课程学习对生活和学习的实用性式。

3研究发现与小结

3.1针对学生的建议

线上学习有其方便的地方,但也存在一些问题,由于缺少师生间的面对面较流,学习者在学习的过程中有难理解的地方无法及时解决,从而产生消极心理,学习者应对难以理解的课程内容应保持平和积极的心态对待学习。由于在线课堂缺少老师的监管,学习者容易变得懒散,所以学习者不仅要认真听老师讲课,还应做好学习内容的预习与复习,认真完成课后内容,课后内容是对课上教学的有效延伸,是课堂学习的巩固和深化,很大程度反映着学习者的学习效率和学习效果。疫情时期,学生与老师之间的交流在课后内容上都有很大的体现,老师布置的课后任务是教学中必不可少的一个环节,起着查缺补漏的作用,学生可以通过完成课后任务巩固知识,了解自己的学习情况,遇到不懂的及时请教老师,从而提高自身的学习效率。

3.2针对教师的建议

在线教育只是课堂的转移,让学生在线容易,但是做到真正在学习却并不是很容易,在课程内容方面,学生倾向于详细易懂、丰富有趣、有用的课程内容,注重课程学习对生活的实用性,而对不能理解、枯燥乏味的课程内容有着消极的应学心态。教师在备课时需要充分思考如何调动学习者的积极性,激发他们学习的兴趣,考虑课堂的趣味性,适当增加互动来调动学习者的积极性,有针对性地设置例题检验学习者对知识点的掌握情况,同时可以适当准备几道难题,供有能力的学习者课后思考。参与在线教育的学习者越来越多,听课的不只是在校大学生,还有不少在职人员,上课的内容应该要让大部分人接受。教师应该讲的尽量清晰易懂,更有条理,尽量讲得生动,让学生更能接受课程内容。在课后方面,教师应该加强在线教育的课后交流,力争在学生发现自身弱点后能够及时帮助他改进。

参考文献

[1]王林梅.Web用户评价的自动情感分析[D].哈尔滨工业大学,2009.

[2]曹斌.互联网上旅游评论的情感分析及其有用性研究[D].哈尔滨工业大学,2012.

[3]张英杰.基于Blackboard平台的在线学习行为分析与预测[D].内蒙古师范大学,2017.

[4]李艳红.基于在线教育数据挖掘的个性化学习策略研究[J].微型电脑应用,2020,36(08):45-57.

猜你喜欢
情感分析在线教育可视化
数据可视化设计在美妆类APP中的应用
思维可视化
复变函数级数展开的可视化实验教学
复变函数级数展开的可视化实验教学
复变函数共形映射的可视化实验教学
复变函数共形映射的可视化实验教学
基于SVM的产品评论情感分析系统的设计与实现
基于词典与机器学习的中文微博情感分析
在线评论情感属性的动态变化
提高机械原理教学质量的几点思考