高校人才培养全过程与信息技术深度融合中的数据挖掘

2016-03-19 22:06文益民易新河李忧喜文博奚
高教论坛 2016年4期
关键词:人才培养大数据

文益民,易新河,李忧喜 ,文博奚

(桂林电子科技大学 1.计算机与信息安全学院;2.现代教育技术中心,广西 桂林 541004)



·项目论文·

高校人才培养全过程与信息技术深度融合中的数据挖掘

文益民1,2,易新河1,李忧喜1,文博奚1

(桂林电子科技大学1.计算机与信息安全学院;2.现代教育技术中心,广西桂林541004)

摘要:针对当前我国高校对教育数据挖掘重视程度不够,教育数据挖掘的应用范围不广,教育数据挖掘的研究成果还没有得到很有效应用的现状,以高校人才培养过程为线索,综述了高校人才培养全过程的五个阶段中的数据挖掘研究工作,并分析了数据挖掘对高校教育信息化的三个新要求。

关键词:教育数据挖掘;大数据;人才培养

引言

维克托·迈尔-舍恩伯格和肯尼斯·库克耶编写的《大数据时代》提出大数据具有4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)[1]。目前大数据已得到各国学术界、政府机构和企业界的高度重视。国际著名学术期刊Nature和Science分别于2008年和2011年推出大数据专刊;美国于2012年启动了大数据研究与发展计划,提出“通过收集、处理庞大而复杂的数据信息,从中获得知识和洞见,提升能力,加快科学、工程领域的创新步伐,强化美国国土安全,转变教育和学习模式”;沃尔玛利用语义数据进行文本分析、机器学习和同义词挖掘等,使得在线购物完成率提升了10%-15%;PredPol公司利用大数据分析算法预测犯罪发生的几率,可以精确到500平方英尺的范围。在洛杉矶运用该算法的地区,盗窃罪和暴力犯罪分别下降了33%和21%。大数据让人清醒地认识到了数据的价值。

在教育领域也积累了大量数据[2],美国于2012年发布的《通过教育数据挖掘和学习分析促进教与学》介绍了美国国内大数据教育应用领域和案例及应用实施所面临的挑战;《新媒体联盟地平线报告(2014高等教育版)》提出:教育范式正在向包含更多的在线学习、混合式学习和协作学习的方向转移,“翻转课堂”和“学习分析”一年内渐被采纳。到目前为止,教育数据挖掘已经引起了国际学术界的高度重视,成立了国际教育数据挖掘协会,发起了国际教育数据挖掘会议,发表了多篇关于教育数据挖掘的综述[3-9]和专著[10,11]。2013年中国高等教育学会院校研究分会专门举办了“院校研究数据分析的对象、内容和方法”研讨会[12]。

我国《教育信息化十年发展规划(2011-2020年)》提出:重点推进信息技术与高等教育的深度融合,促进教育内容、教学手段和方法现代化,创新人才培养、科研组织和社会服务模式,推动文化传承创新,促进高等教育质量的全面提高。MOOC、SPOC及在线教育正在中国快速发展。这些都表明:信息技术日益成为高校人才培养过程中不可或缺的重要组成。数据挖掘是现代信息技术的一种,以发现数据中的知识为目的[13]。本文以高校人才培养全过程为线索,综述数据挖掘在高校人才培养全过程中的种种应用,并分析数据挖掘给高校教育信息化带来的新要求。本文的主要贡献在于:从高校人才培养的角度对数据挖掘在高校人才培养过程中的应用提供了一个较完整的介绍,并分析了数据挖掘给高校教育信息化带来的三个新要求,使得我们可以更好地从大系统的高度来进行高校人才培养与信息技术相融合的顶层设计。

一、高校人才培养全过程的内涵

高校人才培养是个系统工程。到目前为止,关于高校人才培养模式和人才培养全过程,学术界并没有给出规范的定义。刘献君等提出人才培养模式不仅仅关涉“教学”过程,更关涉“教育”过程,它涉及到了教育的全过程,远远超出教学的范畴……人才培养模式的创新,要树立以学生为本的核心理念[14];钟秉林提出人才培养模式改革是高等学校内涵建设的核心,深化高校人才培养模式改革需从如下方面着手:科学定位,明确人才培养目标和规格;加强专业建设和改革,建立科学的专业体系;优化课程体系和教学内容;重视能力培养;改革教学方法和教学手段;倡导教学科研融合;完善内部质量保障体系[15]。

参考以上理论,本文按照时间顺序将高校人才培养全过程划分为如下五个阶段:人才培养方案设计阶段、招生阶段、学生在校学习与生活阶段、学生就业阶段以及校友跟踪调查阶段。人才培养方案设计阶段包括:人才需求及需求标准设置、人才培养目标确定、课程设置与教学方法选择。招生是高校人才培养工作的入口。《国际工程教育认证通用标准》提出学校要具有吸引优秀生源的制度和措施。招生阶段包括:招生宣传及新生招录。学生在校学习与生活阶段包括:专业选择、课堂学习、第二课堂学习、参加考试、参与科研与创新创业活动、参加各种学科竞赛、参加各种文化活动及在校消费。学生就业阶段包括:学校人才供给信息发布、就业信息推送、学生就业单位选择、学生创业及毕业生调查。校友跟踪调查阶段包括:校友调查和用人单位调查。在这五个阶段中最关键的是学生在校生活与学习阶段。

二、高校人才培养全过程中的数据挖掘

1.人才培养方案设计阶段

专业人才培养方案是高校实施人才培养的纲领性文件。在这个阶段中,对新专业建设而言,高校首先要从行业、企业及社会获得专业人才需求的数量、发展趋势、职位要求及专业声誉等信息,然后要结合高等教育本身的规律、国家或者区域的发展规划、学校开办这个专业的基础等去回答一个专业是否值得办,是否能办,进而设计专业的人才培养目标、毕业标准、课程设置及适用的教学方法等。对于已有专业而言,则需要利用这些信息对专业人才培养方案进行调整。

当前,用人单位一般都在招聘网站上发布各类职位招聘信息,这些信息可为高校专业人才培养方案设计提供丰富的基础数据。Carlson等利用信息抽取技术从招聘网站提取职位名称、工作地点、职位类型、职位提供者、职位要求、职位发布时间等[16];王静等提出利用树型结构分层条件随机从智联招聘、中国人才招聘网和中国英才网提取招聘网页中的招聘单位名称、职位名称、职位描述、薪金和职位要求等信息[17];廖乐健等利用本体与规则相结合的方法,消解招聘网页中词的歧义,以提取更准确的招聘信息[18];王西锋等利用中文命名实体的识别方法提取招聘单位名称、职位名称[19];俞琰利用隐马尔科夫方法从招聘网站提取招聘职位名称、专业名称、招聘人数及职位对年龄、性别、工龄、专业、学历及技能的要求[20]。

从网页中抽取到相关数据后,便可以利用数据挖掘算法进行深入分析,为专业人才培养方案设计提供参考。钟晓旭等[21]利用从招聘网站获取的招聘数据分析职位与学历的关系、职位与专业的关系;本文作者则利用从招聘网站上爬取到的工作地点、招聘人数、学历、职位职责及职位要求等数据,根据自建的课程名称库,分析课程之间的关联关系,分析职位需求的热点区域,还进行职位聚类以设计针对一类职位的课程,为专业的课程设置提供依据。但是,到目前为止,这方面的研究工作还不多。

2.招生阶段

招生阶段的核心工作是完成招录指标任务,招录到质量高的新生。招生宣传是宣传学校,吸引考生的重要措施。任湘郴等以大一学生为调查对象,发放调查问卷,主要涉及高考志愿填报及录取期间对高考的意义、高校的认知、宣传渠道的偏好、宣传方式方法的选择、宣传效果的主观认定等14个项目,对其进行主成份分析,发现如下因素会较大地影响招生宣传的效果:考生对高等教育及高校的认知和价值判断,获取信息的有效渠道,考生在获取信息时对其呈现方式的偏好及考生对高校宣传活动的感受和认可情况[22]。

根据第35次中国互联网络发展状况统计报告,截至2014年12月,我国网民10-19岁和40-49岁年龄段分别达到22.8%和12.3%。这说明高校招生网站已经成为高考考生和其父母收集高校及其专业信息的主要渠道之一。费志勇等提出了基于本体的招生信息揭示方法,通过分面组配来大大减少考生或考生家长从招生网站上获取相关信息的步骤,以提高招生宣传信息揭示的效率[23]。网站分析是通过网站获取用户信息的重要手段。曹梅等利用网站的连接特征指标、流量指标等网络计量指标,分析31个省级教育门户网站的影响力[24];张勇进等提出通过用户的网络属性、社会属性和注册内容等分析判断用户需求被满足的程度,进而识别用户公共需求[25]。如果能对高校招生网站进行类似的分析,就能更准确地了解用户需求,从而决定招生宣传及招生指标投放的重点区域,以有效提升高校招生网站的影响力和用户体验感。

杨悦等提出利用数据挖掘方法可进行考生成绩分析、录取预测、学生综合素质分类、招生计划分配及考生专业需求变化发现等[26];侯亚荣等利用高考成绩分析考生语文、数学、外语、综合这四门课程及课程成绩等级之间的关联关系[27];何小明等分析了考生填报的专业之间的关联性,以用于指导志愿填报[28];俸世洲等利用关联规则分析工具分析考生填报专业之间的关联关系,以优化高考指标投放分配[29];孙晓莹利用河南某普通高校历年的招生数据,对其重构后使用支持向量机预测招生人数[30];李敬文等利用学生的高考录取批次、生源地、对学校的喜欢程度、录取省控制线、招生计划及上线一志愿报考人数,利用模糊灰色模型预测高校的高考录取分数线[31];刘思宏等使用学生的高考成绩、性别、户口类别、考生类别、地区、专业和录取批次,利用决策树方法分析影响学生报到的因素,以预测学生是否会来校报到[32]。

3.学生在校学习与生活阶段

学生在校学习与生活阶段是高校人才培养的关键阶段。利用这阶段产生的数据可以进行:学习内容选择分析、线上学习行为分析、线下学习行为分析、学习状况分析与评价及在校消费行为分析等。

学习内容选择分析是指根据学生自身特点、学习目标、学习环境及历史学习行为分析学生的学习特点,并根据此特点向学生推荐课程或者学习路径,以提高学习效率和学习效果。周丽娟等对课程进行聚类,以构建无缺失的课程评价矩阵,在此基础上根据学生对相似课程的评分预测学生的兴趣爱好,为学生提供个性化的课程推荐[33];沈苗等利用学生基本信息对学生进行分类和对课程进行加权[34],潘伟利用学生与课程的交互行为对学生进行聚类[35],然后利用协同过滤算法实施课程推荐;Parameswaran等研究了选课系统对学生选课有约束的情形下对课程的协同过滤推荐[36]。Chen考虑了学习者的水平、课程的难易程度和学习内容的连续性,提出了个性化学习路径推荐系统。该系统可根据预先测试的学习者个人的不正确测试反应生成相应的学习路径[37];Durand等利用学习者的学习对象、学习领域、学习路径的最大长度、学习者的成绩、学习者当前的能力、期望达到的能力水平及学习方式等构造了基于马尔科夫模型的学习推荐系统来推荐学习路径[38];程岩利用学习者的学习风格与学习水平、学习对象的知识表达特征与难度系数,以及各学习者以往的学习路径,利用蚁群算法给学习者推荐个性化学习路径[39]。

线上学习行为包括学生使用和选择各类数字化教学资源的行为,在学习过程中开展交流的各种行为及学习工具的使用行为,甚至包括学生在进行线上学习时的情感反应等。彭文辉等将线上学习行为分为信息检索行为、信息加工行为、信息发布行为及沟通交流等四种,以及高、中、底三个层次[40]。线上学习行为分析与学习分析关系密切。世界学习分析研究会(SoLAR)认为学习分析是对学生学习过程和学习环境信息的测量、收集、分析及报告,以更好地理解并优化学生学习过程和学习环境。Ferguson对到2012年为止的学习分析研究成果进行了综述[41];傅钢善等采集了在校学生的学习时间跨度、学习总时长、学习次数、在线学习时长、重复学习率、讨论交流、学习笔记及接收短信数量等八种学习行为特征,利用数据挖掘方法和统计方法分析其与学习效果之间的关系[42];田娜等采集了学生完成的课时、作业分数、教学材料的浏览次数、登陆次数、页面浏览时间、发帖回帖的次数等数据,分析这些学习行为与课程成绩之间的关系[43];魏顺平采集了学生在线学习时登陆学习平台的次数、各教学资源的浏览情况来分析学习平台各模块之间的访问跳转及学生学习群体特征[44];蒋卓轩等采集了学生选修北京大学在Coursera上开设的6门慕课的学习行为数据,对学习者的成绩进行预测[45];Thai-Nghe等使用学生在导教系统中产生的数据,利用矩阵分解模型来预测学生掌握了多少知识,是否能完成练习[46];Liu等提出了一个能分析学生阅读文献时的信息需求,并能给学生推荐视频、PPT、程序源代码等教学资源的算法[47];黎孟雄等采集学生对教学资源的复制、下载、打印、浏览时间等行为后进行用户模糊聚类,以实现对教学资源的推荐[48]。

线下学习行为是指学生不在在线学习平台上展开的学习行为。这些学习行为包括学生的图书借阅行为、在教室里的各类学习行为,比如举手回答问题、抬头看黑板、低头阅读学习内容等,还包括学生应用所学知识解决实际问题时产生的行为。舒忠梅等采用回归分析方法得到关于学生学习满意度的20个独立变量:学生生源情况、学校学习资源提供、学生学习投入、校园文化、学生学习成果等,然后使用决策树方法分析学生的学习满意度与各独立变量之间的关系,为学校改进教学工作提高学生学习满意度提供参考[49]。在以上提及的线下学习行为中,除了图书借阅行为便于采集以外,其他目前还不便于采集。学生的图书借阅行为能反映学生的阅读兴趣、学习态度和职业追求,但目前这方面的研究成果尚少。钱强等使用借阅信息,如:读者证号、控制号、条形码、借出时刻、应还时刻、实还时刻、续借次数及图书信息,使用SOM算法将学生聚类成九类,发现各类学生在借阅内容、借阅次数上有着较明显的差别[50]。根据学生的图书借阅行为,可以分析学生的阅读偏好,从而进行图书推荐。董坤提取读者借阅书目、学科专业、学历、角色等信息计算相似读者,使用协同过滤算法进行图书推荐[51];李树青等利用大学生在图书馆的图书借阅数据构造二分网络,以此为基础设计了一种测度图书可推荐质量的迭代算法,结合图书类别目录层次、标题语义信息的提取处理方法、基于加权XML模型的用户个性化模式表达方法及其权值扩散策略,提出了三种图书馆个性化图书推荐算法[52];付沙、田元等根据读者借阅图书记录,利用关联规则挖掘方法进行图书的关联分析,以实现图书推荐[53,54];李克潮等结合读者专业、性别、年级及借还时间间隔计算读者之间基于云的相似度,向读者推荐有复本的图书[55]。

学习状况分析与评价包括:考试成绩分析、学业预警及生源质量分析等。考试是当前高校评价学生学习效果的重要手段之一,分析影响考试成绩的因素是考试分析的主要任务。武森等根据学生若干门课程的成绩将学生聚类,分析各类学生的强势课程和弱势课程,并分析选择专业之后各类学生的强势课程和弱势课程的变化[56];丁智斌等利用含学号、性别、英语成绩、社会活动情况、文体活动情况、平均成绩、名次等这些数据库字段分析影响高校学生学习成绩的因素[57]。学业预警是指根据学生前一阶段的表现预测学生是否会辍学。学业预警使得教师能尽早实施干预,促使学生顺利完成学业。Bayer等通过电子邮件和论坛产生的学生社会行为数据,构建一个社交图来预测学生的辍学和上学失败率[58];万星火等针对高校招生规模扩大,学生整体素质下滑,学业完成情况恶化等教育问题,选择普通话成绩、计算机二级成绩、英语四级成绩、绩点、选修课、已修学分、累积不及格课程门数及累积所欠学分等数据,利用核主成分分析方法建立了大学生学业预警模型,实现对大学生学业的动态定性预警与定量预警[59]。利用学生进入大学后的成绩,结合高考数据可进行生源质量分析。邓溪瑶等对K大学毕业的16320名本科生的四年GPA与其省份来源数据进行分析,构建了EI指数以评测K大学学生群体在地域维度上的学业表现差异,以科学合理地确定分省招生计划[60];邢涛采集了新生入学数据库和学生成绩数据库(含竞赛类和科研类成绩)中的相关数据,利用小波阈值聚类算法对学生进行聚类,在聚类后进行关联分析,从而评价生源质量[61]。

学生消费信息能为高校人才培养提供更全面的信息。从学生消费中可以了解学生的消费习惯、生活价值观及课余时间使用等信息。蔡建伟等采集了家庭月均收入、每月消费总支出、食物支出、衣着支出、娱乐支出、学习支出和通讯支出等在校消费数据,对大学生在校消费水平与消费结构进行量化分析,采用聚类分析方法将三类家庭的大学生分成高、中、低三类消费水平,并分析各类学生的消费特征[62]。当前很多高校都装备了一卡通系统,然而到目前为止还基本没有看到对一卡通数据进行挖掘分析的研究成果。

4.学生就业阶段

这个阶段的主要工作是促进学生就业,为学生就业选择提供充足信息,并对毕业生进行调查为改进人才培养方案提供参考。薛瑞峰等以师范学院大学生的专业综合成绩、计算机水平、学生是否就业及就业单位的性质等数据分析学生的就业去向与其成绩之间的关系[63];张晓萍等利用高校就业信息数据表中的数据,采用量化关联方法分析毕业生在校表现与其就业质量之间的关系[64];杨克玉等利用院系名称、专业名称、职业名称、工作城市名称、获得第一份工作的渠道等数据分析学生专业与职业及职业与职业之间的关联关系[65];樊春兰等采集了毕业生信息及学生是否就业等数据,训练神经网络以实现对成功就业的预测[66];刘玉华等采集学生个人信息、从事行业及从事岗位、企业信息及招聘岗位等数据,进行聚类分析和关联分析,以实现面向毕业生的就业信息推荐和面向企业的人才信息推荐[67]。毕业生调查可为学校进一步改进人才培养方案提供有效的参考,但目前还未见到相关研究成果。

5.校友跟踪调查阶段

校友资源的综合开发与研究已成为高等教育研究的一个热门话题。贺美英等提出校友毕业后的工作经历和体验,对学校人才培养和教学改革起着重要的推动作用[68];李欢等认为从校友那里获得的反馈可为更新人才培养方案提供非常重要的参考[69]。范静波等利用回归分析方法进行实证研究发现高等教育生源质量和教育质量确实对工作收入存在显著的影响[70];李永山通过对校友的问卷调查,发现社会实践、学习动机、校风学风、社会环境、个性特征、发展机遇等六种要素对于大学生成长成才具有非常重要的作用[71];巩建闽等通过设计调查问卷获得校友对专业能力和职业素质对其从事行业的重要性、校友对刚就业学生的专业能力和职业素质的评价、校友对在校期间开设的一些主要课程的评价及校友个人信息,分析了大学开设的课程对“继续深造学生”和“直接工作学生”的重要程度,对毕业生应该具备的能力进行了聚类分析[72]。

当前我国高校教育信息化已经取得巨大成果,这为利用数据挖掘技术对高校人才培养进行深入分析提供了很好的基础。但从以上分析来看还存在不少问题:第一,对数据挖掘的重视程度不够。主要体现在高校对数据挖掘在人才培养过程中的支持作用认识不到位。比如,各高校已经积累了大量的教学管理数据,但当前这些数据主要用于记录学生的学习过程,很少对其进行深入分析后反馈学生或者教师。另外,关于高校人才培养数据挖掘的研究成果很少发表在高水平的学术刊物上,哪怕是教育类的重要刊物也较少发表这方面的论文。第二,针对人才培养数据挖掘的研究与应用不平衡。目前高校对学生在校学习与生活阶段进行数据挖掘的研究工作较多,而对人才培养全过程中其他阶段的研究较少。第三,数据挖掘的研究成果对高校人才培养的贡献还不够大。目前主要停留在研究阶段,实实在在地利用这些研究成果去指导、改革高校人才培养工作的成果还很少。

三、数据挖掘对高校教育信息化的新要求

从以上文献综述可以知道,数据挖掘适用于高校人才培养各个阶段中的数据分析,可让高校更准确地了解学生或更好地为学生提供各项服务,大学管理要形成用数据“说话”的理性决策思维[73]。但是要充分发挥数据挖掘在高校人才培养中的作用,还有赖于高校教育信息化水平质的提升。

1.提升高校人才培养全过程中各阶段的数据采集能力

要进行教育数据挖掘,首先需要数据。因此,高校需以人才培养全过程为主线,切实构建各阶段的数据采集能力。除了要继续完善已建立的各类数据库系统外,高校还要重视开发各类数据采集软件,以从现有的服务器日志系统、一卡通系统、移动设备后台系统、校园监控系统、招生招聘网站、网络教学系统、各类教学软件等提取人才培养分析所需的数据。比如:招生网站要有采集用户浏览行为的功能,课堂教学质量监控系统要有采集学习与教学行为数据的功能。另外,对一些不便于使用计算机软件采集的数据要做好抽样调查。这就要求高校在推进教育信息化过程中要有良好的数据素养与数据采集意识,在开发各类教育教学信息化平台时对于数据采集予以充分重视。另外,还需特别重视数据的积累,数据的历史积累能够为很多人才培养相关问题的分析带来很大好处。

2.详细设计对高校人才培养全过程实施数据挖掘所需的各类数据

要以高等教育学原理为指导,详细设计以人才培养为中心的数据体系及数据标准,以实现对高校人才培养全过程的“全息”测量。这里的“全息”要求在纵向上覆盖大学生接受教育的各阶段,在横向上覆盖大学生在校学习、生活的各方面。另外,采集的数据在粒度上要有层次。比如,成绩管理系统不能只存储课程考试总成绩,还需在更细的粒度上存储学生各道测试题的得分,甚至还要记录与各道测试题相关的知识点;视频教学系统不能只简单记录学生看了多少次,还需详细记录学生观看视频时的倒退次数及倒退发生的时间等行为,等等。人才培养的复杂性对这种“全息”数据提出了迫切需求。各种移动应用为采集人才培养“全息”数据提供了有力且有效的技术支持;国务院《促进大数据发展行动纲要》(国发(2015)50号)提出“要实现学生学籍档案在不同教育阶段的纵向贯通”,为采集人才培养“全息”数据也提供了政策支持。

3.创新机制促进高校人才培养全过程数据的校内共享和校际共享

由于管理体制的原因,当前要想获得高校内部各部门关于人才培养的数据不是件容易的事,至于要实现校际之间的数据共享更是难事。然而,不这么做就无法通过数据挖掘从数据中获得可信度高的规律与模式,也无法有效地验证这些规律与模式。因此,教育行政管理部门和各高校应该打破私心,积极创新促进高校人才培养全过程数据共享的机制。比如:通过制定校内或者校际的数据管理办法,对数据的采集、使用、成果发布及应用做出明确规定。同时,还需加强教育教学数据标准的研制工作。2012年教育部发布了7个教育管理信息行业标准,4个教育资源建设方面的标准。目前与学习者、虚拟实验与学习、多媒体教学环境、在线课程等相关的数据标准正在研究或者测试中。但这些标准中所描述的数据其实还不足以覆盖高校人才培养全过程的各个阶段,还不能覆盖各个阶段的纵深,还不能完全满足新一代信息技术条件下开展教育教学活动的要求。

(责任编辑:梁京章)

(感谢华中科技大学教育科学研究院张俊超副教授对本文提出的宝贵意见!)

参考文献:

[1]维克托·迈尔-舍恩伯格,肯尼斯·库克耶. 大数据时代[M]. 杭州:浙江人民出版社,2013.

[2]顾小清,林仕丽,袁海军. 教育数据30年:从CMI 到DDDM[J].电化教育研究,2010(9): 55-63.

[3]BAKER R S J D,YACEF K. The state of educational data mining in 2009: A review and future vision[J]. Journal of educational data mining,2009,1(1): 1-15.

[4]SHU-HSIEN L,PEI-HUI C,PEI-YUAN H. Data mining techniques and applications-a decade review from 2000 to 2011[J]. Expert Systems with Applications,2012,39(12): 11303-11311.

[5]ROMERO C,VENTURA S. Educational data mining: a review of the state of the art[J]. IEEE Transaction on systems,man,and cybernetics,part C: applications and reviews,2010,40(6):601-618.

[6]ROMERO C,VENTURA S. Educational data mining: a survey from 1995 to 2005[J]. Expert Systems with Applications,2007,33(1): 135-146.

[7]ALEJANDRO P A. Educational data mining: A survey and a data mining-based analysis of recent works[J]. Expert Systems with Applications,2014,41(4): 1432-1463.

[8]李婷,傅钢善. 国内外教育数据挖掘研究现状及趋势分析[J]. 现代教育技术,2010,20(10): 21-25.

[9]周庆,牟超,杨丹.教育数据挖掘研究进展综述[J].软件学报,2015,26(11):3026-3042.

[10]ROMERO C,VENTURA S,PECHENIZKIY M,et al. Handbook of Educational Data Mining[M]. Ohio,CRC Press,2010.

[11]葛道凯,张少刚,魏顺平.教育数据挖掘:方法与应用[M]. 北京: 教育科学出版社,2012.

[12]张俊超. 院校研究如何通过数据分析为大学管理决策服务[J].高等教育研究,2013,34(8):105-109.

[13]韩家炜,KAMBER M,裴健. 数据挖掘:概念与技术[M].北京:机械工业出版社,2012.

[14]刘献君,吴洪富.人才培养模式改革的内涵、制约与出路[J].高等教育研究,2009(12):10-13.

[15]钟秉林. 人才培养模式改革是高等学校内涵建设的核心[J]. 高等教育研究,2013,34(11): 71-76.

[16]CARLSON A,SCHAFER C. Bootstrapping Information Extraction from Semi-structured Web Pages[C]//the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases,Antwerp ,2008:195-210.

[17]王静,刘志镜. 基于概率模型的Web信息抽取[J]. 模式识别与人工智能,2010,23(6): 847-855.

[18]廖乐健,曹元大,李新颖. 基于Ontology的信息抽取[J]. 计算机工程与应用,2002(23):109-113.

[19]王西锋,张晓孪. Web招聘信息抽取中命名实体识别的研究[J]. 计算机与数字工程,2012,40(5): 34-37.

[20]俞琰. 基于隐马尔可夫模型的招聘网络信息抽取[J]. 北京电子科技学院学报,2008,16(4): 93-98.

[21]钟晓旭,胡学钢. 基于数据挖掘的Web 招聘信息相关性分析[J]. 安徽建筑工业学院学报(自然科学版),2010,18(4): 93-96.

[22]任湘郴,何志祥,蒋阳飞,等.高教改革视野下招生宣传绩效评价与解读[J]. 大学教育科学,2013(6): 44-47.

[23]费志勇,赵新力. 基于本体驱动的高校网站招生信息分面组配揭示[J]. 图书情报工作,2008,52(12): 81-84.

[24]曹梅,闵宇锋. 教育网站影响力评价的实证研究——基于我国31个省级教育门户网站的网络计量[J].开放教育研究,2011,17(6):104-110.

[25]张勇进,杨道玲. 基于用户体验的政府网站优化:精准识别用户需求[J].电子政务,2012(8): 19-27.

[26]杨悦,郭大勇.数据挖掘在高校招生工作中的应用前景[J].教育科学,2007,23(5):66-68.

[27]侯亚荣,万雅奇,张书杰. 教育考试数据挖掘的研究与实现[J]. 计算机工程与应用,2008,44( 16): 132-134.

[28]何小明,张自力,肖灿,等. 基于OLAP与数据挖掘的高考招生数据分析[J]. 计算机科学,2012,39(6):175-178.

[29]俸世洲,周尚波. 关联规则在独立学院招生决策中的应用[J].计算机科学与工程,2012,34(1): 119-123.

[30]孙晓莹,郭飞燕. 数据挖掘在高校招生预测中的应用研究[J].计算机仿真,2012,29(4):387-391.

[31]李敬文,陈志鹏,李宜义,等. 组合预测模型在高考数据预测中的应用研究[J]. 计算机工程与应用,2014,50(7): 259-262.

[32]刘思宏,余飞. 决策树技术在高校招生决策中的研究与应用[J]. 齐齐哈尔大学学报,2014,30(5): 24-28.

[33]周丽娟,徐明升,张研研,等.基于协同过滤的课程推荐模型[J].计算机应用研究,2010,27(4):1315-1318.

[34]沈苗,来天平,王素美,等. 北京大学课程推荐引擎的设计和实现[J]. 智能系统学报,2015,10(3): 1-6.

[35]潘伟. 基于协同过滤技术的个性化课程推荐系统研究[J].现代情报,2009,29(5): 193-196.

[36]PARAMESWARAN A,VENETIS P,GARCIA-MOLINA H. Recommendation systems with complex constraints: A course recommendation perspective[J]. ACM Transactions on Information Systems,2011,29(4):20-33.

[37]CHEN C M.Intelligent web-based learning system with personalized learning path guidance[J].Computers & Education,2008(51):787-814.

[38]DURAND G,LAPLANTE F,KOP R. A learning design recommendation system based on Markov decision processes[C]//The the 17th ACM SIGKDD Conference on Knowledge Discovery and Data Mining workshop,San Diego,2011: 69-76.

[39]程岩.在线学习中基于群体智能的学习路径推荐方法[J].系统管理学报.2011,20(2):232-237.

[40]彭文辉,杨宗凯,黄克斌. 网络学习行为分析及其模型研究[J]. 中国电化教育,2006(10):31-35.

[41]FERGUSON R. Learning analytics:drivers,developments and challenges[J]. International Journal of Technology Enhanced Learning ,2012,4(5/6),304-317.

[42]傅钢善,王改花.基于数据挖掘的网络学习行为与学习效果研究[J].电化教育研究,2014(9):53-57.

[43]田娜,陈明选.网络教学平台学生学习行为聚类分析[J].中国远程教育,2014(11):38-41.

[44]魏顺平.在线学习行为特点及其影响因素分析研究[J]. 开放教育研究,2012,18(4):81-90.

[45]蒋卓轩,张岩,李晓明.基于MOOC数据的学习行为分析与预测[J].计算机研究与发展,2015,52(3):614-628.

[46]THAI-NGHE N,HORVáTH T,SCHMIDT-THIEME L. Factorization models for forecasting student performance[C]//The 4th international conference on educational data mining ,Eindhoven,2011: 11-20.

[47]LIU X Z,JIANG Z R,GAO L C. Scientific Information Understanding via Open Educational Resources (OER)[C]// The 38th Annual ACM SIGIR Conference,Santiago,2015:654-654.

[48]黎孟雄,郭鹏飞. 基于模糊聚类的教学资源自适应推荐研究[J]. 中国远程教育,2012(7):89-92.

[49]舒忠梅,徐晓东. 学习分析视域下的大学生满意度教育数据挖掘机分析[J]. 电化教育研究,2014(5):39-43.

[50]钱强,李英. 数据挖掘技术在图书馆读者分析中的应用[J].图书情报工作,2009(6):121-124.

[51]董坤.基于协同过滤算法的高校图书馆图书推荐系统研究[J].现代图书情报技术,2011(11):44-47.

[52]李树青,徐侠许,敏佳.基于读者借阅二分网络的图书可推荐质量测度方法及个性化图书推荐服务[J].中国图书馆学报,2013,39(205):83-95.

[53]付沙. 基于序列模式挖掘的图书馆用户借阅行为分析[J]. 情报理论与实践,2014,37(6): 103-106.

[54]田元,李佳,宋纬华. 一种基于用户层次信息的关联规则图书推荐系统[J]. 现代情报,2010,30(12):73-76.

[55]李克潮,蓝冬梅,凌霄娥. 云模型和多特征的高校读者借阅偏好不确定性图书推荐研究[J]. 现代图书情报技术,2013(5): 54-58.

[56]武森,俞晓莉,倪宇,等. 数据挖掘中的聚类技术在学生成绩分析中的应用[J].中国管理信息化,2009,12(15): 45-47.

[57]丁智斌,袁方,董贺伟. 数据挖掘在高校学生学习成绩分析中的应用[J].计算机工程与设计,2006,27(4):590-592.

[58]BAYER J,BYDZOVSKá H,GéRYK J,et al. Predicting drop-out from social behaviour of students[C]//The 5th international conference on educational data mining,Chania,2012: 103-109.

[59]万星火,郑俊玲,金永超.基于KPCA 的高校学业预警模型及其应用[J].数学理论与应用,2014,33(4):99-104.

[60]邓溪瑶,乔天一,于晓磊,等. 高校分省招生计划的效率判据——学生群体学业表现地域差异大数据研究[J]. 中国高教研究,2014(12):23-27.

[61]邢涛. 小波聚类算法在本科招生生源质量分析中的应用[J]. 南京航空航天大学学报,2009,41(6):823-827.

[62]蔡建伟,曾生达,修德茂,等.大学生消费水平与消费结构分析[J].经济视角,2012(5):106-108.

[63]薛瑞峰,彭墩陆. 数据挖掘技术在本科毕业生就业指导中的应用研究[J]. 中国管理信息化,2013,16(3): 108-109.

[64]张晓萍,朱玉全,陈耿.量化关联规则在高校就业信息数据中的应用[J].计算机技术与发展,2013,23(11):199-212.

[65]杨克玉,刘斌. 数据挖掘技术在高职毕业生跟踪调查中的应用[J]. 电脑知识与技术,2014,10(31): 7256-7259.

[66]樊春兰,高殿军. BP 神经网络的大学毕业生就业信息分析——以辽宁工程技术大学为例[J]. 辽宁工程技术大学学报(社会科学版),2011,13(3):272-274.

[67]刘玉华,陈建国,张春燕. 基于数据挖掘的国内大学生就业信息双向推荐系统[J]. 沈阳大学学报( 自然科学版),2015,27(3):226-232.

[68]贺美英,郭樑,钱锡康. 对高校校友资源的再认识[J]. 清华大学教育研究,2004,25(6): 78-82.

[69]李欢,孙建三,袁本涛. 基于校友数据库的高校人才培养质量控制系统模型[J].高等工程教育研究,2011(2):82-86.

[70]范静波. 高等教育生源质量与教育质量对个人收入的影响[J]. 教育科学,2013,29(3): 71-75.

[71]李永山. 论影响大学生成长成才的因素[J]. 合肥工业大学学报(社会科学版),2009,23(3): 6-9.

[72]巩建闽,萧蓓蕾,董文娜.基于校友反馈的人才培养质量问卷及案例分析[J]. 高等工程教育研究,2012(5): 121-126.

[73]张俊超.大数据时代的院校研究与大学管理[J].高等工程教育研究,2014(1):128-135.

Data Mining in the Process of In-depth Integration of ICT with Talent Training in Chinese Universities

WEN Yi-min1,2,YI Xin-he2,LI You-xi,WEN Bo-xi1

(1.School of Computer Science and Information Security;2.Research Center of Modern Education Technology,Guilin University of Electronic Technology,Guilin 541004,China)

Abstract:For the reasons of paying less attention to educational data mining(EDM),limited application of EDM,and being not fully used of the achievements of EDM in Chinese universities,we took the process of talent training as indices to survey the research works of educational data mining in the five stages in the process of talent training,and proposed three new problems which Chinese universities should to consider during the development of education informationization.

Key Words:educational data mining;big data;talent training

中图分类号:G642

文献标识码:A

文章编号:1671-9719(2016)4-0018-07

作者简介:文益民(1969-),男,教授,博士,硕士生导师,现代教育技术中心副主任,研究方向为教育数据挖掘。

收稿日期:2016-01-20修稿日期:2016-02-19

基金项目:中国高教学会教育信息化专项课题“利益相关者理论视域下全日制本科在线课程建设研究”(2014XXH1205YB);广西高等教育教学改革工程项目“全日制本科在线课程建设研究与实现”(2014JGZ116);教育部在线教育研究基金(全通教育)课题“全日制本科SPOC教学模式创新及关键支撑技术研究”(2016YB155)。

猜你喜欢
人才培养大数据
速录专业 “三个一” 人才培养模式的研究
大数据环境下基于移动客户端的传统媒体转型思路
学研产模式下的医药英语人才培养研究
基于人才培养的中职生日常管理研究
基于人才培养的高校舞蹈教育研究
女子中专班级管理共性问题与解决策略研究
基于人才培养的技工学校德育实效性研究
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索