远程教育系统中数据挖掘技术的应用

2014-08-15 00:55徐志明
景德镇学院学报 2014年6期
关键词:数据挖掘系统教学

徐 丽 徐志明 陈 峰

(景德镇学院,江西 景德镇 333000;2、景德镇市财政局,江西 景德镇 333000)

0 概述

现代远程教育系统是对传统教学模式的一次革命,它突破了传统“面授”教学的局限,为网络学员提供了自由的学习时间、优秀学习资源共享、不受空间限制、动态交互式的全新教学模式。其设计大多基于XML标准和大型分布式数据库等新一代设计环境。在远程教育平台系统上开展数据挖掘可以整合XML和OLAP等技术优势,使远程学习系统的设计以用户为中心,各类教学资源都适应网站学习用户需求进行差异化排列组合。

当前流行的远程教学系统组织框架一般包括个性化的组合课程模块、分阶段的考试系统、远程教育数据流控制动态调配模块、作业答疑等子系统。结合WEB数据挖掘技术,可以针对当前远程教育平台体系中的一些不足,充分发挥数据挖掘在互联网大数据处理中的优势,为网络学员提供可定制化的学习进度安排,提高网络教育的质量。

在一些热门的远程教育系统中,比如新东方网校、中华会计网校以及国内外一些著名高校的远程教育网站。教师和学员在教学互动中处于不同的空间、时间,网站通过动态交互页面从注册招生、教学管理、学员信息维护等多方位对整个教学过程进行管理。对远程教育网站的各种用户行为(如浏览空间、模块点击频度)进行数据挖掘,获取有用的知识,并随之更新网站搜索引擎和web页面设计,提供有针对性的服务内容,使远程教学平台的各类资源围绕学生的个性化需求配置。

1 数据挖掘技术介绍

近年来,数据挖掘技术的应用引起了人们的极大关注。在这关注的背后是自上世纪九十年代以来各种大型的商业数据库广泛应用,产生了大量的历史数据,而各种商业目的迫切需要从这些不断产生的数据中挖掘出有用的知识,这些获取的信息和知识已被证明有着广泛的价值和应用。

作为一种较新的信息分析处理技术,数据挖掘(Data Mining)的核心步骤是对数据仓库中的大量留存的历史业务数据进行抽取、清洗、转换和分类模型化处理,进而实现辅助设计、事务决策、全局分析等高价值商业目的。挖掘数据仓库是一个多步骤的分析过程,包括问题定义、建立数据挖掘库、分析数据、调整数据、模型化、评价和解释等。知识提取往往需要反复对相关数据再处理以及对知识学习算法不断优化。发现的知识必须经过实践的检验,在应用中根据实际环境修改策略重新学习使得获取的知识更精确化,新发现的知识对已有的知识进行拓展变得全面从而更符合现实情况。

数据挖掘是一个以数据库、神经网络、数理统计、模糊论等几个支柱技术为基础。数据挖掘算法的输入是通过转换接口导入的领域知识、元数据;输出是新发现的规律或模式;中间的处理过程由知识发现系统管理器智能化引导。数据挖掘主要涉及挖掘内容、挖掘引擎构造、挖掘任务三个方面。其中的挖掘内容包括关系数据库、文本数据库、对象数据库、空间数据库、多媒体数据库及ODS(操作数据存储)等。常用的挖掘方法大致分为:关联规则算法、分类构造法、遗传算法、人工智能法,针对大型分布式WEB数据库主要有多维数据分析方法、基于网格的聚类方法、贝叶斯分类算法和决策树分类算法。

流行的数据挖掘工具有:基于粗糙集的工具、基于规则和决策树的工具、基于公式发现的工具以及综合以上多种方法的工具。数据挖掘工具主要可分为特定领域使用的和通用的。著名的如SKICAT系统、Advanced Scout系统均是特定领域的数据挖掘工具,Advanced Scout系统由IBM公司开发,针对NBA的数据,帮助球队优化战术组合;SKICAT系统由CIT设计,帮助人们发现遥远的类星体。特定领域的数据挖掘工具针对性强,采用独特的算法实现特殊的目的。通用的数据挖掘工具,采用通用的挖掘算法处理常见的数据类型,用户可以自己定义挖掘的范围和模式。投入初步商业化应用的如:加拿大西蒙菲莎大学研发的DB Miner软件,SGI公司设计的Mine Set系统。

2 数据挖掘在远程网络教学平台中的部分应用

2.1 结合数据挖掘技术指导并优化网络教学平台的Web页面设计

对于远程教育网站平台而言,对网页的浏览量、点击率等数据进行专门的收集存储,建立DW并展开挖掘分析,可以提供有针对性的服务引导,及时优化搜索引擎算法路径和Web页面框架设计。

通过对网站系统架构改进重组,可以帮助系统管理人员创建一个高效的技术体系,优化服务器的通信:比如采用自动归类技术实现网站信息的层次性组织,结合对用户访问日志的挖掘,把握用户的兴趣,开展个人信息的定制和推送;通过Web页面数据提取,挖掘浏览历史信息,提高网络利用率,从而加快网站响应时间。

由于Web信息呈现半结构和无结构的特征,传统的搜索引擎功能设计已不能够满足互联网知识搜索的需求,更别提WEB上的知识发现。因此,针对Web信息的数据挖掘可以使远程教育平台的信息检索水平得到较大的提升。Web数据挖掘一般分为Web内容挖掘、Web结构挖掘、Web日志挖掘,为提高对Web挖掘结果的兴趣性,可以将上述三类挖掘方法一并使用。

2.2 结合XML和OLAP辅助WEB数据挖掘,指导远程教育系统平台设计

随着WEB应用的深入,XML的优点愈发明显。首先,作为半结构化的XML规范,XML将显示与数据内容分离并彻底把标示的概念与显示分开,处理者能够嵌套程序化的描述显示数据;其次,XML解决了数据的统一接口问题并且XML能增加结构和语义信息,使得统一数据以不同面貌展现给不同用户;除此以外,XML应用于网络代理的所取得的信息编辑可以很好地适应个人用户需要。利用XML的上述优势,远程教育平台在实现智能交互时,搜索部件就不必了解每个数据库是如何构建的。

OLAP是共享多维信息的、针对特定问题的联机数据访问和分析的快速软件技术。它具有灵活的分析功能、直观的数据操作和分析结果可视化表示等突出优点,从而使管理方对大量的远程网络教学数据的挖掘分析变得轻松而高效。

2.3 数据挖掘技术使得构造针对学习评价的多维数据模型更加全面

要在远程教育系统中构建二级个性化教学子平台,必须先对网络学员各阶段的学习情况给出较全面的评估,之后再匹配相关的教学方案。我们可以建立如下的多维数据模型获取对学员的评估:

⑴事实数据表。事实数据表是数据仓库结构中的中央表,它包含联系事实与维度表的度量值和键,事实数据表包含描述业务特定事件的数据。远程教育平台系统的中心主题是对学员的学习事实做出多维度的评价,对网站学员的评价维度我们可以提取为简单直观的数值表示,对每个维度分别给出数字的度量值,然后进行综合加权出最后的结果。

⑵项目评价维度表。学员是整个远程教育网站服务的中心对象,要实现平台真正的个性化教学功能,必须利用数据捕获技术动态地跟踪学员的学习活动,并及时对其学习进度、成效做出评价,反馈相关建议信息。评价的项目维度有四个方面:作业答疑情况、网站资源利用率、测试结果、交互程度。

⑶知识维度表。知识维度表存放课件中重要知识点的组织架构。在传统文本形式的课件中,知识维度表架构呈现的是树状形式。其不仅可以从多重粒度上了解学员的学习效果,而且更便于掌握学员学习进度。我们在学习进程中是从上到下依次遍历各知识节点,不会遗漏。其缺点是在分析难点和重点时,通常是爱莫能助的。要实现个性化教学,我们须另外构造一种知识结构图,其基于有序矢量路径的拓扑结构并假设新的知识点由一个或一个以上的已被掌握的知识积累形成,这种继承关系组织知识架构去除了章、节等传统结构,只留下要学习的知识点依照先后关系建构出有序可追溯的知识结构图。对于学员碰到的重点、难点可以结合互动测试,根据相关结果重新进入相应知识结构图的节点重新学习,从而针对性的突破学员遇到的课程重难点。

2.4 充分利用数据挖掘获取的信息调整远程教学资源库建设,并为网络学员提供个性化服务的应用

在网络平台教学资源建设上,为了更具备针对性,按如下步骤进行:首先对网站学员选择的课程聚类并建立关注度模型,建立关注度和课件间关联,调整课件制作方案,通过聚类算法标记每门课程;其次,根据关联规则估计出若干组同类课程课件,根据类别标记输入训练集,构造分类器;最后计算关键字段使用频度的平均值、方差值等统计数据,利用OLAP对数据仓库进行多维分析,引导序列模式预测出学员感兴趣的课件,根据学员需求配置相关教学资源。

要实现远程网络教育平台的个性化教学,很重要的一点是要对学习者个体数据进行差异化分析处理。利用数据挖掘中分类和聚类分析的方法,依照学生的兴趣爱好为其推荐相关知识点,并在学习过程中不断调整,因材施教;根据学员的测试成绩挖掘知识点和问题间的关联,补充没有掌握的学习点并给出相关学习建议;教师根据学员的学习行为和反馈情况,及时调整教学方案,制定专门化的教学内容。数据挖掘技术的应用使远程教育方案能够个性化实施、极大地提高远程教育的作用和效率。

2.5 通过数据挖掘技术,不断改进远程教育系统后台性能

远程教育系统的架构师可以结合WEB数据挖掘出的信息指导远程教育网站建设,持续优化系统性能以提高广大网络学员的学习体验。通过对注册学员学习活动行为过程的挖掘,掌握学习者的访问特点,预测学员学习访问情况,重构页面的底层链接。对需求强烈的页面提供优化,预先缓存频繁被访问的页面,改善信息通信瓶颈节点的流通速度,及时把学习者想要的信息以更有效的方式呈现给他,从而提高用户的满意度。除此以外,远程教育网站系统的安全和稳定性能也是十分重要的,平台的技术管理人员可以根据系统数据库中间件被请求的资源,负载缓存的进出平衡和整个后台流控突发情况等信息,找到影响系统性能的瓶颈,及时发现平台的安全漏洞。

3 总结

本文主要探讨了现阶段WEB数据挖掘在远程网络教学中的应用,数据挖掘技术在网络远程教学中还存在许多待研究的领域。随着数据挖掘前沿技术领域不断收获丰硕的成果,Data Mining也呈现出可视化、精确化、更加智能化等新的特性。同时伴随近两三年来移动互联技术、普适计算、云计算等数据应用大环境的迅速革新,作为核心数据处理技术之一的数据挖掘在远程教育领域拥有广阔的应用前景。

[1]Magaret H.Dunham.数据挖掘教程[M].北京:清华大学出版社,2005.

[2]张林.数据挖掘技术及其在高等教育教学中的应用[J].宿州学院学报,2011.

[3]黄勇,李玉华.面向知识发现的数据分类技术在网络教学中的应用研究[J].南华大学学报,2006,(6):32-35.

[4]基于web的数据挖掘在远程教育中的应用[EB/OL].<http://wenku.baidu.com/view/2967f91ca76e58fafa b003a4.html>

猜你喜欢
数据挖掘系统教学
Smartflower POP 一体式光伏系统
WJ-700无人机系统
探讨人工智能与数据挖掘发展趋势
微课让高中数学教学更高效
基于PowerPC+FPGA显示系统
“自我诊断表”在高中数学教学中的应用
连通与提升系统的最后一块拼图 Audiolab 傲立 M-DAC mini
基于并行计算的大数据挖掘在电网中的应用
对外汉语教学中“想”和“要”的比较
一种基于Hadoop的大数据挖掘云服务及应用