基于数据仓库的教育决策支持系统

2013-08-15 00:43
电子测试 2013年20期
关键词:数据仓库数据挖掘决策

王 妍

(沧州医学高等专科学校,061000)

当前计算机技术快速发展,信息时代的大潮已经迎面而来。在此背景下,教育信息化的程度也在不断加深,教育机构的信息化建设水平也不断提高,各级教育机构也都相应建立了教育信息管理系统,来提高教育的管理水平。但是在各级教育机构目前运行中的教育信息管理系统也存在着诸多问题,如各级管理部门均设有自己的管理系统,各系统之间缺乏联系;信息化程度仍然有限,手工作业的业务仍占很大比例。各级教育系统内产生的大量的数据也不能够进一步加以利用,来为上级教育管理部门的决策提供相应的支持。教育管理部门往往在进行决策前,要对各级教育机构的数据系统进行查询并进行分析。这样的结果导致增加了教育管理部门的工作量,并且容易造成计算错误,对决策的质量也造成了不利影响。

由此,本文提供了基于数据仓库的教育决策支持系统的模型,建立这一系统模型,就是希望能给教育管理部门提供一个能够有效满足其开展各项业务需求,使教育管理部门能够对管辖范围内的教育动态及时进行掌握,并据此制定相关的发展政策,探讨发展趋势,提出对策建议等提供有效的数据信息支持,使政策的制定依据更加可靠。

1 系统设计的思想和结构

运用数据仓库的数据挖掘技术构建的教育决策支持系统,主要是考虑层次结构的模型。模型中的教育资源库分为五层:以各地的教育资源数据库为基础的数据库层;将各地传送过来的教育信息进行加工与处理的转换层;储存所有信息的基础层;对数据进行综合分析的分析处理层;将分析结果向用户进行展示的展示层。

1.1 教育数据源

数据源是整个系统的分析对象,也是系统运行的基础部分,一般是将教育信息系统的内部信息以及传送过来的外部信息一同包括在内。

1.2 数据仓库部分

这一部分主要是对数据进行重新的清理,以确定数据的储存方向和储存模式,同时对分类的数据开展组织存储工作。根据数据的来源和归属范围,可以将数据仓库分为教委级和各部门级两级数据仓库。在日常的管理工作中,主要负责数据的安全保障,归档、备份等一系列基础性工作。

1.3 OLAM与OLAP模块

OLAM与OLAP模块,也就是实时联机发掘和实时联机分析部分。这两种服务器均以数据分析和展现作为工作基础,根据设定的不同主题方向而发展起来的数据集市部分。这一模块采用数学运算与分析的形式,来汇总存储在数据库中的相关数据,并通过采用清晰直观的汇报形式,便于用户了解分析的结果。

1.4 前端工具

前端工具主要提供数据分析,生成报表和为用户提供查询等功能,以及根据数据特点而需要使用的其他数据处理工具。数据工具在工作中对应OLAP服务器进行使用,而数据挖掘工具与报表工具形结合,可以基于数据仓库和OLAP服务器提供服务。

2 系统建立所需的关键技术与应用方式

2.1 数据仓库的建立

数据仓库是为用户提供数据支持的数据集合。在原有的教育信息管理工作中,不同级别的教育管理部门都拥有属于自己的数据库,在运行过程中,还产生了大量的数据,由于系统不同,其数据结构也不一致,这样就严重影响了数据的管理和信息的交流过程。通过建立一个统一的数据仓库进行管理,为决策前的数据分析提供了技术上的便利。但是在数据统一之前,需要通过对数据进行重组整合的方式,来保障数据的有效发挥。教育分析需求会随着时间的变化而不断发生变化,因而在数据仓库中,数据存储应选择分域的形式,数据组织和存储单元的规模不应过大,以满足数据仓库运行对灵活性的需求。常见的信息系统中具有的多种特性,在系统的设计中都要有所体现。例如在教育管理系统中可以将相关的业务根据不同的主题进行分类,如设备、人员、账务、产业等。人员信息的管理要对人员的各项基础信息与附加信息等进行记录管理。

2.2 教育知识发现

教育知识发现是从原有的教育知识管理基础上发展而来的,其含义是指从原来的大量不完整模糊教育数据中,将其中有效的、可以潜在利用的、新鲜的数据进行理解的一个思维过程。教育知识发现也是通过利用分析形式,通过在大规模的数据中进行分析计算,从而发现数据间关系,并通过这种关系做出相应的决策或预测的进程。教育知识发现中的步骤有着相互影响,并不断变化的特征。教育知识发现的发展形态是一种螺旋上升形态。而教育知识发现的进程中,主要有以下几个步骤:

第一,教育背景理解。教育的背景理解是指在开展知识发现这一流程之前,理解的实施者对这一领域与目标进行的自身深化理解过程。预选知识和学习的目标对象是实施者需要了解的主要内容部分。这一步骤能够为接下来的知识发现过程进行有效的指导。

第二,选择目标数据集。该步骤是要选出与运算中相关的数据,并通过聚焦的模式在教育数据库寻找相关的数据集进行查询调取。

第三,数据预处理。数据预处理的目的是使获取数据的质量得到有效保证,并提高数据挖掘的效率与准确性,因此数据预处理要对数据进行清洗、集成、抽取、转换与装载等处理。

第四,确定合适的功能与算法。要通过确定系统任务的目标,并根据数据所反映出的特征,选择出相匹配的计算方式以保证数据处理的准确性、合理性。一般的算法包括决策树法等多种方式。

第五,知识发现过程。这一步骤是对已经经过加工的信息进行提取,根据特殊要求进行匹配选择,并且将相匹配的数据进行集合的过程。

第六,模式评估。OLAM和OLAP的过程中模式纷繁复杂,但并不是每个模式都能够适应实际使用的需要,因而就要对模式的基础进行相应的评估,选择适用的模式,将不需要的模式去除。

第七,知识表达。将通过分析得到的结果以易于理解的方式展现给用户,例如图表报表等形式。

在教育知识的发现过程中,用户在评价相关的教育信息时,要严格遵守相关流程,并保证数据的准确性。不遵守相关流程的评价结果会导致决策不准确,甚至导致评价过程失败,需要重新进行评价流程。

2.3 OLAP和OLAM

OLAP的技术核心是“维”的概念,也就是人们观察数据的角度。这一技术可以有效的帮助教育决策者在分析观察数据时,能够从多个角度进行出发,以期更加全面的从多角度来理解数据信息,为决策提供有效的支持。这一系统还能够有效的对各个主题实时计算与分析,从而更好的为决策服务。

第一,数据统计。在这一部分的操作过程中,系统能够实现在在各种统计字段上进行各项基本的统计操作,并得出相关结果,通过这一功能,可以对需要研究的问题做出基本问题分析。

第二,建立智能函数。通过建立相应的函数体系,能够对在时间上较为敏感的数据进行相关的分析,以便通过变化规律进行相关决策的制定。

第三,概念类描述、特征化与区分。实施这一步骤,能够有效的对实现对数据分类汇总分析结果的精确化描述,最终使管理部门进行查阅时,能够通过简介与描述更加清晰的找到数据之间的对比关系,进而为决策提供有效的支持。

第四,关联分析。这一步骤的目标是通过找到关联规则,将属性以及属性值在数据中出现的条件揭示出来,并通过系统的分析功能,发现并且体现出教学活动与现象之间的内在关联,并通过这一联系,对发生的现象进行下一步推测,并根据推测结果进行相关策略的制定。

第五,分类与预测。这一步骤是通过预定的数据挖掘算法对数据进行自动分析,这一分析活动受到的人工影响非常小,主要是为了获得建立在数据挖掘基础上的预测服务,从而为接下来的教育活动方向进行相关的预测。

第六,孤立点分析。这一步骤是对在数据集中发现的与其它数据特征不同的数据进行分析。通过进行分析,能够有效的发现异常情况与事件,从而对即将发生的情况及时采取应对策略。

第七,演变分析。这一分析模式适用于根据时间、序列或周期等因素进行的数据分析过程,并在其中发现相关规律,来对接下来管理方向的发展进行有效预测。进行这些因素的深入分析,可以有效找出数据变化的规律,从中得到能够对决策产生重要影响的因素与信息,来发现相关问题的产生原因,并对症下药,制定相关的解决方案。

2.4 系统的前端工具应用原则

这一功能通过多种服务方式,帮助用户展现、提取相应信息,并且帮助用户进行不同程度的分析,为用户的使用提供了便利。

3 总结

随着时代的发展,教育管理的内容不断增加,对于信息化的要求也在不断提高。本文为提高教育管理信息化提供了一个可以供各级教育决策部门迅速提取信息,及时掌握各级学校运行情况,并据此制定相应决策,从而提高教育信息化管理能力的数据库系统模型,并希望其为教育管理部门不断提高决策水平,最终实现教育管理现代化,提高教育发展水平提供有力的技术支持。

[1]冯霞,陈朝东.数据仓库在教育管理中的应用探讨[J].教育信息化,2003(7)

[2]李艳艳.数据仓库与高校教育管理信息化[J].中国教育信息化·高职高教,2008(8)

[3]林琳.基于数据挖掘的教育管理决策支持系统模型[J].计算机光盘软件与应用,2011(3)

猜你喜欢
数据仓库数据挖掘决策
为可持续决策提供依据
探讨人工智能与数据挖掘发展趋势
基于数据仓库的数据倾斜解决方案研究
决策为什么失误了
基于数据仓库的住房城乡建设信息系统整合研究
基于并行计算的大数据挖掘在电网中的应用
探析电力系统调度中数据仓库技术的应用
一种基于Hadoop的大数据挖掘云服务及应用
基于数据仓库的数据分析探索与实践
高级数据挖掘与应用国际学术会议