数字化校园应用集成模式的探讨

2012-10-09 09:41鲍剑洋项馨立
中国教育信息化 2012年21期
关键词:商业智能数据源数据中心

鲍剑洋,项馨立

(南京中医药大学 网络中心,江苏 南京210046)

一、数字化校园应用系统集成模式与商业智能

在数字校园的建设中,随着技术的发展,应用系统集成要求能够无缝集成来自多个异构数据源的结构化、半结构化和非结构化数据,而且必须很好地支持标准元数据交换、模式映射并且支持标准数据传输格式。这就对信息集成解决方案提出了更高的要求,实现应用系统集成主要有以下的两种模式:

(1)数据仓储模式:这种模式首先从一个或多个数据源中抽取数据,并对数据进行必要的处理,最终将数据存储到目标数据仓库中,建立一个全校共享的数据中心。各个部门所需要的数据都在数据中心中提取。最终操作将针对目标数据仓库中数据进行。

(2)数据联邦模式:在各个应用系统中只提取统计分析时所需要的数据,它将分布式异构数据集成到一个虚拟表中,而不用建立共享数据中心。用户或应用程序可以通过该虚拟表对数据进行实时操作。

目前大多数高校都采用的是第一种解决方案,第一种解决方案有它自身的优点,但是在共享数据中心的投入与维护运行费用巨大,共享数据中心基本需要小型机或大型服务器支持,巨大,为了安全起见,还要建立小型机集群以保证系统的安全性。

因此我们在应用系统集成采用第二种解决方案,使用IBM公司的解决方案,在各个应用系统中只提取统计分析时所需要的数据,而不用建立共享数据中心。使用IBM的Cognos软件成功地将学校有关的几个应用系统进行整合,不但可以进行相关的查询统计工作,还可以进行更深层次的分析工作,较好的达到了我们的目标。

商业智能(BI)是由数据仓库、联机分析处理OLAP和数据挖掘等技术的综合运用。商业智能的关键是从许多来自不同的应用系统的数据中提取出有用的数据并进行清理,以保证数据的正确性,然后经过抽取(Extraction)、转换(Transformation)和装载(Load),合并到一个企业级的数据仓库里,从而得到学校数据的一个全局视图,在此基础上利用合适的查询和分析工具、数据挖掘工具、OLAP工具等对其进行分析和处理 (这时信息变为辅助决策的知识),最后将知识呈现给管理者,为管理者的决策过程提供支持。

二、数字化校园应用集成架构及特点

南京中医药大学数字化校园的数据集成平台的结构如图1。

图1 南京中医药大学数字化校园的数据集成平台系统结构图

Cognos结构在逻辑上可以分为浏览器层、Web Server层、应用服务层和数据源与内容库层(如图2)。Cognos提供了强大的OLAP多维分析、查询、报表、地图、仪表板、门户等多种前沿展现手段,对数据进行多维分析并定制生成报表。

图2 Cognos的体系结构图

Cognos具有强大的OLAP数据引擎,能产生多维数据分析的立方体Cubes。多维数据立方体是由各维度数据组成的数据集市,保证只占用很少的存储空间就能处理大量数据,能够使用户以更多的角度分析更多的指标。

Cognos数据源可以是 Oracle、SQL Server、DB2、Sybase等大型关系型数据库,也可以是Access、dBase等桌面型数据库;可以是未经处理的业务数据库,也可以是经处理后的数据集市。

Cognos统一了Web应用架构与元数据,通过抽取各数据源中所需数据存入数据立方体的方法访问企业的所需信息,为用户提供了基于纯浏览器的全面的BI功能。

南京中医药大学数字化校园的数据集成平台主要功能与应用集成的过程如下:

(1)采用了联邦数据库模式,以IBM Cognos为基础的应用集成平台。

(2)采用数据联邦技术的建设模式,原始数据分布在各自应用系统中,用户直接在全局模式的基础上提交调用各个数据源中数据的请求,由Cognos转换成各个数据源在本地数据视图基础上能够执行的请求。

(3)以国家《教育管理信息化标准》规范为基础,建立南京中医药大学数字化校园的信息化建设规范。

(4)IBM Cognos为用户提供透明的数据访问方法,对所要集成的不同应用系统中的数据信息进行抽取,将原来异构的数据模式作适当的转换,建立数据Cube。

(5)在抽取的过程中,根据南京中医药大学数字化校园的信息化建设规范,对不同系统的数据进行数据清洗,使得数据统一规范。

(6)完成了数据抽取与汇总之后,根据学校对具体应用的需求,建立相应的数据模型与脚本,运用Cognos报表制作功能就能实现数据集成的过程。对数据Cube进行数据挖掘,得出所需的信息,并通过前端展现设计进行展示。

图3 数据集成平台主要功能结构图

三、使用Cognos进行应用集成的实例

在高校学生教育管理工作中,学生的评优工作是一项重要而复杂的工作。奖励种类多,涉及的金额高,参与的学生众多。每种奖励都有相应的评定条件,学生要获得某种奖励就必须要满足该项目的最低条件。

评综合奖只需要成绩数据因此只涉及教务管理一个数据源,但评院优干不仅需要成绩数据还需要学工数据,因此涉及教务管理和学工管理这两个异构数据源。教务管理数据库为Oracle数据库,而学工数据库为SQL数据库,这两种数据库在数据格式、标准和访问接口方面都有着重大区别。如何将这两个数据库中的数据集成直接影响到评优过程的开展。

评优过程的实现步骤如下:

首先,在数据源中选择教务数据库中的表和表中需要的字段,并建立表之间的连接。然后用同样的方法再选操作学生工作数据库,并建立两个数据库之间表的连接(如图4)。

图4 两个异构数据源的连接

接着在将需要的数据过滤出来并打包发布,新建一张空白报表,运用列表工具,将运行后要显示的字段拖入。

接下来过滤出精确数据,要在数据项中写表达式,将2007-2008学年的成绩和学生工作数据过滤出来。如“院优干”这一数据项的表达式的意思应为在2007-2008学年担任过班级以上干部并且单科成绩不低于60分(如图5)。

图5 数据过滤

按上述操作后运行,得出评优结果(如图6),该结果与2007-2008年度院优干入围学生名单相符。由上可以看出:采用Cognos系统实现评优过程是真实可行的,而且有效的。

图6 评选优秀干部的结果

四、结论

经过对南京中医药大学应用系统集成的应用,证明了采用数据联邦模式和商业智能平台能够在建立数字化校园系统的时候,对应用系统能够进行较好的集成,并且很好的实现了系统的可扩展性和兼容性,大大降低了系统集成的复杂性和集成成本。相对于目前许多高校采用的大型数据仓库技术进行应用集成,具有投入少、实现快的优点,并可利用平台所具备数据挖掘与分析技术,快速建立决策分析平台,是进行校园应用集成与应用系统建设的一条新的快速途径,是一些高校进行数字化校园建设可采用的有效技术。

[1]万里鹏,陈雅,郑建明.中国高校数字化校园建设与思考[J].情报科学,2004(3):122.

[2]李海峰,韦东杰,李涛.两种常用信息集成模式比较[EB/OL].http://www.ibm.com/developerworks/cn/data/library/techarticles/dm-0903lihf/index.html.

[3]汉端科技有限公司.IBM Cognos商业智能软件整体简介[J].2008,12(1):1-17.

猜你喜欢
商业智能数据源数据中心
酒泉云计算大数据中心
浅析数据中心空调节能发展趋势
关于建立“格萨尔文献数据中心”的初步构想
Web 大数据系统数据源选择*
什么是商业智能?它的定义和解决方案
基于不同网络数据源的期刊评价研究
关于实时商业智能的文献综述
广东省高速公路联网综合信息商业智能系统
基于云计算的交通运输数据中心实现与应用
基于真值发现的冲突数据源质量评价算法