OLAP联机处理技术在空管自动化系统中的应用

2016-10-19 06:12刘辉
文化产业 2016年7期
关键词:数据仓库空管维度

刘辉

摘 要:作为一款实时、快捷的信息存取及交互软件, OLAP对网络数据库的传输至关重要。基于此,结合OLAP的相关概念,分析了OLAP的主要特征,探究了OLAP与关系数据库之间的关联性,总结了基于关系数据库的OLAP的应用优势。

关键词:OLAP;联机分析处理

近年来,随着计算机和信息处理技术在民航领域的广泛应用,越来越复杂的软件系统已大量存在于这些领域的科技工作和实际应用中。随着目前民航航班量的与日俱增,这也使得空中交通管制人员与设备维护人员的工作量在不断增加。伴随着近些年自动化系统也陆陆续续出现各种大大小小的故障,有些属于硬件故障,有些属于软件故障,这些故障每次都需要花費技术维护人员大量时间去找出故障点。因此,为提高技术维护人员工作效率,降低维护成本,开发一套故障决策分析系统的意义非常重大,同时这也是民航空管迈向大数据时代的一大步。

一、故障决策分析系统的背景及意义

故障决策分析系统是指通过调用各种空管自动化系统的信息资源,结合相关技术工具实现对特定故障问题进行分析,建立模型,模拟决策过程和方案的计算机应用系统。目前,大部分故障决策分析系统是利用软件工程中得到的知识,建立方法库或模型库实现故障决策支持,而在空管自动化系统运行过程中产生的海量数据既包含了空管自动化系统的运行状态,也可能会产生大大小小的故障问题。如果将这些数据进行充分利用,可以提高维护人员故障分析决策的有效性,使技术维护人员工作效率更高,降低维护成本。故障分析决策支持系统可以通过相关技术对空管自动化系统中的海量历史数据进行采集、处理、分析、挖掘、比对、预测与展示,归纳出目前空管该套正在运行设备的运行趋势,使技术人员可以准确把握空管自动化系统的整体运行状况,有效的找出准确无误的故障点。

OLAP联机分析处理正是为了满足这种需求而设计的,这种软件技术是基于共享多维信息的,可以根据技术分析人员的要求针对特定问题对海量数据进行快速、灵活的联机数据访问和分析,然后通过前端展现技术将查询结果以一种对故障分析决策人员来说相对比较直观、容易理解的形式反馈回来。

二、故障决策分析系统的开发调研

为了实现这样一个完整的故障分析决策系统,为空管技术人员提供统一的、快速的、准确的故障设备数据分析平台,需要用到的技术不仅包括OLAP联机分析处理技术,还包括数据仓库技术、前端展现技术等。

首先,从故障分析决策系统的概念、发展历程及现状入手,阐述了数据驱动型故障分析决策系统在空管自动化系统中的作用,并介绍了ETL、数据仓库、OLAP联机分析处理等相关的技术与理论。

其次,根据空管自动化系统常见问题故障进行了需求分析,并依此对故障分析决策系统的架构进行了详细设计。

最后,对系统的具体实现过程进行了详细的介绍,包括数据ETL过程、数据仓库的构建、OLAP数据分析层及系统中报表的具体实现过程。并进一步针对在实现OLAP联机分析处理过程中如何提高其性能进行了详细研究。故障分析决策系统作为一种先进的现代信息技术,能够很好的为空管技术人员提供数据支持,提高决策的有效性。

三、故障决策分析系统的相关技术及理论

(一)数据仓库技术

数据仓库的应用较为广泛,在行业中扮演重要角色、占据较重要地位的有零售、保险、电信等,这些企业借助数据仓库技术的力量可以从日常积累的大规模历史数据中探寻这些数据之间的关系,并从这些关系中挖掘出一定的信息,掌握企业的整体运行情况,进而做出正确的决策。

1、数据仓库的特点

数据仓库与传统的数据库是有所不同的,传统数据库是未经整理的一大堆数据集,是分散的、片段的、不完整的,无法直接对其进行分析处理, 而数据仓库是对传统数据库进行萃取之后形成的一个系统的数据子集合,这个数据集合的特点包括面向主题、整合性、长期性以及稳定性。

2、雪花模型与星型模型

事实表和维度表是数据仓库中最主要的两种表,在数据仓库中扮演着不同的角色,前者用来存储数据,通过外键与维度表相连,后者用来存储各个维度的信息,包括维度的层次、类别等,一个维度至少使用一张维度表进行存储,二者通过事实表中的外键及维度表中的关键字相联系,如果每一个维度都与事实表相联,则是“星型模型”,但当维度层次结构复杂时,维度数据冗余的现象就会出现,为了避免这种情况,进而在“星型模型”的基础上衍生出了“雪花模型”。

从表1对星型模型和雪花模型的对比来看,星型模型存在的冗余数据可以使得在做统计查询时很多情况下不用做外部连接,在这种情况下星型模型的效率比雪花模型要高一些,但雪花模型冗余数据比星型模型要少,因此虽然两种结构有一定差别,但没有好坏之分,最主要的还是看项目的需求,看业务逻辑。例如,故障数据集市部分采用则星型模型以方便数据提取及对其进行分析,而中间层使用雪花模型以降低数据冗余度。

(二)OLAP技术

OLAP技术全称是Online Analytics Process,即联机分析处理,是一种快速软件技术,是专门为针对复杂的决策分析进行支持而设计的,这种软件技术可以根据技术分析人员的复杂的查询分析处理需求,对数据仓库中存储的海量数据进行快速、准确、灵活的处理,处理完成之后,再通过一种相对比较直观的、决策人员可以比较容易理解的形式将查询结果反馈给决策人员,这样,技术决策者就可以根据历史故障反馈的信息迅速、准确地掌握目前系统的故障情况。在数据仓库建立之后,为了使用户可以从多个层次、多个角度、多个侧面去对数据仓库中的数据进行观察,其中存储的数据还需要对进一步进行分析处理,即多维数据分析,之后用户便可以通过对多维数据集中的数据进行钻取、旋转、切片和切块等操作来观察数据仓库中的数据了。简单来说,OLAP即对数据仓库中存储的数据进行分析和处理,主要是通过数据聚集技术以及多维数据集技术,然后使用可视化工具将结果反馈给技术分析人员,供技术人员快速找出自动化系统故障点。

四、故障决策分析系统的设计

故障决策分析系统是要将分散、独立的数据源中的系统故障信息进行分析处理,然后通过前台展现方式为技术维护人员的决策提供支持。

首先,要从原有的自动化系统中将相关的业务数据传到数据仓库中,因为原有自动化系统的数据可能以不同的形式存在不同的地方,如数据库、文件、文档等,所以需要对原有业务系统的相关业务数据进行抽取、清洗、加工,然后装载,这样才能形成为基础的分析数据而存储的数据仓库。

然后,利用OLAP技术对数据仓库中的数据进行处理,形成系统需要的各种数据,存储到OLAP数据库中,为数据查询做好准备。

最后,存储在OLAP数据库中的数据只能供高级技术人员进行查询,为了使高级技术人员同样可以方便快捷的得到需要的数据,需要建立一个前台界面,以报表的形式向高级技术人员展现数据。

系统总体架构如图1所示

五、故障决策分析系统的技术方案

故障决策分析系统的网络架构采用B/S架构,严格遵循TCP/IP协议,将主机与自动化系统进行连接,并从自动化系统中获取数据源。本套系统采用php技术面向服务器端脚本语言开发,其优点可以跨平台移植,方便不同平台的技术人员使用。同时php技术也是當今手机app应用软件后台采用的流行开发技术,希望未来华北空管可以实现手机实时监控系统的状态。本套系统的数据库采用MySQL,其与服务器端的交互非常迅速,并且稳定可靠。

(一)建立数据抽取映射和数据标准化

为了实现ETL模块的开发,成功的将基础数据源中的数据加载到目标数据仓库中,首先需要建立二者之间的映射关系,并且以一种直观的方式将这种映射关系表现出来。例如,在空管自动化系统中建立故障信息的编号,在ETL过程中通过建立从数据源到目标数据库的映射表的方式来表示二者之间的映射关系,进一步完成数据之间的映射,最后完成数据标准化的转换过程。

可以看出,在分散的、独立的系统中,同类信息的存储方式、存储内容是不尽相同的,所以,在进行数据抽取前需要将不同系统中存储的数据进行标准化和规范化,以此来解决存在在异构的OLTP系统中的数据的一些问题,如相互矛盾的问题、不一致性问题等。

(二)ETL程序的实现

数据ETL过程,主要是将数据从基础数据源中提取、转化、加载到目标数据仓库中去,各种ETL开发工具、SQL语句、ETL开发工具与SQL语句结合是其主要的三种开发方式。在故障决策分析系统中的ETL开发是通过php技术组建进行ETL开发工作的,通过php技术来开发ETL程序一般需要建立控制流和数据流。

(三)多维数据集的建立

在多维数据仓库中,数据以数据立方体(Data Cube)的形式进行存储,而在用户对数据立方体中的数据进行分析之前,必须要对数据进行预计算,生成立方体的数据存储结构,亦即所谓的CUBE计算,计算顺利完成之后用户才可以从这个数据立方体中查找自己需要的数据。

(四)故障决策分析系统的前端

故障分析决策系统的前端,旨在让用户可以清晰地了解系统各指标的展现方式,以及方便地对各指标进行横向和纵向的深入分析。本系统以报表的方式,通过折线图、柱形图、饼图等形式提供故障分析与趋势分析来保障空管自动化系统的安全,并且提供给技术人员操作维护方法建议,完全实现计算机的智能化。

六、结论

本文详细探索了本文展开研究的背景和研究内容,故障分析决策支持系统的发展和畅想,及数据驱动型故障分析决策系统在空管自动化系统中的作用。并对系统开发过程中用到的技术,如数据仓库、OLAP数据分析处理等进行了介绍。

在系统设计部分中,首先对实际需求进行了分析,并依此对故障分析决策系统的架构进行了设计,介绍了系统设计中的ETL过程、数据仓库的建模。

在技术开发方案部分中,详细介绍了数据ETL过程、多维数据集的建立过程、系统报表开发过程,希望未来可以就如何优化多维数据集,提高多维数据集的查询效率进行深入研究。

进入大数据时代,希望民航空管可以采用创新技术实现高效率的工作,为民航空管安全提供有力的维护保障条件。

参考文献:

[1]王珊.数据仓库技术与联机分析处理[J].科技出版社,1998.

[2]王彦龙.企业级数据仓库(EDW)原理,设计与实践[M].电子工业出版社,2006.

[3]何玉洁,张俊超.数据仓库与OLAP实践教程[M].清华大学出版社,2008.

猜你喜欢
数据仓库空管维度
基于知识维度和认知过程维度的古典名著整本书阅读教学课型探讨
智慧空管技术的进展
基于数据仓库的数据倾斜解决方案研究
多媒体情境下培养学生阅读素养的三个维度
幼儿教师专业成长的三个维度
空管流量控制过程中的风险控制探析
数据仓库系统设计与实现
民航空管安全文化建设探析
一题三解,多角度解读运动学大题的解法
数据复用在存储数据仓库中的运用