科技管理信息多维数据模型的建立与OLAP设计

2018-02-25 02:39高晓峰
电子技术与软件工程 2018年7期
关键词:概念模型

高晓峰

摘要 随着科技时代的到来,信息数据的储存方式和分析模式早已改革,科技信息多维数据模型的建立与OLAP设计对相关人员的帮助不可小觑。基于此,本文对科技管理信息系统概念模型、科技信息多维数据库逻辑模型建立的相关理论进行研究,然后对科技管理信息系统的OLAP设计中的常规维、维层次及类、粒度、分区、聚集等设计进行了简单的阐述。

【关键词】科技管理信息系统 概念模型 逻辑模型 OLAP设计

随着科学与技术的迅猛发展,科技信息数据更加膨胀,信息数据的管理需要紧跟时代的发展。建立好科技信息管理系统,可以迅速将信息数据的结果转化为现实生产力和相关决策,对于人才培养与管理也更有效率。使用OLAP技术对数据库进行分析,减少了所需时间,节省了一定人力、物力,还能将数据直观地呈现给管理人员。

1 科技管理信息系统多维数据模型的建立

1.1 科技管理信息系统概念模型的建立

概念模型是服务于系统设计、收集信息的联系主观与客观的概念性工具,主要作用是将具体信息转化为抽象数据,是信息世界里的信息结构。建立系统概念模型需要确定系统的边界、界定系统主题域、建立概念模型几个步骤。例如:在企业内的人才培养与录用过程中,需要对各个人才的个人情况、评价、获奖情况、科研成果等信息进行考量、综合分析,这就需要将不同数据按不同主题重新组合起来,按照多立方结构的形式存入到子立方中。在主题域被确定后还要对每个主题域内的数据进行细化,根据细化结果建立多位概念模型。

1.2 科技信息多维数据库逻辑模型的建立

逻辑模型指导着系统的实施,直接反映着部门的需求,是系统运行的重要一步。当前阶段最常用的模型包括星型模型、雪花模型和第三范式。第三范式是具有规范性、基础性的逻辑模型,考虑到数据库引擎和系统的响应速度,实际应用时要做不规范处理,所以常常采用星型模型和雪花型模型。星型模型是指类似星星一样的结构,中心是一个事实表,周围是一组附属表。雪花型模型是非规范性,一个中心事实表周围连接一个或多个维表,也有其他维表不直接连在中心事实表上,而是通过连接别的维表连接到中心事实表上。它的特点是通过减少了数据存储量,改善查询性能。

2 科技管理信息系统的OLAP设-

2.1 科技管理信息系统OLAP常规维的设计

常规维分为共享维和私有维两种,两个或两个以上的立方一起拥有的维是共享维,仅有一个立方使用的维是私有维。共享维的优点是节省处理时间,查询反映速度快,内存利用率高。例如:在选拔人才时,共享维在层次上设计出时间维,包含年、月、日三个层次,学历维包含学历、学位两个层次,学位维又可以分成无学位、学士、硕士及博士各个层次等等。

2.2 科技管理信息系统OLAP维层次及类的设计

层次是含有父子关系的,维的层次变多,粒度层次会越丰富,其中的子成員数量也会越多。类是按维成员的某一共同特质分类,成员之间存在某一相同属性。在科技信息系统的分析数据过程中,既有按维的层次递进分析,也有按类属性进行分析。按维的层次分析又有两种分析方法,一种是聚合分析,即从维的低到高层次综合分析;另一种是钻取分析,即从维的高到低层次数据分析。按维的类分析也可分为分类和归纳,从粗粒度向细粒度成员向下进行的是分类,从细粒度向粗粒度进行的总结是归纳。考虑到储存空间的因素,系统维的层次应该简洁分明。

2.3 科技管理信息系统的粒度设计

粒度作为度量数据库中数据综合程度的重要考量因素,如果粒度越细,存放数据需要的空间就会越大,查询需要的响应时间就越长。科技管理信息系统数据库的大部分查询时间里在一定综合数据上,很涉及到细节,所以为了快速响应和细节查询,系统需要整合数据,并按规律结构储存到数据立方中去,同时叶子级的数据仍存放在数据库中,这就形成了多重粒度的数据架构。

2.4 科技管理信息系统的分区设计

为加速多维数据库的查询速度,进行分区设计,分区后,用户查询只需访问相关数据所在的分区,也可同时容纳多个用户各自加载,不相冲突,同时可以添加并删除新的分区,使系统的并行性得到提升。虽然多维数据集中分区数量没有限制,但如果分区过多,对多个分区集合的花费就会增加。科技管理信息系统以一万行事实数据为单位进行一个分区,那分区一旦超过一万行,粒度就会被细化。例如:由于查询经常会集中在最近的数据,所以以时间为第一分区矢量,运用多维数据定期填充程序加载数据,进而其他分区的数据随时间的变化自动维护加载。将系统的分区设定为一万行事实数据,当其中一个分区的数据量超过一万时,将细化粒度,由年转化为月等等。

2.5 技管理信息系统聚集设计

科技信息管理系统在设计时,聚集程度也是重要考虑因素,聚集度加高,查询时间也减少。但是储存空间再聚集时是以指数形式增加,聚集加高时,会产生数据拥挤现象。为了为避免这一问题的发生,在系统设计时,初始聚集设计要控制在小范围内,也要使用优化功能控制聚集数量。例如:在储存向导中,选择多维数据库联机分析处理储存方式,并优先考虑储存,然后为立方体选择聚集。

3 结论

综上所述,科技管理信息多维数据模型的建立与OLAP设计会大大帮助管理人员从不同方面进行数据查询、分析,得到需要的结论。本文简要对科技管理信息多维数据模型的建立与OLAP设计的相关理论进行了研究、阐述,而科技管理信息系统在运行中,随着数据量的增加,储存空间的减少各个方面都将接受着挑战,需要不断进行优化和维护。

参考文献

[1]黄雪菊,科技管理信息多维概念模型的建立与OLAP设计[J].湖州职业技术学院学报,2005 (04):80-83.

[2]周维.基于数据仓库的管理信息系统的研究[D].昆明理工大学,2002.

猜你喜欢
概念模型
污染场地概念模型研究进展
网络服装虚拟体验的概念模型及其量表开发
基于“认知提升”的体系作战指挥概念模型及装备发展需求
浅谈小学数学几何图形概念的教学策略
西藏强降温时空分布特征与天气概念模型
中文编目规则FRBR化发展研究
基于PSR概念模型的稀土资源安全评价
数字矿山信息集成概念模型
论销售数据仓库的需求分析和概念模型设计
工业发展规划潜在环境风险预警概念模型研究