浅析基于SAP BW数据仓库最佳实践

2016-09-10 03:30超株洲中车时代电气股份有限公司信息中心
中国科技信息 2016年16期
关键词:提供者数据仓库数据量

曾 超株洲中车时代电气股份有限公司信息中心

浅析基于SAP BW数据仓库最佳实践

曾 超
株洲中车时代电气股份有限公司信息中心

曾超,男,本科,主要研究方向为企业ERP、数据仓库、大数据领域;熊婧婧,女,本科,主要研究方向为企业ERP、数据仓库、全面预算管理领域;陈意亭,女,本科主要研究方向为企业ERP、数据仓库、制造信息化领域。

SAP BW数据仓库概述

SAP BW (Business Warehouse 商务数据仓库)作为一个端对端的数据仓库解决方案,是SAP商务智能的集成化组件之一, 它为SAP 数据和非 SAP 数据的采集、存储、分析和管理提供一个集成的、面向商务的平台。BW主要包含信息对象、信息立方体 (InfoCube) 、数据存储对象(DSO)这几个特性。一个标准的数据仓库模,包含从最底层的数据源-PSA-DSO-DTP-CUBE-最后到数据展现层(QUERY等)。其灵活的数据转换工具,易于使用的前台报表,整合的Web报表,通过不同的工具将数据转换到非SAP系统中,使得信息分析员和决策者都可以迅速获得来自不同系统的高度集成化信息,进行数据的分析,提供准确的综合性报表以及商务智能功能。企业通过使用SAP BW,进行智能化运作,得到完整有效的信息,使企业价值链中的内、外成员可以更有效地交流信息和开展合作,在重要信息分析的基础上及时解决问题、预测发展趋势、做出战略决策,降低风险,达到企业收益最大化。

数据存储对象(DSO)最佳实践

SID建议

1.对将出具QUERY报表的DSO,“系统标示生成”沿用默认的“激活期间”;

2.对未来可能出具QUERY报表的DSO,“系统标示生成”使用“报告期间”;

3.对未来不可能出具QUERY报表的DSO,“系统标示生成”使用“从不创建SID”。

解释:生成DSO信息对象的SID,主要用于加快QUERY对DSO的访问速度;但生成DSO信息对象的SID,会占用DSO激活的大量资源。所以,根据需要取舍。

DSO其他参数及索引建议

1.对于时常发生激活报错的DSO:调高“等待激活时间”或减少进程数。(TCODE:RSODSO_ SETTINGS)。

2.如果某个“特征”信息对象被放入 DSO的 “数据字段”中,并且此字段将用于QUERY查询的读取条件,需要为此信息对象在DSO中创建索引。

DSO中不建议勾选任何主数据的导航属性用于查询不建议直接使用标准的DSO,建议复制标准的DSO来创建自己的DSO。

信息立方体(InfoCube)最佳实践

需要在CUBE数据加载前删除索引,这样可以提高加载速度,并且在CUBE数据加载后创建索引,这样可以提高查询速度。

CUBE 中不建议勾选“数据量大的”主数据导航属性用于查询。

CUBE中某个维度的记录。占CUBE中记录数的20%以上,需要勾选维度的属性“高基数”。

解释:使用程序:SAP_INFOCUBE_DESIGNS可以查询对应CUBE中的维度的记录数和CUBE的F表记录数的占比。

对于查询组合条件不多的、且带自由特征的CUBE,建议使用聚集。

解释:除非明确知道用户对新创建的CUBE的查询字段的使用频率,否则建议在使用一段时间(建议半年后)。根据用户查询统计,来创建聚集。

超大数据量CUBE使用语义分区。

因为相同数据量存储在多个模型并发查询,永远比存储在一个模型串行要快。另外再加入一些特殊手段(比如在QUERY层,给信息提供者设置出口变量。根据用户查询条件,动态限定查询某一个或几个信息提供者,而不用每次查询多信息提供者的所有信息提供者,实现“智能查询”)。

不建议直接使用标准的CUBE,建议复制标准的CUBE来创建自己的CUBE。

信息对象最佳实践

确定没有文本的信息对象,需要去除文本选项;确定没有属性的信息对象也需要去除属性选项,避免不必要的系统表产生。确定不需要前导0的需要去除转换例程。 预计会存储汉字的特征需要勾选:“小写字母”。 修复问题的信息对象,使用程序RSDMD_CHECKPRG_ALL。请一定用常规渠道(右键 —〉 删除主数据)的方法来删除信息对象的主数据和SID数据。不能使用代码或其他特殊手段删除信息对象表的数据。

提示:删除信息对象数据的一般方法:1.查找信息对象在哪些模型中使用,删除被使用模型的数据 2.删除信息对象已经加载的属性和文本请求 3.右键删除信息对象主数据。

建议使用公用的主数据信息对象。

查询报表(QUERY)最佳实践

建议根据:RSRT-à“履行信息”中的项目进行优化。

尽量在QUERY查询条件中使用include(包含方式)选择,而不要使用exclude(排除方式)选择变量或值。

尽量不要在QUERY中使用 RKF(受限的关键指标),和计算的关键指标。会消耗大量QUERY的字段。只需要在列区域使用公式。

在确认系统已经启用高速缓存后,优化下面三个参数:

更改下面三个参数(TCODE:RZ11)重启服务器:rsdb/obj/buffersize = 800000 (800MB)rsdb/esm/ buffersize_kb =500000 (500MB)rsdb/esm/max_ objects = 20000 (20000个)

尽量少在QUERY中使用例外、条件。而将这部分功能交给最终的展现层,例如BO。

处理链最佳实践

使用TCODE:RSPCM 监视日常处理链。

处理链中经常报错、但又不可重现的节点(自动重复一次就OK的),可以把对应的 DTP包勾选“自动重复处理链中的红色请求”(在DTP的“执行”标签)。

一条处理链节点,非特殊情况不要超一屏,如果要超过,就使用子链拆分。如下图:

结语

作者在参与项目过程中,通过实践表明,本文总结的BW 最佳实践有效地提高了本公司BW系统的整体性能,使系统可用性得到了提高,这对提高用户满意度起着重要的作用。

猜你喜欢
提供者数据仓库数据量
基于大数据量的初至层析成像算法优化
基于数据仓库的数据倾斜解决方案研究
高刷新率不容易显示器需求与接口标准带宽
网络交易平台提供者的法律地位与民事责任分析
宽带信号采集与大数据量传输系统设计与研究
基于隐私度和稳定度的D2D数据共享伙伴选择机制
基于数据仓库的住房城乡建设信息系统整合研究
网络言论自由的行政法规制研究
探析电力系统调度中数据仓库技术的应用
基于数据仓库的数据分析探索与实践