微信搜索公众号:SAP中文学习网交流平台      SAP技术千人群: SAP中文学习网技术群      SAP技术交流2群:SAP技术交流2群      SAP新人群:SAP中文学习网新人群     

SAP中文学习网

当前位置: 主页 > SAP学习心得 >

SAP BW/BO学习总结

来源: 互联网TAG标签: sap bw 作者:SAP中文学习网 点击:
       PS:本文由51SAP教育中心老学员所写,首发于51SAP论坛。感谢原作者的无私分享。

      经过几个月的培训,我从对BI的一无所知逐渐地对SAP BI有了一些自己的理解,SAP BI作为整个BI行业中的佼佼者,它有着自己独特的资源和优势,再加上最近几年兴起的HANA,将会使得SAP BI如虎添翼。现在对培训课程中的BW/BO相关知识做一个大概的理解和总结:

    SAP BI主要分为三个部分,第一层也是最底层数据提取部分;中间层是数据仓库建模部分;最上层是数据展现及发布层次。

     第一层:数据提取部分,是针对OLTP系统中的业务数据进行提取的一个过程。SAP BI通过对源系统(SAP系统和非SAP系统)的数据进行抽取,这里设计了一个BW与源系统的接口---数据源,数据源只是一个由多个字段组成的数据结构,通过维护数据源的结构(提取结构),然后利用提取器(ABAP代码)提取我们想要的数据内容。


    对于数据的提取,我们主要学习了对文本数据源中数据的提取以及SAP ERP系统中主要业务模块中数据的抽取,因业务模块所针对的业务流程不一样,各司其职,而且各自的数据均有其自己的特点,因为对于不同模块中的数据,SAP公司设置了不同的抽取模式。

    对于数据抽取,基本分为全量抽取和增量抽取。

    1、全量抽取,很简单的理解就是对你系统中的截至当前的所有数据进行抽取。

   根据数据的特点,有些业务数据会直接从数据库底表中进行全量抽取,例如FI,CO-PA等;
    有些业务数据,ECC端会专门设计一个setup table从数据库底中复制所有的数据供全量抽取使用,例如LO;

    2、增量抽取,是用来抽取自上次抽取之后OLTP系统中新产生的数据(包括新增、删除、更改),OLTP系统中对新产生的数据的记录方式不一样,这样也就导致了在BW端抽取增量数据时的抽取方式也不一样;
    对于增量抽取,ECC端设置了一个叫作Delta Process的办法来综合处理ECC端所有业务数据的增量数据抽取问题,以保证数据的完整和一致。
    Delta process可以通过表RODELTAM来查看,通过它可以了解增量数据是以什么样内容形式,通过什么途径、以什么样的状态进知增量队列到达BW端的。
  • 以什么样的内容形式---update mode, 总共设计了六种形式,通过不同的组合来表现数据的增、删、改。这六种形式是前像X,后像空,删除D,新像N,反转R,附加A。
  • 通过什么途径和方式--- Delta (process) Type,也就是说增量数据是如何到达BW端的,主要用到的有两种,一种push( 用D来表示),一种Pull(用E来表示); Push是指增量数据产生直接进入到Delta Queue,然后由BW端触发infopackage获取增量数据。Pull是指由Bw端触发Job control来从ECC端的DB table中或是Update Table或Extract Queue中获取增量数据。
  • 以什么样的状态---序列化,主要就是三种,无序、数据包有序、请求有序。
    通过对Delta Process的了解,可以在BW端设计相应的模型来保证数据的完整和质量,在BW端通过DSO来保存和体现增量数据。
    不同的数据源,有不同的Delta process,主要有ABR, AIE,ADD,AIM等方式,可能通过RSA2查看数据源的相关信息来了解对应的Delta Process。

    对于 FI 数据,它的Delta process为AIE的方式;对于LO数据,它是ABR的方式;Co-PA数据,它是ADD的方式。
 
中间层是数据仓库和建模,在这一层次,主要是通过ETL来实现对各个源系统中的数据进行集成,整合,保持数据的完整、一致性,有必要并对数据进行数据挖掘分析,从而达到统一分析的目的。
    对数据的建模,主要考虑到以下几点:
  • 建立的模型必须满足业务的需求,通过了解企业业务流程,绩效考查点等对需求进行分析合理设计模型的大小、主题划分、特征、关键值的获得等。
  • 对于模型性能的分析,主要是查询性能和数据上传的性能两个方面。合理利用设计维度表的大小,利用索引,模型中相关的工具(例如写优化的DSO,Cube的压缩,分区,聚集,行项目维度和基数高度设置,IO中的导航属性、特征)等来提高查询性能或数据上传性能。
  • 合理设计模型,有利于项目实施后的运行和维护。
    设计模型主要遵遁三个仓库,两辆车的特点进行设计,对于模型的架构遵遁建立EDW三层架构模型,使得数据能进行有效的拓展,保存数据的明细程度,一致性,EDW三层主要是:


    底层:抽取层,一般为写优化的DSO, 主要是保存源系统中数据的原貌。
    中间层:合并层,一般为标准DSO,主要是消除各个源系统中数据的不一致性,集成多个源系统中的数据,保存数据的明细程度。
    最上层:展现层,一般为Cube和 Multi Provider,主要是根据主题划分,通过抽取合并层中的部分数据并对其进行合并,获得汇总级别的数据。同时通过Multi Provider可以连接多个Cube,对有关联的主题进行联合分析获得决策所需信息。
 
 最上层是数据展现和发布层,主要是根据业务需求对数据模型中的数据进行分析和查看。在课程中学习了 BEx 以及专门用来对数据进行展现的 BOE平台及相关的软件。
    根据需要展现的报表需求,选择合适的软件来实现达到最好的效果。
  • WEBI有着良好的设计界面,多维分析和查询钻取功能,格式不够灵活。通过Universe与多种数据源进行联接。
  • Crystal Report有着强大的功能实现,格式较灵活,企业级的报表。可以直接联接多种数据源。
  • Crystal Xcelsius 注重 动态分析和what-if分析,界面较为直观,设计较为简易,针对管理层级以上的用户,要求的数据量不能过大。需要通过QAAWS来联接数据源或直接连接Excel。
 

    以上是培训课程结束后对整个课程的大致宏观理解,具体的细节过程还需要在以后的学习过程中更加深入的了解和应用!
(编辑:cindy liu )
顶一下
(15)
100%
踩一下
(0)
0%
------分隔线----------------------------
您有可能感兴趣的文章