借助SAP HANA的强大能力,SAP BW/4HANA如虎添翼,在数据存储、建模、管理等各个方面都有所提升。在深入学习它的各项功能前,有必要向读者介绍BW和DW的区别,以及SAP HANA和SAP BW/4HANA的区别。
数据仓库之父比尔·恩门(Bill Inmon)在1991年提出了数据仓库(Data Warehouse,DW)的概念后,Oracle、IBM、Microsoft、SAS、Teradata等公司均推出了数据仓库产品,这些产品不仅拥有高并发、高性能的特点,还具有强大的数据存储能力和与OLAP工具无缝交互的能力。它们均是以技术架构为支撑的类数据库软件,是做好数据应用的“利器”。
SAP BW(SAP Business Warehouse)是SAP公司推出的企业级数据仓库(Enterprise Data Warehouse,EDW)管理软件,它本质上是“业务+数据仓库”的集成平台。SAP BW在数据仓库的技术层面,拥有大数据存储的管理能力、ETL能力、OLAP能力。不仅如此,SAP BW还拥有SAP各个业务模块的标准模板—BI Content。它是一组基于SAP BW中一致的元数据预先配置的角色和任务相关的信息模型,BI Content 为企业提供了各个行业所需的数据仓库模型和业务分析工具。这些信息模型包括角色、工作簿、查询、数据源、数据存储对象、关键值、特征、更新规则和SAP应用程序的提取器等。借助BI Content,企业可以实现不同行业的数据模型模板“开箱即用”,快速部署数据仓库模型,提升开发效率。
SAP HANA(SAP High-performance Analytic Appliance)是由SAP公司推出的一款基于内存计算的列式数据库的系统平台。SAP HANA除内置数据库以外,还具有ETL功能与高级分析(如预测分析、空间数据处理、文本分析、文本搜索、流分析、图形数据处理)功能,并内置了应用程序服务器。
SAP HANA作为数据库平台,支持结构化数据和非结构化数据的存储,并且由于其数据存储在内存数据库中,所以访问速度极快,根据已有的成功案例,数据处理速度比客户原数据库系统快成百上千甚至上万倍。SAP HANA使用了列式存储,可以提高内存的利用率和数据的检索效率,并且SAP HANA支持大规模并行扩展部署,这些特性使SAP HANA能够支持对大数据量的快速存储、计算和检索。
在SAP HANA横空出世的时候,业内诸多人士认为,SAP HANA就是数据仓库的未来,SAP BW将会被SAP HANA取代。然而,事实并非如此,因为SAP HANA是数据库软件,提供了数据存储、读取的能力;SAP BW是应用平台,提供了数据管理、应用的能力。两者各有分工,相辅相成。SAP BW内置了元数据、主数据的统一管理模块,其模型能够自动生成数据流和血缘关系,能够很好地实现企业对数据质量的管理和监控。
虽然 SAP BW 中许多特定的功能已被移至 SAP HANA 平台,如一些用户界面已在Eclipse(HANA Studio)环境中可用,并且这种趋势仍在继续,但是SAP BW的功能已通过利用SAP HANA平台附带的许多功能得到增强,使之成为一个全面、开放和面向服务的数据仓库平台,而且依靠SAP BW进行语义建模、管理和监控,同时利用SAP HANA特定功能的混合解决方案正在兴起。这都归功于SAP BW和SAP HANA平台的强大能力,以及它们与Hadoop和基于云的解决方案的紧密集成,如最新的云分析平台SAP Analytics Cloud。
SAP BW+SAP HANA的强力组合,在数据管理上能够帮助企业全面掌握数据资产现状、提升数据质量,在数据应用上能够保障数据安全合规。同时,能够实现数据互联互通,提高数据获取效率,让企业的数据价值持续释放。
2016年8月,SAP公司正式向全球推出了新一代数据仓库产品 SAP BW/4HANA,该产品基于全新的架构和设计,具有如下几大特点。
(1)简化开发系统,可以通过提高敏捷性和灵活性来快速响应需求。对模型开发来说,SAP BW/4HANA的数据对象更加简单,并且支持结构化数据和非结构化数据,同时能够通过信息对象和字段建模;对数据流来说,支持快速、灵活地从任意层级进行分析,能够跨层虚拟合并数据。在数据管理方面,能够做到对热数据、温数据和冷数据进行统一管理,划分不同数据分区,并且自动在热数据、温数据和冷数据存储间分配数据。
(2)拥有全面的开放性,可以提供更广泛的商业洞察力。SAP BW和SAP HANA的紧密结合实现了端到端混合场景的集成管理,并且提供了两种满足不同需求场景的建模方式,实施起来高度灵活。
(3)为所有用户提供全新的界面,便于快速学习和使用。建模开发更加直观和便利,现代化的监控平台提供了高效的管理手段。通过Analysis Office和SAP Analytics Cloud提供更加丰富的分析工具。
(4)基于内存的高性能数据仓库平台。SAP BW/4HANA是基于SAP HANA的数据应用,不需要聚合过程,数据库层面使用更少的索引,具有更高的数据加载和处理速度,能满足大数据时代对性能和效率的要求。
尽管SAP BW/4HANA拥有诸多新特性,可以应对大数据时代的各种需求,但用户对它依然存在以下一些误解。
(1)SAP BW/4HANA只能抽取SAP系统数据。
SAP BW/4HANA是SAP的数据仓库解决方案,它是一个开放的平台,能够支持市面上主流的各种数据源。并且,SAP BW/4HANA将源系统简化为三种,其中所有的SAP ERP (如SAP S/4HANA)相关的应用采用ODP连接,所有的数据库和文件系统采用HANA Local连接,文本文件依然采用文件系统连接。另外,为了解决数据的时效性问题,SAP BW/4HANA 充分利用了 SAP HANA 数据集成的相关功能,通过提供 SDI(Smart Data Integration)和SLT(SAP Landscape Transformation)的方式实现数据的实时同步/复制。SAP BW/4HANA不仅对SAP系统的数据抽取进行了大幅优化,对非SAP系统数据也有良好的集成性。
(2)SAP BW/4HANA是数据中台。
数据中台是最近出现的一个新兴概念,其核心目标是搭建一个连接前台和后台的平台,提供EB级的数据存储、共享和服务。SAP BW/4HANA基于SAP HANA搭建,支持结构化数据和非结构化数据的存储,能够满足高性能、大数据量的需求。不仅如此,SAP BW/4HANA还基于信息对象、元数据管理及数据流管理,帮助企业全面掌握数据资产现状、保障数据质量,并且在数据应用上能够保障数据是安全合规的。
此外,SAP BW/4HANA是一个开放的平台,支持本地部署和云部署,而且可以基于简单的数据连接架构连接任意数据源和数据类型。数据中台并不是一个具体的标准化产品或系统平台,而是一系列数据组件或模块的集合,而SAP BW/4HANA正是SAP在大数据时代提出的数据中台解决方案的核心组件。
(3)SAP BW/4HANA开发难度大。
SAP BW/4HANA提供了更加简便的开发和管理模式,它将原有的11种数据对象简化到4种,用CompositeProvider和Open ODS View代替传统的虚拟提供者,其中Open ODS View主要基于SAP HANA视图提供数据,CompositeProvider通过组合其他虚拟对象对外提供数据。InfoCube、DSO等对象则全部由Advanced DataStore Object(ADSO)替代。信息对象依然是SAP BW/4HANA最基础的元件。另外,无论是工具层面的BWMT或SAP BW/4HANA Cockpit,还是SAP提供的详尽的帮助文档,都大大降低了SAP BW/4HANA的学习、使用和管理成本。