SAP HANA是一个灵活的、多用途的基于内存计算的全新应用,通过深度整合硬件(由顶级的合作伙伴提供经过SAP认证的硬件服务器)使之成为高性能“一体化”设备,将软件和硬件剥离开来之后任何一部分都不可以称为SAP HANA。图2-11是SAP公司的创始人之一哈索教授在对SAP HANA将掀起企业级计算的革命这一主题进行讲解。
图2-11 SAP公司董事会主席——哈索教授
HANA是以业务实时分析和决策、海量数据瞬间计算作为切入点进入市场(从OLAP分析型应用开始,用户比较容易接受)的。但是HANA不仅支持OLAP,也支持OLTP,其最终目的是一体化融合。
目前,已经有很多软件和应用运行在HANA之上。例如,很多客户已经在使用的BW 7.3 on HANA,以及Business One on HANA、BPC on HANA,SAP Business Suite on HANA等。在后续计划中,SAP的全线产品都将运行在HANA之上,关于这一点,SAP官方在其数据库战略技术路线图中已经有非常明确的说明。
(1)新架构的影响
SAP HANA突破了过去内存计算技术的局限性,是基于全新硬件架构的软件创新,例如具备共享内存访问、无限并行化处理、基于让列式数据库高性能支持OLTP、拥有最快的写入速度等各种新特性。SAP HANA不仅是一个内存数据库,从严格意义上来说,它是一个拥有内存数据库的高性能应用平台,不但可以内置计算、计划、分析和预测各种引擎,而且可以简化企业信息系统架构,总之基于这个新平台可以进行各种创新的应用开发。
为了充分利用SAP HANA内置的计算引擎,在开发新应用程序时,最好是将数据库耗时最多的计算逻辑放在数据库端执行,而不是简单地依照过去的开发模式,把SAP HANA当做传统数据库来使用。
(2)更快、更好、更便宜
SAP HANA基于开放式硬件和软件架构,使高性能计算技术不再只是高端服务器所独有,而是面向所有企业都负担得起的通用平台,使用SAP HANA内存计算技术让海量数据瞬间计算成为现实。在推出后不到2年的时间内,全球已经有超过1000个客户选择SAP HANA,并且从中获益良多。
SAP HANA运行在Intel x86 PC服务器硬件架构上,从目前全球的硬件选择趋势上看,传统小型机市场日渐走弱,而基于x86的PC服务器持续走强(从全球高性能计算机TOP 500排行榜来看,AMD、Intel处理器从2001年11月份的4%上升到了2005年11月的77.6%,而RISC等专用处理器则从96%下降到了22.4%)。
它所采用的操作系统则是业界比较优秀的SUSE Linux操作系统平台。之所以选择Linux系统作为HANA的操作系统,是因为UNIX在市场和实际客户的应用中越来越被弱化,而Linux却越来越受欢迎。并且目前从UNIX迁移到Linux上已经是一种趋势(从全球超级计算机TOP 500排行榜来看,Linux从2001年11月份的7.8%上升到了2005年11月的74.2%,到2012年是93.8%;相反,而UNIX则从88.6%下降到了6%)。自2001年以来,全球UNIX服务器市场的出货量和销售额均在不断缩减,每年以5%缩减。
因为HANA是基于开放式软硬件平台的,所以拥有更好的投资回报比。近几年来,基于PC服务器架构的一体机设备的性能得到很大提高,在相同投资下的易用性、维护性、集群能力、计算能力、故障快速恢复等指标上早已超过了小型机。
从2008年始,x86架构的服务器的销售量和销售额早已超过小型机。从硬件方面看,超过76%的超级计算机都使用Intel架构的处理器。另外,SAP HANA的性能指标可以随硬件升级而线性扩展,因此用户在未来能够通过部署配备更多内核的系统来实现更为复杂的数据实时计算与分析的融合,而不会因为系统性能原因而特意将OLTP和OLAP拆分开来。实现OLTP和OLAP在一个平台上的融合是SAP HANA最终的目标(例如,最常用的Operation Reporting完全可以在OLTP中使用,没有必要从OLTP移到OLAP的BI系统中去实现),而这一目标的实现必将对现在和将来的系统架构产生革命性的影响。
(3)SAP HANA相关软件组件
图2-12 SAP HANA应用在敏捷数据集市的示意图
SAP HANA能够让企业根据不断变化的大量详细信息来分析业务运营情况。用户几乎可以实时浏览和分析来自任意数据源的业务交易数据。在发生业务时,这些交易数据将会被实时同步到HANA的内存数据库中,用户可以非常灵活高速地显示这些分析的信息。要进行整个企业的扩展性分析,将外部数据添加到分析模型中即可。图2-12是SAP HANA应用在敏捷数据集市(Data Mart)的示意图。
SAP HANA能简化现有企业系统的计算层,使企业的业务应用可以从硬件的性能提升中直接受益,从而使客户几乎能够实时分析来自任何来源的大量数据,利用实时的内存技术帮助企业提高运营效率。企业可以在业务运作期间基于海量的实时详细信息分析业务运营情况,还可以探索和分析来源于所有数据源的全部交易数据和分析数据。运营数据在产生时由内存获取,并通过灵活的视图迅速将分析信息呈现给用户。企业的系统数据可轻松地添加至分析模型,与所有数据进行整合。
SAP HANA包含的主要组件有如下几种。
❏SAP HANA Database
❏SAP HANA内存数据库,是HANA应用的服务器端组件,目前运行在x86的Intel平台及SUSE Linux 11 SP1操作系统上。
❏SAP HANA Studio
❏简称SAP HANA工作台,是一个对HANA进行管理和建模的工具,使用HANA Studio可以对HANA服务器进行管理、监控。在同一个环境中,只要切换到建模的视图,用户就可以在HANA中进行业务应用的建模、数据预览等。
❏SAP HANA Client
❏SAP HANA支持目前主流的所有的接口,包含JDBC、ODBC、MDX等方式访问。HANA Client组件是一组“驱动程序”的集合,如果在UNIX平台下需要访问HANA内存数据库,就需要UNIX版本的Client软件。如果在Windows平台下安装Client软件之后,就给Windows提供了一组对应到HANA的数据源,这样在Windows平台下的.NET应用系统、BO Data Service或MS-Excel就可以通过ODBC访问HANA中的数据。
❏SAP HANA Information Composer
它是和HANA Studio类似的一个工具,不过它是基于Web方式的。通过这个组件,用户不需要安装HANA Studio和HANA Client就可以进行模型创建、数据预览等工作。
❏Trigger-Based Replication
基于数据库触发器的数据同步复制技术,使用SAP Landscape Transformation(SLT)Replicator,版本支持从46C到最新版本。
❏ETL-Based Replication
基于ETL工具的数据复制技术,需要这些组件的支持:Sybase Adaptive Server Enterprise(ASE) 15和SAP Business Objects Data Services XI 4.0。
❏Log-Based Replication
基于数据库底层日志的数据复制技术,使用Sybase Replication Server来完成这种数据的同步(从HANA SPS05开始,已经不作为HANA解决方案的一部分)。
表2-2中简要列出了SAP HANA对用户发布的组件版本,并且列出了不同版本之间的功能差异。
表2-2 SAP HANA各个版本组件的功能差异
注:■表示包含此组件;□表示不包含此组件。
提示
以上产品组件和对应的版本可能会随着SAP产品策略发生变化,如果需要了解详细信息,可参考SAP HANA官方网站中http://help.sap.com/hana相关页面的内容。