购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

综 述 Overview
云计算服务——运营管理与技术架构

Cloud Computing Services:Operations Management and Technical Architecture

总图1 “云计算服务:运营管理和技术架构”书的总体章节结构

0.1 本书的写作

四年前,当我们决定动笔写这本书的时候,我们从来没有想过这本书的写作会耗费这么长时间。在那时,我们认为,通过收集所有的我们项目的技术架构文档和管理文档并对之进行排序,这本书就应该眉目清晰了。写作的经历证明,这个方法从来没有真正实现过。在实际写作中,我们不得不多次重新构建本书的结构,通过大量阅读和思考,重新组织材料,重新决定各个部分的重点和顺序,甚至某些章节在写成后还要推倒重写。读者今天看到的内容,已经是几易其稿后的内容了。

本书的大多数作者都是在云服务公司中任职的高层管理人员和技术架构师,虽然有很丰富的业界实践经验,个个都是工作中的高手,但由于他们日常工作繁忙,又几乎都是第一次写书,他们被总编要求要在实践的基础上,对所撰写的内容领域做理论上的总结和提炼,也导致了本书写作的时间和难度大大超过了预先的估计。

但是,终于完成了。

伴随这本书的写作,我们自己对云服务领域的管理和技术思考也更加深入和成熟,这的确是除去书稿付梓之外值得各位作者欣慰和骄傲的成绩。

0.1.1 本书的重点:云服务的实现

云计算的真正价值:云服务。

本书的出发点:云服务提供商(Cloud Provider)。

在过去5~6年中,云计算在中国有很大的发展。出版了很多的书,在互联网上也有很多的文章出现。这些著作和文章中讨论了许多云计算的概念、商业模式、技术和未来的期望等。然而,几乎没有文章详细阐述一个公司如何去实现和运营一个云服务,或是说,怎样让云的概念落地。

本书的重点:阐述如何实现云计算的服务。换句话说,当一个公司在战略上决定做云服务后,如何将该战略进行步步分解,最终落地实施。这个战略的落地过程在我们看来,包括了运营管理、技术、组织能力建设等一系列的活动。

本书的特点是:理论和实践的结合

作者们在云计算产业中的长期经验使得这本书有了非常强的可读性和实践指导意义。这是本书追求的一大特色。

0.1.2 本书的读者群

本书定位的读者群是

同时,对技术团队而言,这本书还可以帮助工程师们了解高层管理者的决策背景和决策考虑因素。树立为实现战略目标而做工程,而不是为做工程而做工程的指导思想。实际上,很多云服务公司的技术团队对商务运营和技术运营的了解是非常欠缺的。

本书的专题讨论,从目的、原理、挑战到实际方案或案例,都非常的系统化。这是高校师生切入企业运作的很好的教材。

0.1.3 本书的作者群

本书的作者有着丰富的IT和云计算服务的行业背景以及技术和管理经验。

实际上,不同于一般云计算书籍的作者是跟随着云计算的发展而进入这个产业的,本书的主要作者们实际上是“被”进入到云计算服务这一领域的(be clouded)。

SaaS是云计算服务体系中的最大的一部分,也是云计算产业链中商业化最早的。追溯到2001年,当我们开始在硅谷(Silicon Valley)的SaaS公司工作时,我们未曾刻意有过云的概念。真正的商业意义上的SaaS服务是2000年前后由发源于美国硅谷,后来成为非常著名的SaaS公司所推出的。这些公司包括Salesforce(全球最大的在线CRM服务提供商)和WebEx(全球最大的网络会议服务提供商)。Salesforce的CEO马克•贝尼奥夫(Marc Benioff)更是直接提出了“软件终结”(The End of Software)的理念来推动传统企业软件到SaaS服务的转型。然后是2006年亚马逊推出的IaaS服务AWS。

实际上,正是由于商业需求的驱动,才真正使云计算的技术和服务得到了快速的发展,使我们今天突然发现自己已经身在云中,而且是非常早期的一批从事云计算的专业人员(professionals)。

0.1.4 写作的思路

本书的每一个章节基本上是按照以下思路来进行的。

在重要的专题上,本书会介绍相应的经典理论和框架。这样的目的是告诉读者这些专题研究和发展的历史,使得读者可以有个明确的思路,作为他们实践的参考。

本书的书写目的是帮助读者对这些云计算相关的重要的讨论课题从基本概念、发展思路,到解决方案有一个系统的了解。这样可以帮助他们在自己的实际环境中,根据自己的实际情况,设计出自己的解决方案。

0.2 本书内容的结构

书的总体结构是按照运营管理和技术两大类及一个专题来划分的:共四个部分和一个专题。

这本书的内容的总体逻辑结构如总图1所示。

两个大类是:

在运营和技术之后,就是人的因素,就是团队。我们这里专门设立的专题是:

书中各个部分的逻辑结构如总图2、总图3、总图4和总图5所示。这些总图放在了相应各部分的第一页。

0.2.1 商务运营

实际上,商务运营这一部分是本书中启动写作最晚的一部分,但也是写作中专题性最强的一部分:在这部分中,我们会专注于公司的财务运营。

“现金为王”。对于云计算产业的商业模式来说,这个经典老话尤其重要:因为云服务公司要求密集的资金投入,但面向客户,又是租凭式或服务式的收费。初期巨大的投入和细水长流的收入的反差使得一位在云计算行业的老将说出这样的话:如果你没有足够的现金,就不要进入云服务这一领域。

财务运营是商务运营最重要的内容之一。但在开始撰写财务有关的章节时,只是写了成本管理的一章。后来,由于两位在国际云计算公司的财务高管的加入写作,这部分最后成为一套财务运营上从原理到实践的完整体系。

这一部分将讨论有关公司财务运营的目的及其活动,包括融资、投资和日常财务运作。在此基础上,添加了两个专题:公司并购(M&A)和成本管理(Cost Management)。公司并购(M&A)是公司投资的重要手段之一,也是很多传统的IT公司进入云计算产业的方法。成本管理的重要性不言而喻:在云服务公司运营中,有效的成本效益是至关重要的。

这部分还有其他重要的议题,如产品管理、销售、市场等商务运营。然而,由于时间的限制,这些章节未及完成,只能把这些主题放在这本书的下一版本。

0.2.2 技术运营

技术运营(Technical Operations)是云服务最重要的关键之一,也是这本书的重要组成。

技术运营部分的写作起步最早,也是本书中实践性最强的部分。这部分内容的作者是直接负责技术运营的高管和资深运营团队成员。

技术运营是随着云计算的兴起而得到发展的。相比传统的研发和IT,技术运营是一个非常年轻的技术领域。系统性研究的缺乏和人才的缺乏是这个领域发展的最大瓶颈。在这部分的写作中,我们根据20年来的实践,做了比较系统的讨论。这也是国内云计算书籍中第一本在这个领域做系统讨论的专著。

技术运营要确保7×24小时的服务生产运行可以保证高可用性。这个服务平台要保证高达数百万计或数千万计的客户同时得到满意的服务要求(SLA)。如果没有强大的技术运营体系的支持,云服务将不再是一个服务,但只是一个内部的实验室的活动。

在这部分将会围绕我们总结出来的技术运营的三角模型来讨论。这个三角模型包括三个基本方面:

这部分的写作非常的费时。这是因为两个主要原因:

(1)“实践→理论→实践→理论”的多次思考和循环。虽然作者在实践中有多年的经验,但是,在刚开始时做的思考和总结,随着时间推移和再思考,又要推倒重写。如此一直的反复,很耗时间。

(2)现有的经典的技术管理体系过于庞大,并且没有直接针对云服务的运营。要花很多时间从这些现有的体系中进行总结和归纳。与云计算运营最相关的ITIL v3有五本非常厚重的书籍,还有6-Sigma,eTom等专著。相信除了培训机构,极少有高管会去通读,也不会通盘应用的。

(3)新的概念和方法的提出,如生产设计与开发。这需要很多时间的思考和总结。

另外,这里要强调两个名词的定义。

也要提一下,这部分的写作在文字上的通顺性不是很强。这是因为大部分的内容是先用英文写作的,然后再整理成中文。翻译的功力还需要改进。

0.2.3 技术架构

云服务是在技术平台上运行的。技术是云服务的基础。

这是非常难写的一个部分。这是因为已经有很多的书和文章在讨论云计算有关的技术,如虚拟化,Hadoop系统等,而且有些书讨论得很深入。

在这一部分,我们决定从另外一个角度来讨论云计算技术。实际上,云服务提供商关心的是能够为服务运营所用的技术,而不是为了技术而技术。因此,本书的重点放在讨论如何建立一个可靠、可扩展性和可管理的平台所需要的技术架构、质量工程和监控体系等,而不是深入讨论某个单项技术。

根据这个思路,本书讨论了相关的虚拟化和海量数据处理等的关键技术。但是对于很前沿的云计算技术,如果离实际的服务运营的要求比较远,就没有讨论。

在技术方案讨论中,作者也是从实践的角度出发讨论技术设计和实施,探讨相关要点和难点。

这部分的作者是在业界时间很长的技术架构师和资深的技术管理人员,有着丰富的实践经验。

0.2.4 安全技术与管理

云服务的安全性是客户最关心的问题之一。我们将在这部分探讨云服务的安全保障技术、安全管理体系、云服务连续性保障以及云计算的IT合规性认证等重要的议题。

这部分的写作是全书中系统性最强的部分之一。这归功于这部分的主编在研究院多年的潜心研究。这部分的写作团队包括两位博士和两位业界资深的安全专家,阵容很强。

0.2.5 组织能力

企业定义了明确的战略方向,只是企业在竞争中致胜制第一步,企业要取得最终的成功不仅要有正确的战略,更重要的是要建立能够将确定的战略得以实施的组织能力。

我们在这里做一个专门的章节讨论组织能力,研究如何建立与云服务相适应的团队思维方式、团队能力和团队治理。这一章是以实现卓越的服务能力为核心做系统地讨论。

这部分的写作也是由云服务公司里做实际管理的高管负责。

0.3 什么是云计算服务

云计算是近几年互联网最热门话题,随着“IT不再重要”的观念的提出,以及金融危机的影响,企业对降低成本提升效率的追求越来越高,这些都极大的推动了云计算由概念到市场化转变,而各式各样的云服务也越来越多,但是除了很多人,甚至许多专业人士都有同样困惑,什么是云计算,云计算提供服务又是怎么回事?

云计算是伴随着“IT不再重要”理念提出的,最初的概念是:企业、个人将自己数据、计算能力都放在云端,即网络云里(一般网络是图示成为一朵云),使用者只要连接上网,就能获取自己数据及计算结果。这样企业可以将自己数据和服务放在云端,有专门的公司提供维护,企业自己无需IT,因此IT不再重要了。

在实际的云计算发展过程中,很多企业的IT团队将云计算服务部署在自己机房,提供员工从全世界各地接入。数据与计算在企业网络云里,这种方式叫私有云。在公网上提供的服务被称为公用云,还有混合云等。这些定义和范围虽然有所不同,但是其中最重要的和共同的特性就是服务。这种服务使用方式如同目前电信、电网或煤气网络一样的服务,是按照使用付费,而不是按照购买产品所有权付费。

本书中,所有的讨论都是以云计算的服务为中心的讨论。服务也是云计算的价值真正所在。

0.3.1 云计算

根据英文的百科(Wikipedia),云计算的定义是这样的:

“云计算是用服务的形式来使用的计算资源(硬件和软件),这种使用是通过网络(通常是互联网)来实现交付的。这个名字来自于使用云的符号作为一个抽象的概念,它是一个对复杂的计算基础设施系统做的一个抽象。云计算是通过在远端的数据中心(或云上)的用户的数据、软件和计算能力来为用户服务的。”

云计算定义英文的原文附在这里作为参考:

“Cloud computing is the use of computing resources(hardware and software)that are delivered as a service over a network(typically the Internet). The name comes from the use of a cloud-shaped symbol as an abstraction for the complex infrastructure it contains in system diagrams. Cloud computing entrusts remote services with a user's data, software and computation.” [1]

以服务的内容或形态来分,有多种类型的云计算:

0.3.2 云计算的服务模式

云计算服务就是基于云计算技术的理念上开发的服务,如IaaS、PaaS和SaaS等。它们都是强调的是服务。也正是这些服务带来的商业价值,驱使云计算得到了全球性的发展。

(1)软件即服务(SaaS)

软件即服务(SaaS,Software as a Service)发展的时间最长,也最成熟。目前大多数在网络上提供专业服务的都是SaaS业务,如客户关系管理(CRM)、通讯与协作(communication and collaboration)、会计/票据(accounting/billing)、企业资源规划(ERP)、人力资源管理(HRM)以及在线培训等(online training),这些业务是直接面对最终用户提供服务的。SOA构架等一系列构架演进,都是依托SaaS发展而来。

在SaaS模式中,云提供商在云端安装和运营应用软件,云用户从云客户端访问该软件。云用户不需要安装和管理应用程序以及运行所依赖的云基础设施和平台。这样可以节省维护和支持的费用。

云应用程序不同于其他应用程序在于其可伸缩性(scalability):可以通过克隆任务到多个虚拟机上运行,以满足不断变化的工作需求。负载均衡设施可以把计算任务分发到一组虚拟机上工作。这个过程是透明的,云用户只能看到一个单一的接入点。为了容纳大量的云用户,云应用应该可以多用户的,即任何一台机器可以服务众多用户。

SaaS的定价模式通常是每个用户按照每月或每年的固定费用来付费。在任何时候用户都可以添加或删除,价格都是可以调整的。

SaaS的例子包括:Salesforce、WebEx、Google Apps(谷歌应用)、Microsoft Office 365、GT Nexus、Marketo和TradeCard。

(2)平台即服务(PaaS)

平台即服务(PaaS,Platform as a Service)是在SaaS基础上发展而来,如从Salesforce延伸出的Force.com,最初是CRM的SaaS服务,但随着业务发展,Salesforce将服务平台化,以利于其他应用服务软件的集成。

PaaS成熟是最近几年的事情,PaaS技术上的构架探讨还没有SaaS那么丰富。

在PaaS模式中,云服务供应商提供了一个计算平台(computing platform)。这个平台通常包括操作系统、软件编码语言的执行环境、数据库和Web服务器。应用程序开发人员可以在这样的云平台上开发和运行他们自己的应用软件,而不用去烦恼购买和管理复杂的底层硬件和基础软件层带来的麻烦。有一些PaaS提供商甚至提供了底层的计算机和存储资源自动匹配的功能,这样云用户不必去手动分配资源来满足应用的扩展需求。

PaaS的例子包括:AWS Elastic、Beanstalk、Cloud Foundry、Heroku、Force.com、EngineYard、Mendix、Google App Engine、Windows Azure Compute和OrangeScape。

(3)基础设施即服务(IaaS)

基础设施即服务(IaaS,Infrastructure as a Service)是最底层的云服务。IaaS供应商提供计算机(包括物理机或虚拟机)及其资源管理系统,如Xen或KVM虚拟机管理系统可以支持大量的虚拟机的随时扩展和调配。IaaS云通常会提供额外的资源,如虚拟机镜像、存储、防火墙、负载均衡、IP地址、虚拟局域网(vLAN)和软件包。IaaS云供应商通常在自己的数据中心建立这些资源的资源池(resource pool)来提供服务。IaaS的用户可以通过互联网或运营商的虚拟专用网VPN来接入和使用这些服务。

IaaS提供商的例子包括:Amazon CloudFormation、Amazon EC2、Windows Azure Virtual Machines、DynDNS、Google Compute Engine、HP Cloud、Oracle IaaS、Rackspace Cloud、ReadySpace Cloud Services、SAVVIS、Terremark和NaviSite。

0.3.3 云计算的部署方式

(1)公有云(public cloud)

公共云是由服务供应商将应用程序、存储和其他资源作为服务提供给一般的使用者。服务模式是用免费或按需使用付费的模式。一般情况下,公共云服务供应商,像亚马逊的AWS、微软和谷歌,拥有并运营这些服务基础设施。用户只能用通过互联网来使用这些服务。服务提供商不提供到用户的直接连接。

(2)社区云(community cloud)

社区云是云服务商提供给某些公司或团体的服务,而不是面向所有互联网用户的。公司或团体有着共同关心的问题,如安全性、合规性等,因此称为社区(community)。社区内用户是共同使用一套云服务设施。这套设施可能是在内部建立的,也有可能是建立在外部的。其成本被社区内部的用户分摊。因此其成本效益比公共云低,但比私有云高。

(3)混合云(hybrid cloud)

混合云是两个或两个以上的云(私有云、社区云或公有云)的组合。它在所提供的服务本身是单一的,但是后面的服务设施是被绑定在一起。这样可以达到对不同部署模式的取长补短。

利用“混合云”的架构,企业和个人都能够获得结合本地即时可用性,得到不依赖于互联网连接的服务容错度(fault tolerance)。同时,由于借助了外部的云的服务,混合云上的应用服务也得到了较好的可扩展性(scalability)。

(4)私有云(private cloud)

私有云是仅仅为单一的公司或团体使用而运营的云基础措施。这个基础措施可以是内部管理或由第三方托管。

私有云的使用者基本上是那些业务上有特殊要求的公司或组织。比如内部的IT应用,对网络配置有特殊要求的通讯应用服务等。

一些已经具有内部大中型数据中心(IDC)的企业,也通过虚拟化等的云计算技术手段,将自己的数据中心的基础设施和应用服务进行云化(即私有云),以达到成本效益的提高。

0.3.4 云计算的发展

图0-1简要的介绍了云的发展 [2] 。详细的内容,请参阅附录0-1“云的发展历史”

图0-1 云的进化过程

附录0-1:云计算的发展历史 [2]

云计算这个词的来源比较模糊,但它似乎源自在实践中使用云的图形来表示的计算和通信系统中的网络图。到了互联网时代,开始使用云的形状来表示一个网络电话图,再后来用来作为一个抽象描绘来形容互联网在基础设施层的网络架构。云的图形早在1994年被用来表示互联网。

云计算的底层概念可以追溯到1950年代。当时,大型机(mainframe)在学术界和企业所使用,用户可以通过瘦客户端(thin client)或终端计算机(terminal)来接入。为了节省昂贵的大型机的费用,出现了新的技术,允许多个用户同时登陆大型机和以及共用CPU时间,以消除了大型机的空置时间。这种技术被业界称为分时(time-sharing)。

在1990年代,曾主要提供专用的点到点(P2P,point-to-point)数据专线的电信公司,开始提供虚拟私有网络(VPN)的服务。这种服务的质量与P2P的服务相当,但价格却低得多。通过流量的调度和平衡,他们能够将他们的整体网络带宽的使用更有效。云的图形是用来表示提供者职能和用户职能之间的分界点。在后来的云计算中,这个边界从网络基础设施延伸到服务器。

随着计算机变得越来越普遍,科学家和技术人员探索了很多方式来使用分时(time-sharing)的方法以使大规模的计算能力能够给更多的用户使用。这些方式是通过基础设施、平台和应用程序对CPU的使用优先级和效率提高的算法改进的实验上进行的。

在1960年代,约翰•麦卡锡(John McCarthy)认为,“计算总有一天会被构造成一个公用设施(computation may someday be organized as a public utility)”。在道格拉斯•帕克希尔(Douglas Parkhill)1966年出版的《计算机应用的挑战》(The Challenge of the Computer Utility)一书中,深入探讨了几乎所有的现代云计算的特征,比如以在线式和无限供应式来提供的弹性构建服务,并与电力行业使用方式的比较,同时也探讨了公共、私人、政府和社区的多种可能的构建形式。

其他学者表明,云计算的根源可以追溯到1950年代。当时的科学家Herb Grosch(Grosch's Law一书的作者)推测整个世界将使用非常简单的终端设备,而这些终端设备是由约15个大型数据中心来进行控制的。由于这些强大的计算机成本的昂贵,很多企业和组织可以通过计算能力的分时(time sharing)方法来降低成本。一些组织,比如通用电气的GEISCO、IBM子公司Service Bureau Corporation(成立于1957年)、Tymshare(成立于1966年)、National CSS(成立于1967年,并在1979年被Dun & Bradstreet收购)、Dial Data(在1968 年被Tymshare收购)、Bolt、Beranek和Newman(BBN),它们当时认为分时是一个新的商业的发展机会。

随后的高容量网络、低成本电脑和存储设备、以及广泛采用的硬件虚拟化、面向服务的技术结构(service oriented architecture)、自适应的分布式计算系统(autonomic computing)和效用计算(utility computing)给云计算的技术发展带来了很大的推动。

企业软件的服务化是SaaS发展的关键的第一步。最早期的SaaS服务包括2000前后年出现的在线CRM(Salesforce)和网络会议应用(WebEx)。到目前,SaaS成为云计算的商务应用中最大的部分。

2000年代初期网络泡沫之后,通过将自己的数据中心的计算资源开放给公众,亚马逊(Amazon)在云计算的发展中扮演了重要角色。当时,亚马逊的数据中心,就像其他的大多数的数据中心一样,在任何时间其网络及系统用量使用仅为10%的容量,而这种设计只是为了偶尔出现的峰值留出空余。亚马逊后来发现了新的云架构可以带来显著的内部效率的提高,这种效率的提高可以让小型和快速的“两个比萨团队”(two-pizza teams,意思是说,这种团队足够小,买两个比萨就能喂饱他们)能够更快和更容易地开发和实施新功能。在这个发现之后,亚马逊启动了一项新产品的开发。这个产品是为外部客户在效用计算的基础(utility computing basis)上提供云计算服务。这就是2006年推出的亚马逊网络服务(AWS,Amazon WEB Service)。

SaaS和IaaS的服务,真正带动了云计算的商业化普及,也真正带来了云计算的飞速发展时代。

到2008年中期,Gartner公司预测,云计算可以用来改变IT服务提供者和IT服务使用者之间的关系,并指出,“组织正在从公司拥有的硬件和软件资产的方式,转向按需使用服务的模式(per-use service-based models)”,并且预计这种转移将导致在某些领域的IT产品的显着增长和某些领域的显著减少。

参考文献:

[1] Cloud computing,Wikipedia,2013,http://en.wikipedia.org/wiki/Cloud_computing

[2] History of Cloud Computing,2013,http://www.azurecloudpro.com/a-brief-historyof-cloud-computing/ ajqKQV7A3LHRe+Ka3rYVyHjB59PKXWwXgW2eY2JFkqE3XpoSPtdoGG5UxtTG+YkI

点击中间区域
呼出菜单
上一章
目录
下一章
×