购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.4 云计算的前世今生

“有需求就会有市场”,这是现代商业的核心理念。如果把计算能力当成是一种商品,那么在计算机出现之前,这种商品是以各种专业计算人员及其所使用的计算工具,如算筹、算盘(如图2-1所示)、计算尺的形式出现的。而在计算机出现之后,这种商品基本上是以计算机软硬件系统的形式出现的。

▶ 图2-1 早期的算盘

在计算机诞生之初,对普通民众来说可望而不可即。但个人计算机(PC,Personal Computer)出现之后,随着硬件设备性能的不断提高及其价格的不断下降,同时随着微软“所见即所得”的视窗操作系统的普及,计算机及其所提供的计算能力这种旧时王谢堂前燕,飞入了寻常百姓家。随着人们对计算能力需求的不断增长,计算机技术也在不断发展,其具体表现形式也在不断变化,计算机不再是一个仅能进行数学运算和信息处理的机器,在很多人眼中,计算机已经成为通往另一个世界的途径。进入互联网时代,人们借助计算机进行广泛的信息交流与共享,人类社会步入了信息爆炸的时代。当越来越多的信息需要处理时,人也加入到计算机系统及网络的交互过程中,人类的这种交互行为也逐渐成为计算的一部分。为了满足处理迅猛增长的海量数据的要求,以及人们随时随地进行计算的需求,并且为了达到降低成本、提高效率、节能减排的目的,云计算技术应运而生并被大力追捧。

2.4.1 高高在上的大型计算机时代

这一时代的标志物是埃尼阿克(ENIAC,Electronic Numerical Integrator and Computer/电子数字积分计算机)和“深蓝”,需求的主要来源是国家和企业,追求的是计算速度的提升。

必须提到的人物是阿兰·麦席森·图灵(Alan Mathison Turing)和约翰·冯·诺依曼(John Von Neumann)。图灵是现代计算机理论模型的提出者,而冯·诺依曼则是将这一模型付诸实践的人。

图灵在24岁时向伦敦权威的数学杂志投了一篇论文,给出了一个简单的模型,这个模型就是图灵命题。这个命题,被誉为“阐明现代计算机原理的开山之作”,并冠以“理想计算机”的名称。然而,42岁的图灵吃了在氰化物溶液中浸泡过的苹果后离开了人世,他对计算的贡献也随之终止了。今天,苹果公司以那个咬了一口的苹果作为其商标图案,就是为了纪念这位伟大的先驱者。

按数据进行存储,自动完成程序所描述的处理工作,这就是图灵机最基本的功能。虽然图灵离开了人世,但是他的思想保留了下来,冯·诺依曼将图灵的伟大思想付诸实践并发扬光大。

在那个时代,计算机的研制所需的人力、物力、财力不是某个个人或者某个企业可以独立承担的,只有获得足够的国家财力支撑才有可能实现,而创新的风险是很高的。

在第二次世界大战中,为了满足美国军方的需求,宾夕法尼亚大学的莫克利博士与研究生埃克特一起建造了ENIAC——人类第一台全自动电子计算机。它的运算速度为每秒5000次加减法。当时用于弹道计算,从台式机械计算机所需的7~10h缩短到30s以下,代替了弹道实验室近200名工程师的繁重计算。

但是ENIAC有一个很大的缺陷——它不具备“在计算机内存储程序”的特征,这导致它每次解决新问题时,需要准备几天时间,而计算本身只需几分钟,计算的高速与程序的手工操作存在很大矛盾。

这一矛盾在以计算机之父冯·诺依曼(见图2-2)为首的小组设计的离散变量自动电子计算机(EDVAC,Electronic Discrete Variable Automatic Computer)上得到了解决。1945年,现代计算机之父冯·诺依曼以“关于EDVAC的报告草案”为题,起草了长达101页的总结报告,报告广泛而具体地介绍了制造电子计算机和程序所涉及的新思想。这份报告是计算机发展史上一个划时代的文献,它向全世界宣告,电子计算机的时代开始了。

▶ 图2-2 冯·诺依曼

在此之后的很长一段时间内,计算机的开发和应用都集中在大型机领域,追求的是计算速度的提升,其中的登峰造极的巅峰代表非“深蓝”莫属。1997年发生了一件关于计算机的具有轰动效应的事情——IBM的“深蓝”对阵象棋世界冠军卡斯帕罗夫。

“深蓝”重量达1.4t,有32个节点,每个节点有8块专门为进行国际象棋对弈而设计的处理器,运算速度为每秒2亿步,这样快速的运算速度绝对是人脑所无法比拟的。IBM研制小组向“深蓝”输入了100年来所有国际特级大师开局和残局的下法,即将象棋大师的智慧输入给了“深蓝”。它在走每一步之前都会通过超强的计算能力将“头脑”中存储的所有可能的走法尝试一遍,选择最佳的走法,这样,对弈就变成了单纯的计算。它不会疲倦,不会有心理上的起伏,也不会受到对手的干扰,它的缺陷是没有直觉,不能进行真正的思考。根据这样的调查结果,卡斯帕罗夫想要赢过“深蓝”就唯有通过直觉、判断和经验了。

比赛如约进行,双方经过激烈的较量,前五局2.5∶2.5平,到了决胜局,卡斯帕罗夫意外地仅走了 19 步就向“深蓝”拱手称臣,那句“我已无力再战”更是震颤人心。“深蓝”赢得了比赛,战胜了棋王。

作者在美国加州亲眼见到了曾战胜棋王卡斯帕罗夫的“深蓝”,并为它拍摄了照片(见图2-3)。特别有趣的是,在机器的上方有一行文字:“其实,卡斯帕罗夫只需简单一步就可以打败深蓝!”下面有一个小画儿:画上卡斯帕罗夫的手伸向“深蓝”的电源开关。

▶ 图2-3 曾战胜棋王卡斯帕罗夫的“深蓝”

当然,“深蓝”的意义绝不仅仅是陪人类下棋的玩具,我们需要这样的计算机,因为“深蓝”存在的意义在于帮助人们研究如何最大限度地发挥计算机的优势,为人类更好地服务。

这一时期计算机的应用领域大多集中在军事、气象、医学等领域,在民间的应用并不多,虽然也有部分企业引入了小型机,但是对于大多数人来说,计算机依旧是个陌生的概念。直到PC的出现才打破了这一局面。

2.4.2 合久必分:PC时代的到来

在PC出现之前,一切都按照客户机/服务器的模式运转。所有的应用软件、数据、控制都位于大型的计算机主机上,这些计算机主机通常被称为服务器。如果用户想访问特定的数据或运行特定的程序,他必须连接到主机上,获得适当的权限,然后才能执行他的业务。用户通过终端连接和使用主机,对于主机给出的结果,用户只能接受而不能有任何异议,如果想要对结果做出任何改变,就只有等待数天甚至数周。而这一缺陷也隐隐预示着PC时代的辉煌。

这一时代的标志物是IBM PC,需求的主要来源是个人、家庭和企业,追求的是计算机应用的多样化,即软件开发。

PC一词源自1978年IBM的第一部桌上型计算机型号PC,个人计算机不需要共享其他计算机的处理单元、磁盘和打印机等资源也可以独立工作。

IBM并不是第一个研制和生产微型计算机的企业,IBM的成功主要是大型机,由于没有把握好时机,IBM被DEC公司夺走了小型机霸主的地位。20世纪70年代末,以苹果公司为代表的“车库”公司,短短几年就把微型计算机繁衍成了大气候。个人计算机市场的潜力是巨大的,而“蓝色巨人”在计算机革命浪潮中的步伐却慢了半拍,竟然陷入十分尴尬的境地。

经过几年的观望和徘徊,IBM公司的高层于1980年4月秘密召开了一次会议,会议上决定实施“国际象棋”项目。研制出了一种新的机器,IBM公司决定把新机器命名为“个人计算机”,即IBM PC。

1981年8月12日,IBM在纽约介绍PC时,公开宣布放弃独自制造所有硬软件的策略,不仅使广大用户认可了个人计算机,而且促使世界各地的电子计算机厂商争相转产PC(见图2-4),仿造出来的产品就是IBM PC兼容机。这样的技术、产品和商业模式极大地加快了计算机和人类社会的发展速度。

▶ 图2-4 促使世界各地的电子计算机厂商争相转产PC

IBM PC的成功所带给我们的启示:好的技术和产品只有和合理的商业模式相遇时才能焕发出最强的市场生命力。

随着PC的普及和软件功能的进一步强大,人们开始将重心从对数据和资源的处理渐渐转移到了对数据和资源的共享上,最早的阿帕网(ARPAnet)的想法就来自于此,而互联网的雏形就是阿帕网。

2.4.3 分久必合:互联网让PC合在一起

这一时代的标志物是万维网和Web2.0,需求的主要来源是个人和各种民间团体,追求的是信息的个性化和沟通的自由无疆界。

在PC发展的早期,拥有PC的人员主要是研究人员和程序员。此时的PC更多的是一种工作站的角色,与一般人的生活依旧没有太多的交集,当然PC时代后期的PC游戏除外,直到互联网出现之后,PC才开始真正走入了千家万户。

互联网始于1969年,是在ARPA(美国国防部研究计划署)制定的协定下将美国西南部的4所大学的4台主要的计算机连接起来。发展到1989年,Tim Berners 和其他在欧洲粒子物理实验室的人提出了World Wide Web协议,即所谓的万维网。万维网是互联网的一部分,它的核心是超文本标记语言(HTML,Hyper Text Marked Language)。接入万维网的用户通过浏览器就可以分享文本和图片信息。万维网出现之后,其用户数量以每天1%的速度增长。1994年夏天,世界各地的天文观测中心通过环球网系统向全球发布彗星、木星相撞信息;1994年世界杯足球赛期间,美国太阳计算机公司通过环球网系统进行赛事报道;与全球互联网连通的图书馆、博物馆、实验室、教学部门纷纷参与到环球网中来提供服务;各大公司开始通过环球网系统向用户提供产品和服务信息,进行广告宣传。这说明,PC的性能将不再是主角,连上互联网才是价值所在,这样的分久必合给人类带来了地球村的惊喜。

到了Web2.0时代,随着动态网页、Javascript的广泛应用,网页能够呈现的内容变得更加丰富,人们并不满足于内容的分享,而是希望生产和展现自己的个性化信息,并与他人进行共享。基于这一思想的SNS获得了极快的发展,Facebook、校内等网站现在已经融入了人们的生活中,其影响正在进一步扩大。目前,全球网民人数已经超过了15亿,也就是说全世界每4个人中就有一个人每天都会与互联网打交道。

互联网拥有如此庞大的用户数,也带来了诸多问题,其中最棘手的一个问题就是“信息爆炸”,信息爆炸是对信息近几年来快速发展的一种描述。现代科学技术发展的速度越来越快,新的科技知识和信息量迅猛增加。据英国学者詹姆斯·马丁统计,人类知识的倍增周期,从19世纪的50年减少到20世纪80年代的5年左右。另有报道说,全球印刷信息的生产量每5年翻一番,《纽约时报》一周的信息量即相当于17世纪学者毕生所能接触到的信息量的总和。近30年来,人类所生产出来的信息已超过过去5000年信息生产的总和。探究起来,人类社会赖以生存和发展的三大基础是物质、能量和信息。随着经济的快速增长,自然资源和能源被过度消耗,导致生态危机和能源危机。同时,随着以互联网为代表的信息网络的飞速发展,以光速传播的信息资源爆炸性增长和累积,导致“信息危机”。根据美国易安信(EMC)赞助、IDC的题为《经济紧缩,数字宇宙膨胀》的研究报告显示,2008年全球所创造出来的数字信息比IDC原先预测的还要高出3%,约等于39万亿亿比特!如果将这些数字化的信息全部印成书籍并排列整齐,它们的长度将是从地球到冥王星距离的10倍。展望未来,这个数字有望每18个月翻一番。IDC研究还表明,从2006—2010年,全球信息总量将增长6倍以上,从161EB增加到988EB。因此,信息危机的内涵并不是信息的缺失和匮乏,而是如何在快速增长的浩如烟海的信息海洋中通过计算而快速有效地使用我们所需要的信息。

事实上目前的状况是:人们一方面享受着网络上丰富的信息所带来的便利,另一方面也在忍受着“信息爆炸”的困扰。就像当年为了解决计算速度的问题一样,我们是否可以通过提高计算机的处理速度来解决所要处理的信息超过分析能力这个难题呢?为了回答这个问题,先来介绍一下“摩尔定律”。

“摩尔定律”的创始人戈顿·摩尔,是Intel公司的创始人之一。1965年4月19日,时任美国著名半导体厂商仙童公司研究开发实验室主任的摩尔应邀为《电子学》杂志35周年专刊写了一篇观察评论报告,题目是“让集成电路填满更多的元件”。摩尔正当意气风发之时,对未来充满盲目的乐观,提出了“最低元件价格下的复杂性每年大约增加一倍”的说法,这就是“摩尔定律”的雏形。后来又出现了多个版本的摩尔定律,现在广为人知的版本是“半导体元件上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍”。

不需要复杂的逻辑推理就可以知道:芯片上元件的几何尺寸总不可能无限制地缩小下去,这就意味着,总有一天,芯片单位面积上可集成的元件数量会达到极限。问题只是这一极限是多少,以及何时达到这一极限。业界已有专家预计,芯片性能的增长速度将在今后几年趋缓。即使是乐观分析也认为,摩尔定律充其量也就能再适用10年左右了。其制约因素主要是技术和经济。

从技术的角度看,随着硅片上线路密度的增加,其复杂性和差错率也将呈指数增长,同时也使全面而彻底的芯片测试几乎成为不可能。一旦芯片上线条的宽度达到纳米数量级时,也就是芯片上线条的宽度相当于只有几个分子的大小时,这种情况下材料的物理、化学性能将发生质的变化,致使采用现行工艺的半导体器件不能正常工作,摩尔定律也就要走到尽头了。

从经济的角度看,正如摩尔定律所述,目前是20亿~30亿美元建一座芯片厂,线条尺寸缩小到0.1(m时将猛增至100亿美元建一座芯片厂,这费用比建设一座核电站投资还要多。由于费用高昂,将迫使越来越多的公司退出芯片行业。既然靠单纯改善硬件性能不能解决问题,那么有没有其他的办法呢?

云计算应运而生的原因是随着互联网的发展、Web2.0的浪潮,以及大众参与信息制造和编辑,使得信息增长具有无限性的趋势。而摩尔定律的终结,表明在技术和经济上都没有办法依靠硬件性能的提升来解决这一问题。怎样低成本地、高效快速地解决无限增长的信息的存储和计算问题是摆在科学家面前的一个命题。云计算是用大规模低成本运算单元通过IP网络相连而组成运算系统来提供运算服务的技术,它具有高性能、低成本、通用性强的特点。所以说,云计算可以以较低的成本和较高的性能解决无限增长的海量信息的存储和计算问题。它使得IT基础设施能够实现资源化和服务化,使得用户可以按需定制,从而改变了传统IT基础设施的交用和支付方式。

2.4.4 合中有分,分中有合:云计算时代来临

当单靠改善硬件性能已经不能再解决问题的时候,一个新的时代出现了。这个时代是个未知的时代,一切都等着人们去开发和探索,其需求来自全世界及社会的各个层面。这个时代就是云计算时代。

云计算使计算、存储摆脱了物理节点的限制和约束而按照业务逻辑来进行,做到了合中有分,分中有合。

众所周知,长期以来,运算和存储都是在自己的机器上进行的,其性能随着硬件的发展而发展,在很长时间内,硬件依赖成为IT业发展的依托,斥巨资打造更好的设备成为很多厂商发展的定式。云计算打破了这一传统的模式——云计算使得IT服务设施从硬件依赖转向软件依赖。

要了解云计算,还得从一个著名的故事谈起。

故事的主人公是Google公司的两位创始人拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)。佩奇认为万维网是人类创造的最大的网络,里面隐藏了许多有用的信息,可是怎么获得这些信息呢?佩奇认为,这将会是一个很有前途的研究。于是,佩奇建立了一个实验用的搜索引擎BackRub。由于实验非常庞大,他请布林加入了他的团队,他们一起将BackRub越做越大,扩大搜索网页数目,提高搜索速度。随着越来越多的人使用BackRub搜索引擎,佩奇和布林意识到了BackRub的价值,他们准备出售BackRub,但当时各大门户网站都对这项技术非常冷漠,无奈之下他们决定自己干。

1998年9月,24岁的布林和25岁的佩奇决定合伙成立公司,公司提供的唯一服务就是搜索引擎。在对商业计划一无所知的情况下,布林从一位斯坦福校友那里顺利地拿到了第一笔投资——10万美元。依靠这10万美元,在朋友的一个车库里,布林和佩奇开始了Google的征程。由于资金有限,他们买不起昂贵的商用服务器,于是他们就买淘汰的主板、过期的CPU、便宜的小容量硬盘,还有廉价的电源等最便宜的器件来攒服务器。但是这种廉价组装的服务器很容易坏,不稳定,他们决定靠写完善的容灾软件系统来克服这些毛病,当一处应用系统发生故障时,整个应用系统切换到另一台计算机上继续进行工作,利用软件的系统工程使得几十万、上百万并不可靠的硬件服务器组成一个非常可靠的系统来提供IT基础支撑服务,让软件代替硬件来作为支撑。到了2000年,他们已经有了几千台这样的服务器了。他们开始用网络把这些服务器连接起来,并通过软件系统的一整套新型运算模式来实现高性能运算,形成了现在所谓的“云计算”的雏形。而车库里那些提供搜索的用网线连接起来的几百台被攒出来的计算机,以及隔离它们的一些纸板就成为最初的云计算系统。便宜的硬件设施,加上容灾软件的支持,就能够支持快速的、大规模的网页搜索服务,这就是“云计算”的最早模式。

作者曾经亲眼见识了Google的第一代云计算系统的机架。那是在位于加州的一个计算机博物馆里。博物馆的馆藏都是各个IT巨人所赠,在属于Google的展区,摆放着这个外表简陋的计算系统,如图2-5所示。开放的机架,没有任何工艺的机架骨架和铁板,每一层的计算机只见主板和彼此的连接线,没有任何其他附属设备,连接线只是简单捆绑着,毫无设计工艺可言,每一层主板之间的间隔除了机架就是纤维纸板(见图2-6),依稀可以看见有Intel标识的奔腾处理器。

▶ 图2-5 Google的第一代云计算系统机架

▶ 图2-6 主板之间除了机架就是纤维纸板

在这个机架旁,立着一个牌子,有佩奇和布林的肖像,上面写着:“因为资金的拮据,Google的创始人佩奇和布林最初用多台廉价的、内部互相连接的PC组成如图这样的系统来为其每秒有数千次搜索请求的用户提供搜索引擎服务。这样的硬件系统充分说明了Google搜索的算法特点,那就是可以忍受多个节点的PC的故障而能在其余节点中容错和优化。”(笔者译)

我们所看到的这一机架是Google早期云计算系统的30个机架中的一个,目前其中的大多数PC已经不能正常工作且很难修复。但正是这样的30多架机架构成的第一代大规模并行分布式计算系统,让Google和它的搜索业务以最低的成本快速增长。

Web2.0的到来、PC的普及、云计算的初步发展,与云计算一起发展的还有互联网上日益飙升的数据,个人计算机再也无力支撑这海量数据,也无力独自承担如此大的海量计算。如果硬件崩溃了,是不是我们的数据也随之灰飞烟灭?云计算为这些难题找到了解决方案。我们可以把数据存放在“云”里自己的网盘中。安全性更不用怀疑,在云计算环境中,数据中心和它所运行的基础服务都有专业的机构和人员进行运营和管理,还有加密、隔离等技术保证数据的安全。云计算采用分布式并行处理的方法,将数据切成多份,分配到云计算数据中心的多个节点进行运算,再大的运算也能迎刃而解。

硬件再也不是计算发展的唯一支撑了,“图灵机”原理和摩尔定律被彻底打破和颠覆,云计算成了颠覆使者,同时也为人类迎来计算发展水到渠成的崭新阶段。如今,除了车库中诞生的第一个云计算系统,几乎所有的大型IT公司都投入到云计算的浪潮中来,各种各样的云服务应运而生,云计算切切实实地成为人们的“新宠”。 ukWwGiMR65+9QAQA9gxj5Xip8rElQpoiWPf5cibC3m5VluFPXfjHq17hxyBJaSN8

点击中间区域
呼出菜单
上一章
目录
下一章
×