计算技术是指数时代的先兆,是第一个显示这种显著变化速度的技术。它向我们展示了当技术加速、性能变得更好、价格变得更便宜,并随之创造了一个个完整的行业时会发生什么。
我在知道硅谷是什么之前,就见过计算机了。那是1979年12月,我的邻居带回来一台自己动手组装的计算机。我还记得他在自家客厅的地板上组装了这台设备,并把它连接到一台黑白电视上。他一丝不苟地输入了一系列指令后,屏幕变成了一块由块状像素组成的“挂毯”。
在一个7岁孩子的眼里,这台机器比他见过的任何东西都神奇。此前,我只在电视节目和电影中看到过计算机,没想到自己居然还能接触到实物。然而,我现在认为,更令人惊叹的是,在20世纪70年代,这样一台精巧的装置竟然出现在赞比亚卢萨卡市的郊区。当时全球供应链还很原始,远程购物还没有出现,但数字革命的发生已现端倪。
这种自己动手组装的工具激发了我的兴趣。两年后,我也拥有了自己的第一台计算机。那是一台辛克莱ZX81计算机,是在1981年秋天买的。买这台计算机的前一年,我家搬到了伦敦城外一个偏僻的社区。这台ZX81计算机现在还放在我家的书架上。它相当于一个7英寸 唱片套那么大,大约二指厚。在20世纪80年代初的客厅里,相比于真空管电视等电子产品或者比较大的盒式磁带架,ZX81计算机还算是小巧轻便的,用两根手指就可以拎起来。这台计算机的内置键盘在敲击时很不顺手,卡顿严重,而且你也不能用它打字。它只会对那些不友好的、断断续续的敲打做出反应。但你可以用这个小盒子做很多事情。我记得可以用它来编程,进行简单的计算,画一些基本的形状,玩最原始的游戏。
这台曾出现在全英国各大日报广告版面上的设备是一个里程碑。当时,你只要花69英镑(当时约合145美元),就能得到一台功能齐全的计算机。它内置的简单编程语言,基本上能够处理任何计算问题,无论这个问题多么复杂,它都能处理,当然,处理复杂问题可能会花费比较长的时间。 但是因为技术发展非常迅猛,ZX81并没有流行很长时间。没过几年,我那台只有黑白图形、键盘不好用、处理速度慢的计算机就过时了。6年后,我家就换了一款更先进的计算机,是由英国艾康计算机公司生产的。该公司的BBC Master计算机像一头强壮的野兽一样引人注目,有一个全尺寸键盘和一个数字键盘。它那排橙色的特殊功能键很适合作为20世纪80年代以太空探索为主题的影视剧的道具。
BBC Master不仅外观与ZX81不同,内部构造也经历了彻底转变。BBC Master的运行速度比ZX81快了好几倍,而且内存也是ZX81内存的128倍,可以显示多达16种不同的颜色,不过一次只能显示8种。它的小扬声器最多能发出4种不同的音调,足以播放简单的音乐。我还记得它在播放巴赫的《d小调托卡塔与赋格》时发出的嘟嘟声。BBC Master的功能相对复杂,可以运行一些功能强大的应用,包括电子表格(我从未使用过)和游戏(我使用过)。
又过了大约6年,也就是到了20世纪90年代初,我的计算机又得再次升级。那时,计算机行业经历了一段残酷的整合时期。比如TRS-80、Amiga 500、Atari ST、Osborne 1以及Sharp MZ-80都曾有过良好的市场表现。一些小公司获得了短暂的成功,但很快发现自己输给了少数几家正在崛起的新科技公司。
微软和英特尔两家公司在20世纪80年代你死我活的竞争中脱颖而出,分别成为操作系统领域和中央处理器领域最成功的公司。在接下来的几十年里,这两家公司建立了一种共生关系,英特尔公司提供了更多算力,而微软公司利用这种能力不断对软件进行升级。每一代软件都使计算机的负担加重,这迫使英特尔公司不断提升其处理器的性能。“安迪给予的,比尔会拿走” 成为业界的一个笑谈。
当时我只有19岁,对这些行业动态一无所知。我只知道计算机的运行速度越来越快,性能越来越好,我也想拥有一台。学生们通常会购买所谓的“山寨机”,也就是仿造IBM个人计算机的廉价山寨货,是用品牌和非品牌部件拼凑起来的。这些计算机采用了符合个人计算机标准的各种部件,这意味着它们配备了微软公司最新的操作系统,也就是用户(和程序员)用来控制硬件的软件。
我的山寨机是一个丑陋的长方形设备,唯一值得炫耀的是它配置了一个当时最新的英特尔80486处理器。这种处理器每秒可以处理1 100万条指令,大概是我上一台计算机每秒能够处理指令数的4~5倍。按一下机箱上标有Turbo的按钮,可以使处理器的运行速度提高20%左右。然而,就像司机的脚一直踩在油门上一样,速度的提升是以频繁的系统崩溃为代价的。
这台山寨机配备了4MB内存(或者叫RAM),是ZX81内存的4 000倍。这台山寨机的图像显示技术虽然不是最先进的,却也足以令人叹为观止。它可以在屏幕上显示32 768种颜色,使用的是插入机器的一个不算太先进的图形适配器。彩虹色的调色板令人印象深刻,但不是很逼真,蓝色看起来效果很差。如果我的预算再多出50英镑(当时约合85美元),我可能就会买一个可以显示1 600万种颜色的显卡。实际上,如果颜色种类太多的话,人眼根本无法区分其中一些颜色的差别。
从ZX81到山寨机的10年历程反映了技术的指数型变化。这台山寨机的处理器性能是ZX81处理器性能的数千倍,而1991年的计算机处理器性能是1981年计算机处理器性能的数百万倍。这种转变是新兴的计算机行业迅速发展的结果,大约每隔几年,计算机的处理速度就会翻一番。
要理解这种转变,我们需要弄清楚计算机是如何工作的。19世纪,英国数学家和哲学家乔治·布尔(George Boole)开始将逻辑运算表示为一系列二进制数。这些二进制数字,也就是所谓的“位”(bit),实际上可以用任何东西来表示。例如,你可以用杠杆的位置“上”和“下”来表示它们。理论上,你可以用红色和蓝色的M&M巧克力豆来表示它们(巧克力豆当然很好吃,但并不实用)。科学家最终确定1和0是最合适的二进制数。
在计算机发展的早期阶段,让机器执行布尔逻辑是非常困难和麻烦的。因此,计算机(基本上是任何可以使用布尔逻辑进行操作的设备)往往需要几十个笨拙的机械部件。关键技术的突破出现在1938年,当时麻省理工学院的硕士研究生克劳德·香农(Claude Shannon)发现,可以利用布尔逻辑来构造电子电路,用on和off代表1和0。这是一项革命性发现,这为计算机使用电子元件铺平了道路。后来,在第二次世界大战期间,普林斯顿高等研究院电子计算机项目使用第一台可编程电子数字计算机来破译密码。该项目的成员包括艾伦·图灵(Alan Turing)。
战争结束两年后,贝尔实验室的科学家们研制了晶体管,这是一种部分导电、部分不导电的半导体材料,可以用于制造开关。这些器件又可以用来构建“逻辑门”,即能够进行基本逻辑计算的设备。这样的逻辑门可以叠加在一起,形成一个有用的计算设备。
这个例子听起来很深奥难懂,但我要表达的意思很简单:新型晶体管比早期电子元件使用的电子管更小、更可靠,为后续更复杂计算机的出现铺平了道路。1947年12月,科学家制造了第一个晶体管,它看起来很笨重,是由包括一个回形针在内的许多部件拼凑而成的,但它可以正常工作。随着时间的推移,晶体管变得越来越常见,质量也越来越稳定。
从20世纪40年代开始,科学家们开始着手制造尺寸更小的晶体管。1960年,美国仙童半导体公司的罗伯特·诺伊斯(Robert Noyce)研发了世界上第一个“集成电路”,它将几个晶体管组合成一个组件。这些晶体管很小,无法由人或机器直接使用。它们是通过一种类似于化学摄影术的复杂工艺制造出来的,业界称这种工艺为光刻工艺。工程师们会用紫外线照射带有电路设计的薄膜,这种薄膜就像小孩玩的蜡纸。人们通过光刻工艺可以将多个电路印在一块硅片上,从而将几个晶体管叠加在一起。因此,每个圆的晶片可以包含若干份相同的电路,这些电路分布在一个网格中。切下其中一份电路,你就得到了一个硅芯片。
戈登·摩尔(Gordon Moore)最早认识到了这项技术的力量。摩尔是诺伊斯手下的一名研究员,在诺伊斯的发明问世5年后,摩尔意识到集成电路的尺寸正在以每年50%的速度减少,而晶体管的数量却没有减少。胶片,或者说光刻工艺使用的“掩膜”变得越来越精细,晶体管的尺寸以及它们与集成电路的接触面积变得越来越小,组件变得越来越复杂。这不仅降低了成本,而且提高了性能。新的芯片,其组件的尺寸更小,封装得更紧密,处理速度也更快。
摩尔详细研究了这些进展,并在1965年提出了一个假说。他认为,在一定的时间内,这些进展将能够在不改变成本的情况下使芯片的有效处理速度翻倍。 [1] 他最终做出估算:在成本不变的情况下,集成电路上可容纳的元器件的数量每经过18~24个月便会增加一倍,性能也将提升一倍。摩尔后来与他人共同创立了英特尔公司,英特尔公司是20世纪最伟大的芯片制造商。摩尔之所以广为人知,可能更多凭借的是他提出的理论,也就是众所周知的“摩尔定律”,而不是因为他是英特尔公司的创始人。
这个“定律”很容易被误解。它不像物理定律,是基于可靠的观察得出的,摩尔定律有很大的预测成分。人类的日常行为是无法违背牛顿运动定律的。牛顿告诉我们,力等于质量乘以加速度,不管你做什么或不做什么,不管你是在一天中的什么时候做某件事,也不管你是否有营利目标要实现,这一定律总是成立的。
实际上,摩尔定律并不具有预测性,它具有描述性。摩尔提出这一定律后,在计算机行业内部,无论是芯片制造商,还是无数为他们提供支持的供应商,都将摩尔定律视为一个目标。因此,它变成了一个“社会事实” ,这里的“事实”不是指技术本身固有的东西,而是指计算机行业希望存在的东西。材料公司、电子设计师、激光制造商都希望摩尔定律成立。然后,它真的就成立了。 [2]
但这并没有削弱摩尔定律的影响力。自从摩尔提出该定律以来,它一直是计算机行业发展的一个很好的指南。芯片上确实出现了更多晶体管。它们遵循指数型增长曲线:一开始变化速度慢到看不出不同,然后在人们意想不到的时候突然加速。
图1-1显示了从1971年到2017年,每个微处理器上的晶体管数量的增长情况。从第一幅图中不难发现,一直到将近2005年,这条曲线才稍微有了一点变化,这充分反映了指数型增长的特点。在第二幅图中,我们用对数标度来呈现相同的数据。对数标度将上图中的指数型增长转换为直线形式。我们可以看到,从1971年到2015年,每个芯片上的晶体管数量增加了近1 000万倍。
图1-1 1971年至2017年微处理器上的晶体管数量的变化曲线
资料来源: Our World in Data 。
我们无法用概念来表示这种转变的规模,但可以通过关注单个晶体管的价格来理解这种转变。1958年,仙童半导体公司以单价150美元向IBM出售了100个晶体管。 20世纪60年代,晶体管的价格已经下降到每个8美元左右。1972年,也就是我出生那一年,晶体管的平均成本降至15美分 ,半导体行业每年生产1 000亿~10 000亿个晶体管。2014年,人类每年生产25 000亿亿个晶体管,是银河系恒星数量的25倍。每一秒钟,世界上的“晶圆厂”——生产晶体管的专业工厂,都能生产8万亿个晶体管。 [3] 晶体管的成本已降至十亿分之几美元。
为什么这很重要?因为它使计算机以惊人的速度在进步。计算机处理信息的速度大致与组成其处理单元的晶体管数量成正比。芯片配备了晶体管后,它们的处理速度越来越快。与此同时,芯片本身也变得越来越便宜。
正是这种惊人的价格下降推动了发生在我十几岁时的计算机革命,让我的BBC Master比我的ZX81性能高得多。从那以后,晶体管的价格下降又一次改变了所有人的生活。当你拿起智能手机时,你手里拿着的是一个包含了几个芯片和数十亿个晶体管的设备。计算机曾经仅限于在军事或科学研究领域使用,但现在已经在几乎所有领域得到普及。想想1945年,第一台电子计算机在布莱切利园 执行艾伦·图灵的密码破译算法。10年后,全世界仍然只有264台计算机,而且其中许多计算机每月的租金高达数万美元。 [4] 又过了60年后,使用中的计算机已超过50亿台,其中包括像智能手机这种可以放在口袋里的超级计算机。在我们的厨房橱柜、储物箱和阁楼上,到处都是只用了几年的计算机设备,尽管它们仅有几年历史,却因迅速过时而已无实际用途。
摩尔定律是描述数字技术的指数型发展最著名的理论。在过去的半个多世纪里,计算机以不可阻挡的速度发展,催生了数不清的技术、经济和社会变革。本章的目标是解释这种转变是如何发生的,以及为什么在可预见的未来,这种转变会持续下去,同时还将介绍我们这个时代的决定性力量——指数型技术的崛起。
用最简单的术语来说,指数型增长就是任何以常数比例增长的东西。年龄的增长是一个线性过程,随着地球围绕太阳公转,你的年龄以可预测的速度增长。指数型过程就像一个按照复利计算的储蓄账户,账户内的金额以一个固定的百分比增长,比如按每年2%的利率增长。到了第二年,账户里的存款金额等于原始存款加上第一年的利息,以此类推。刚开始时,账户内的金额会增长得很慢,利息少得可怜。但在某一时刻,金额增长曲线便开始上升并开始迅速上扬。从这一点开始,账户内的存款金额就会以令人目眩的速度迅速增加。
事物的自然变化过程都遵循指数型增长的模式,例如培养皿中的细菌数量,或病毒在人群中的传播速度。然而,指数型技术的出现时间的确没有很久。我把指数型技术定义为一种可以按照基本固定的成本改进的技术,在几十年里以每年超过10%的速度改进。当然,纯粹的数学家会认为,即使是1%的复利变化也是一种指数型变化。确切地说,是这样的。但每年1%的变化需要很长时间才能开始出现明显变化。按每年1%的复利计算的话,要翻一倍,需要花上70年,这基本上相当于一个人的一生了。
这就是为什么每年10%的起点很重要。如果一项技术在价格和性能上的复合改进率达到10%,那么在同样的价格下,它的性能每10年就会提高2.5倍以上。或者反过来,在同样的性能水平下,成本将下降60%以上。10年只是两个传统的商业规划周期;10年是一份工作或人的职业生涯的一部分。英国或法国在10年内会进行两届选举,澳大利亚在10年内会进行3届选举,美国两届总统的任期比10年短一点。
这个定义的另外一部分也很关键。对一项指数型技术来说,这种变化应该持续几十年,而不是昙花一现。如果一项技术在几年的时间里以超过10%的速度进步,然后就停止了,那么它的变革性将远远赶不上一项不断发展的技术。因此,柴油发动机并不是一项指数型技术。早期,柴油发动机得到了迅速改进,但在接下来的20年中,基本没有什么改进。此外,计算机芯片技术在过去50年里每年大约有50%的进步,这当然是合乎要求的。
想象一下,你有一辆开了10年的车,现在换了一辆新的。再想象一下,如果这辆新车的主要性能,比如最高速度或燃油效率,每年能提高10%。相比于旧车,你的新车可能有两倍的燃油效率或超过两倍的最高速度。一般来说,这种情况不会发生在汽车行业,但对本书讨论的许多技术来说,实际情况就是这样。事实上, 有一些技术每年能够实现20% ~ 50%的有效进步。这样的创新速度意味着,在10年时间里,花同样的钱,你买得的产品性能将增长6 ~ 60倍。
这一现象体现在两个方面:价格的下降和发展潜力的增加。随着一项技术的价格下降,它的应用开始无处不在。突然之间,业界负担得起将指数型技术转化为新产品的费用了。芯片起初是为军方和航天机构的专业设备设计的,随后用在了只有超大型公司才负担得起的微型计算机上。10年后,随着芯片变得越来越便宜、越来越小,芯片不仅广泛应用于台式机中,随后也广泛应用于手机中。
与此同时,科技的力量爆发了。目前智能手机的一些常见功能,如高清彩色视频、高保真音质、流畅的动作视频游戏、文本扫描等,放在几十年前,甚至在最富裕的国家,也是可望而不可及的。当技术呈指数型发展时,它们会使真正能够催生新事物的产品价格越来越廉价。
技术传播的S型曲线
为了了解这一过程的实际情况,我们有必要研究一下贺拉斯·德迪欧(Horace Dediu)的工作。德迪欧是一名商业分析师,师从克莱顿·克里斯滕森(Clayton Christensen)。克里斯滕森是世界知名学府哈佛大学的学者,也是硅谷科技公司的“圣经”——《创新者的窘境》( The Innovator’s Dilemma )的作者。德迪欧凭借对创新模式的研究,本身享有当之无愧的声誉。在过去的20年里,他分析了200多年的历史数据,研究技术在美国经济体系中的普及速度。 他广撒网,一丝不苟地追踪各种各样的创新,如抽水马桶、印刷电气化、道路的大范围铺设、吸尘器、柴油机车、汽车动力转向系统、电弧炉、人造纤维、自动取款机、数码相机、社交媒体和平板电脑等。他估算了每一种产品要花多长时间才能在美国市场达到75%的渗透率,也就是有75%的成年人(或家庭)会使用它。
虽然每一种产品都是不同的,但它们的兴起方式具有共性。大多数技术的传播遵循“逻辑曲线”或S型曲线。一开始,一项技术的普及是缓慢的。早期的使用者会对它进行实验,而生产者会研究到底该生产什么以及如何定价并逐步提高产能。在某一时刻,产品到达一个拐点,它的传播速度迅速增加。因此,曲线的前两部分看起来像一个经典的指数曲线,一开始增长缓慢而令人感到乏味,随后曲线迅速升高而令人兴奋。然而,与纯粹的指数曲线不同,S型曲线有一个极限。毕竟,一个家庭能拥有的汽车和洗衣机数量是有限的。随着市场达到饱和,这种需求会逐渐减少:没有数码相机或手机的家庭会越来越少,或者说只有非常少的几家钢铁制造商没有采用电弧炉来炼钢。图中陡峭的部分开始变平。换句话说,这种技术传播模式看起来像一个起伏不那么明显的S型。
有时候,市场饱和的终点远比所有人预期的要远。1974年,比尔·盖茨称他的愿景是“每个家庭的每张桌子上都有一台计算机”。那时候,全世界所有类型的计算机加起来不到50万台。在世纪之交,计算机的数量超过了5亿台,距离欧洲或美国的家庭每家一台的目标还有一点差距。然而,在几十年的时间里,一个普通的西方家庭会拥有6台计算机,如智能手机、家庭计算机、现代电视和像亚马逊的Alexa这样的智能扬声器。一个喜欢电子设备的家庭拥有的计算机数量很容易突破两位数。
总的来说,当时的发展趋势仍然符合S型曲线模型描述的特征。然而,当你面对指数型技术时,它们在S方向的加速度是惊人的。几十年间,市场达到饱和的过程一直在加速,这种不断加快的变化速度对任何生活在美国的人来说都是显而易见的。1920年出生的人可能活不到55岁,可能见证了登月。除了原子弹、太空飞行等少数例外情况,在他们所生活的时代,汽车、电话、电视、洗衣机、电动车和抽水马桶等产品背后的技术是稳步发展的。 有些产品的发明相对较早,比如1946年就问世的微波炉,到了20世纪70年代依然非常稀有。
对出生在摩尔定律提出后的时代的人来说,情况就不同了。新产品推出的速度要快得多,其中由数字基础设施驱动的技术的发展速度是最快的。社交媒体在美国市场达到70%的渗透率用了11年,而在此期间,社交媒体引入后,人的平均寿命超过了77岁。所以,社交媒体从出现到达到市场饱和的时间是人类平均寿命的14%,相比之下,电力技术的渗透过程用时为人类平均寿命的62%。以智能手机推出时的人类平均寿命为基准,它的普及速度比当年的电话快12.5倍。
图1-2更加直观地表达了这一点。图的右边是20世纪早期的关键技术:电话、电力和汽车。每一种技术都是在世纪之交引入的,花了30多年时间才进入3/4的美国家庭,当时美国人的平均预期寿命约为50岁。图的左边是我们这个时代的首批指数型技术,它们都是由不断增长的算力支撑的。这些技术用了8~15年进入2/3的美国家庭,此时美国人的平均预期寿命超过75岁。这不仅仅是因为现在的技术规模比过去要大,还因为它们的发展速度在不断增加。
图1-2 主要技术在美国的渗透所花费的时间
资料来源:Horace Dediu,Exponential View analysis。
换句话说,技术——特别是数字技术的传播速度,比以往任何时候都要快,这个过程越来越快。 摩尔定律时代的生活是由技术的指数型传播来定义的。
这种加速已经持续了半个世纪,只是在最近一二十年才变得明显起来。以社交媒体为例,世界上第一个基于互联网的社交网络是SixDegrees。1997年,我是在它推出后几天加入这个社交网络的。Friendster和领英都出现在2003年,我是它们最早期的1 000位会员中的一个。同年晚些时候,MySpace也加入了它们的行列。MySpace迅速成长,成为这个新兴行业的巨头,其在鼎盛时期拥有1.15亿名用户。但证明数字技术能够以惊人速度增长的是Facebook。自2004年2月Facebook推出以来,它成为历史上增长速度最快的产品之一,在短短15个月内便积累了首批100万名用户,其创始人马克·扎克伯格如今拥有全球最受欢迎的产品。截至2019年年底,Facebook拥有25亿名用户。然而,如今Facebook的增长速度看起来确实有些奇特。
Witness Lime于2017年1月在旧金山成立,是一家为城市居民提供别具特色的绿色电动滑板车和自行车服务的公司。你只需在智能手机上按下一个按钮,就可以租赁一辆自行车(按分计费)。虽然Witness Lime的业务在一辆自行车上整合了全球定位系统(GPS)、全球移动通信系统(GSM)连接、充电、维护和跟踪等功能,比Facebook的业务复杂得多,但仅用了6个月,Witness Lime就完成了100万次骑行服务;又过了7个月就达到了1 000万次。 [5] 这一切都得益于计算革命。由于成本已经下降了很多,因此Witness Lime可以将一台小型计算机和GSM发射接收机装进它运营的数十万辆自行车中的每一辆。
数字技术日益快速的增长并不局限于美国。KakaoTalk是韩国领先的社交网络,类似于微信或WhatsApp。2016年1月,该公司决定成立一家银行。在两周内,200万韩国人(约占韩国总人口的4%)在这家银行开设了账户。到了2019年夏天,已经有超过20%的韩国人在这家银行开设账户。 [6] 当我们开始能够熟练使用一种快速增长的指数型产品时,又会有新的此类产品出现。以短视频社交平台TikTok为例,它从鲜为人知的服务提供商发展成为全球累计下载次数最多的应用软件,只用了几个月时间。随之而来的是空前的销售额增长。
TikTok的母公司字节跳动在报告中称,2018年销售额为70亿美元,两年后,其收入增长了5倍多。5年前,Facebook的收入也超过了70亿美元。相比之下,在接下来的两年里,它的收入仅增长了2倍。 [7] 这种加速似乎具有传染性。
这才是摩尔定律真正泽及后世的地方。硬件的性能不断增加,价格不断下降,这有力地保障了数字技术的发展。芯片的算力多年来都是按照每年50%或更高的速度递增,符合指数型增长的特点,而对应的成本却微不足道。这种成本上的超级通货紧缩创造了更大的可能性,使新产品反过来可以更快地传播,从而使整个过程持续加速。
21世纪初,一些技术专家注意到单位芯片上的元器件数量的增长速度开始放缓。这不足为奇,并不是所有技术都呈指数型增长。今天,汽车的行驶速度比第二次世界大战结束时快不了多少。现代客机的飞行速度约800千米/时,这比20世纪50年代第一架客机约753千米/时的飞行速度快不了多少。
一个强有力的例子表明,我们目前的芯片设计方法已经接近极限。科学家开发了越来越复杂的过程来满足摩尔的预测。随着晶体管变得越来越小,人们需要越来越精密的机器来制造它们。今天的半导体工厂依赖极其复杂的激光技术,最先进的激光设备每台的成本超过1亿美元。与此同时,工厂空气条件方面的任何微小变化都会对微型晶体管的生产构成严重威胁,一粒尘埃就能毁掉一块硅片。因此,制造芯片的房间是当今世界上最平稳的,它们坐落在大量的防震减震器上。这些房间也是最干净的,空气面积有时接近19万平方米,通常每小时要净化大约600次。相比之下,医院手术室的空气每小时只需要净化15次。
这就是我们强调摩尔定律是一个社会事实而不是一个物理定律的原因:半导体行业一直在拼命遵守该定律,使其成立。一些经济学家估计,从1971年到2018年,为了使摩尔定律成立,相关研究的数量增加了18倍。半导体晶圆厂的建设成本以每年约13%的速度增长,最近的建设成本为150亿美元或更多。 [8]
尽管该行业付出了巨大努力,但到了21世纪第二个10年结束时,每个芯片上晶体管数量的增长速度开始放缓。就像大热天汗流浃背的通勤者聚在一起会使地铁车厢内的温度升高一样,这些亚微观电路散发的热量也会相互影响。每个微型晶体管产生的热量会传递到邻近的电路中,使其变得不稳定。芯片工程师发现这个问题越来越难以解决。更重要的是,现代晶体管非常小,只有几个原子那么大,它们可能很快就会表现出令人毛骨悚然的量子物理行为。当粒子足够小的时候,它们会表现出波的特性,这意味着它们可以穿过物理障碍,出现在不该出现的地方。摩尔定律将会被量子态的电子所颠覆。
但这并不意味着算力的增长将会减速,计算革命并没有放缓的迹象。世界领先的技术研究者雷·库兹韦尔(Ray Kurzweil) 提出了一种技术发展理论,试图解释其中的原因。他说,根据他所谓的“加速回报定律”,技术往往会加速发展。库兹韦尔提出的理论的核心是一个正反馈循环。有了高性能计算机芯片,我们可以处理更多数据,从而了解如何制造更好的计算机芯片,与此同时,我们可以利用这些新的芯片来制造更好的芯片,然后重复这个过程。在库兹韦尔看来,这个过程在不断加速:每一代技术的回报都高于上一代,这些技术甚至会互相影响。
然而,库兹韦尔的理论的关键部分并不是针对某一项具体的技术的,比如汽车或微芯片,其重点是不同的技术如何相互作用。库兹韦尔见解独到,他指出了技术的指数型发展实际上与单个发明所取得的进步无关,甚至与单个经济领域无关。事实上, 技术发展之所以呈现指数形态,得益于数十种不同技术的协同发展和持续的相互作用。
还记得德迪欧的数据中的S型曲线吗?当一项技术最初被创造出来时,它的发展和传播遵循一个渐变的梯度,这代表缓慢但有意义的进展。然而,到了某个节点,这项技术的发展速度开始增加。随之而来的就是快速扩张,直到某一阶段,技术的发展势头逐渐消失,曾经接近垂直的上升曲线现在成了水平的。
然而,在库兹韦尔看来,任何时候都有多种技术遵循S型曲线的发展模型。当一条S型曲线达到它的高点时,另一条曲线就会出现。当第一条曲线开始变平时,更新一点的技术正好接近其加速发展的拐点,并开始呈爆炸性增长之势。而且,最重要的是,这些不同的技术相互助力,因此一个领域的创新可能会促进另一个领域的发展。 当一种技术达到其潜力的极限时,一种新的技术范式就会应运而生,以弥补当前技术的不足。其结果是,哪怕单项技术的发展持续放缓,在整个社会范围内,技术进步的步伐仍在加快。
这一理论对计算机的未来有着深远的影响。虽然摩尔定律所描述的范式已经达到了它的极限,但总的来说,算力还没有达到极限。我们总能找到一些新的方法来满足用户不断增长的需求。只不过,未来增加的算力可能依靠的不是在芯片上塞入更多晶体管。
到目前为止,库兹韦尔的理论是站得住脚的。在21世纪初的那几年,许多工程师认为摩尔定律预设的发展已经接近物理极限,差不多在同一时间,技术的发展达到了一个临界点。最终,因为有足够的数据和足够的算力,人们开发了一种新的技术范式——人工智能。它促成了一种全新的思考算力的方式,一种突破早期芯片设计局限的方法。
自古以来,人类就在思考构建人工智能的可能性。根据人工智能领域经典教材的作者斯图尔特·罗素(Stuart Russell)的观点,如果一台计算机能够为实现其目标而采取相应的行动,就可以认为它是智能的。 [9] 最重要的是,一个人工智能软件需要能够做出某种决策,而不是盲目地遵循程序代码限定的每一步。
1955年,计算机科学家约翰·麦卡锡(John McCarthy)创造了“人工智能”一词后,研究人员就着手建造这样的“智能”机器。在接下来的60年里,人工智能的研究进展变缓。这一领域的研究者一开始就犯了许多错误,那些看似重要的突破使人们对这项技术产生了过高的期望,而期望落空后,人们倍感沮丧。这项技术的关键阻碍是缺乏数据和算力。几十年来,许多科学家认为,人工智能的任何重大突破可能都要通过一种叫作“机器学习”的方法来实现。这种方法需要收集关于某个问题的大量信息,并使用算法来识别循环模式。例如,你可以通过向人工智能展示1 000万张猫和狗的照片,并明确告诉它哪些是猫,哪些是狗,从而教会它区分猫和狗。最终,“模型”将学会区分猫和狗的图片。但当时,我们还是缺乏实现机器学习潜力的数据和算力。由于需要处理大量数据,这种方法有赖于海量的信息和高成本的计算。在当时,这样的信息量和算力还不存在。
然而,到了2010年之后的几年,这种情况开始发生变化。普通人开始在互联网上分享自己生活中的照片,由此产生了海量数据。起初,人工智能研究人员并没有意识到这些数据的重要性,改变这一状况的人是斯坦福大学的李飞飞教授。在斯坦福大学工作的李飞飞是一名计算机科学家,专门研究神经科学和计算机科学的交叉领域,她对人类如何感知物体特别感兴趣。她的想法是用数字技术绘制尽可能多的真实世界的物体,以提高人工智能的性能。2009年,她发起了ImageNet项目,历时5年多,仅凭一己之力就推动了人工智能的大爆发。该网站精心收集了14 197 122张图片,全部都用标签进行手工标注,比如“蔬菜”“乐器”“运动”,当然还有“狗”和“猫”。这个数据集成了年度竞赛的基础,以便找到最一致和最准确地识别物体对象的算法。多亏了ImageNet,研究人员在短时间内获得了海量高质量的标签数据。
伴随着海量数据的出现,算力也出现了爆炸式增长。2010年,摩尔定律催生了足够强大的能力,从而促进了一种新的机器学习——“深度学习”的出现。深度学习需要以人类大脑的基础细胞为模型,创建多层人工神经元。科学家早就预言这些“神经网络”将成为人工智能领域的下一件大事。然而,它们一直受算力不足的制约。不过现在情况已经发生改变。2012年,包括亚历克斯·克里切夫斯基(Alex Krizhevsky)、伊尔亚·苏茨克维(Ilya Sutskever)和杰弗里·辛顿(Geoffrey Hinton)在内的一群顶尖人工智能研究人员,开发了一种“深度卷积神经网络”,将深度学习应用于长期以来人工智能一直难以完成的图像分类任务。它根植于非凡的算力。这个深度卷积神经网络包含65万个神经元和6 000万个参数,这些参数可以用来调整系统。这改变了游戏规则。克里切夫斯基的团队将自己的这个发明称为AlexNet,在它出现之前,大多数参与ImageNet竞赛的人工智能模型以失败告终,多年来成功率从未超过74%。而AlexNet的成功率高达87%,这表明深度学习是有效的。
深度学习的成功引发了人工智能的疯狂竞赛。科学家们纷纷构建人工智能系统,将深度卷积神经网络及其衍生模型用于解决一系列问题:从发现制造过程中的缺陷到语言翻译,从语音识别到信用卡诈骗检测,从新药发现到视频推荐。投资者们急切地打开钱袋支持这些发明家。很快,深度学习的应用就无处不在了。因此,神经网络需要越来越多的数据和处理能力。2020年的神经网络GPT-3,拥有1 750亿个参数,是AlexNet参数数量的3 000多倍,它的文本写作水平有时候甚至超过普通人。
但如果新的计算方法是人工智能,那么它的驱动因素是什么呢?2012年至2018年,用于训练最大的人工智能模型的算力增长速度比摩尔定律预测的增长速度快了约6倍。图1-3显示了在同一时期内,与摩尔定律对应的指数曲线相比,最先进的人工智能系统算力的增长情况。如果人工智能对算力的需求遵循摩尔定律,那么相应的算力需求将在6年内增长约7倍,然而事实上,算力增长了30万倍。
图1-3 人工智能使用的相对算力与摩尔定律预测的情况
资料来源:Open AI、Exponential View analysis。
这是一个令人眼花缭乱的统计数据,但库兹韦尔几十年前发现的过程可以准确地对它进行解释。就在我们遇到旧方法的极限,也就是无法再将更多晶体管塞到一块芯片上时,科学家想出了一种新的解决方案,找到了一种略有不同的方法。
这个解决方案就是使用不同类型的芯片。像克里切夫斯基这样的人工智能研究者,会使用专为绘制电子游戏高端图形而设计的计算机芯片来取代传统的计算机芯片。在日常计算中,我们不会使用这样的芯片,但事实证明,它们非常适合人工智能场景。特别是,这类芯片在数学计算方面表现非常出色。为电子游戏制作逼真的场景所需的计算涉及许多乘法运算。要让一个复杂的神经网络工作起来,需要执行数百万次乃至数十亿次这样的乘法运算,因此这些图形芯片能胜任这项任务。
随着这类芯片的市场需求日益增加,计算机行业开始迎接挑战。人工智能开发人员需要更强大的算力,而只有专业级芯片才能提供这种算力。像美国加利福尼亚州的Cerebras和英国的Graphcore这样的公司开始专门为高速运行神经网络制造芯片。
结果是,算力一直呈指数型增长,摆脱了摩尔定律的束缚。这一定律是由微型化驱动的,即通过在更小的设备中放置更多晶体管来实现的。但如今的人工智能芯片不再依赖于越来越微缩化的工程技术。事实上,有些芯片是由更大的组件组成的。笔记本电脑中的那类处理器,元件之间大约间隔7纳米,在一根头发的宽度上可以放置大约3 000个这样的元件。Graphcore公司设计的专业人工智能芯片规格为16纳米,相当于在每根头发的宽度上安装1 300个元件。
这意味着在可预见的未来,算力将呈指数型增长。如果事实最终证明,我们的新型芯片无法满足社会对算力不断增长的需求,那么等待我们的将是一种全新的方法——量子计算。 [10] 在经典计算中,信息的基本单位是位,即二进制数字。在量子计算中,信息的基本单位是量子位,而量子位反映了量子物理的基本数学特点。位的二进制性质决定了它必须是0或1,而量子位可以同时表示0~1的所有值。
像专业的人工智能芯片一样,量子计算机并不适合大多数类型的计算,但它们可以解决关键问题。例如,科学家希望借助量子计算机制造氮肥,而不会向大气中释放大量二氧化碳。这就需要模拟生成新型分子,将其作为化肥生产过程中的催化剂。传统的计算机需要数十万年的时间来模拟这些分子,而一台量子计算机大约需要一天的时间就能完成模拟过程。
据报道,在2019年10月的一项实验中,谷歌的一台原型量子计算机在200秒内完成了计算测试。如果用最新型经典超级计算机进行同样的测试,需要大约10 000年才能完成。这台量子计算机原型的处理速度比经典超级计算机的处理速度快10亿倍以上。
换句话说,到目前为止,库兹韦尔的观点是对的。当一种技术范式已经失去动力时,新的替代方法就会被开发出来,所以当我们接近一种方法的极限时,另一种方法就会取代它。无论何时,当任何一项技术遇到硬性限制时,有创造力的人们就会利用新技术解决这个问题,这些新技术可能来自邻近的行业和学科。
如果这个理论在总体上是正确的,那么它特别适用于计算。从ZX81到谷歌的量子计算机原型,在过去的半个多世纪里,计算机的运行速度大大提高了。这种指数性没有显示发展放缓的迹象,随着计算机运行速度的提高,新的技术范式将会发展。当一种方法将潜力发挥到极致时,另一种方法就会出现,来弥补当前方法的不足。
从这个意义上来说, 计算技术是指数时代的先兆,是第一个显现这种显著变化速度的技术。它向我们展示了当技术加速发展、性能变得更好、价格变得更便宜,并随之创造了一个个完整的行业时会发生什么。
但计算机并不是唯一的指数型技术。在许多行业,技术正在以越来越快的速度改进,而且引发了巨大变革。社会、经济和政治力量的共同作用正在推动这些技术的加速发展。我们接下来要讨论的就是这个范围更广的加速过程及背后的原因。
[1] G. E. Moore,“Cramming More Components onto Integrated Circuits,” Proceedings of the IEEE , 86(1), 1965, pp. 82–85.
[2] Cyrus C. M. Mody, The Long Arm of Moore’s Law: Microelectronics and American Science , Inside Technology (Cambridge, MA: The MIT Press, 2017), pp. 5 and 125.
[3] Dan Hutcheson,“Graphic: Transistor Production Has Reached Astronomical Scales,” IEEE Spectrum , April 2, 2015.
[4] James W. Cortada, The Computer in the United States: From Laboratory to Market (Armonk, NY: M. E. Sharpe, 1993), p. 117;其中,有95%的计算机出现在美国。“Early Popular Computers, 1950—1970,”Engineering and Technology History Wiki.
[5] Alex Wilhelm,“Charting Bird and Lime’s Rapid Growth,” Crunchbase News , September 20, 2018.
[6] Charlotte Burgess,“Future Banking: Creating an‘Incumbent Challenger’,” Finovate , 2020.
[7] Azeem Azhar,“Big Ideas for 2021; China’s Civil-Military Fusion; Tesla’s Infrastructure Advantage; the Climate Decade; Elephant Body Fat & Hegelian Enjoyment ++ #307,” Exponential View .
[8] David Rotman,“We’re Not Prepared for the End of Moore’s Law,” MIT Technology Review , February 24, 2020.
[9] Azeem Azhar,“Beneficial Artificial Intelligence: My Conversation with Stuart Russell,” Exponential View , August 22, 2019.
[10] Charles E. Leiserson et al.,“There’s Plenty of Room at the Top: What Will Drive Computer Performance after Moore’s Law?” Science 368(6495), June 2020.