1979年6月,我从康奈尔大学顺利毕业,并拿到了电机工程专业的学士学位。当时的我对人生还没有任何像样的打算。我在位于俄勒冈州波特兰市的英特尔工业园找了一份工程师的工作。那时,微型计算机产业如日方升,而英特尔公司正处于该领域的核心位置。单板机是英特尔当时的主要产品(得益于英特尔发明的微处理器,把整个计算机置于单个电路板上的想法在当时刚刚成为可能),而我的工作,就是分析并解决由其他工程师发现的单板机上的问题。其间,我发表了一篇业务通讯。由于常常在外奔波,我有机会结识到各种各样的客户。尽管很思念在辛辛那提工作的大学女友,但那时的我还年轻,日子过得很快活。
几个月后遇到的一件事,改变了我的人生方向。那是当年9月新出版的一期《科学美国人》,一整本都是对大脑研究的介绍。这期引人入胜的杂志,重新点燃了我在少年时代就萌发的对大脑的兴趣。我从中了解到了大脑的组织、发展和化学特征,还有视觉、运动和其他人类专长的神经机制,以及精神失常的生物学基础。这是有史以来最棒的几期《科学美国人》之一。一些与我交流过的神经科学家告诉我,这期杂志对他们的职业选择影响巨大——对我也是一样。
该期杂志的最后一篇文章——《关于大脑的思考》,由DNA结构的发现者弗朗西斯·克里克撰写。他那时已经转投大脑研究领域。克里克认为,尽管科学家们对于大脑的细节知识已有大量积累,但大脑的工作原理仍然是一个极大的谜题。科学家通常会避免去写他们所不知道的事物,但克里克就像那个指出皇帝没有穿衣服的小男孩一样,对此毫无顾忌。克里克宣称,神经科学只是一堆没有任何理论的庞大数据。他的原话是:“明显缺乏一个大的理论框架。”在我听来,这就像是一位英国绅士以委婉的措辞表示:“我们对此事完全摸不着头脑。”在当时,这是句大实话,即便到了今天,也仍然不假。
克里克的话就像是一声集结号,将我研究大脑和建造智能机器的人生梦想就此唤醒。虽然当时我已远离了学校,但还是毅然决定转行。我开始计划研究大脑,不光要了解它的工作原理,还要以这些知识为基础,发展新技术来构建智能机器。但将这一计划付诸行动,仍需要一些时间。
1980年的春天,我被调至英特尔驻波士顿的分部,与我后来的妻子团聚了。她那时刚开始攻读研究生。我一边负责给客户和员工讲解如何设计微处理器系统,一边已将目光投向了另外的目标:寻找发展大脑理论的办法。工程师的直觉告诉我,一旦破解了大脑的工作原理,便可以依葫芦画瓢地造出它们。而用来建造人工大脑的天然材料就是硅。考虑到我所供职的英特尔公司发明了硅内存芯片和微处理器,我想也许能说服公司,允许我将部分时间用于有关智能的研究和设计仿生大脑的记忆芯片上。于是我给英特尔当时的董事长——戈登·摩尔(Gordon Moore)去了一封信,内容大致如下:
亲爱的摩尔博士:
我提议我们公司成立一个专门研究大脑工作原理的小组。该工作可先从一个人(即我本人)开始,以后逐步发展壮大。我有信心我们能干成这事。相信在未来,它将给咱们带来巨大的商机!
杰夫·霍金斯
摩尔看了信后,把我介绍给了英特尔公司的首席科学家特德·霍夫(Ted Hoff)。我飞到加州同他会面,并重申了我的建议——研究大脑。霍夫在两个领域作出了卓越的贡献:一是设计发明了第一台微处理器,二是对早期的神经网络理论作出了出色研究。当时我仅知道前一桩,而对后一桩并不知晓。霍夫曾在人造神经元及其应用潜力方面进行过研究,但我对这一情况毫无准备。听完我的建议后,他表示并不相信人类在可预见的将来能够弄清大脑的工作原理,因此没有道理让英特尔支持我。我不得不说,他是对的,因为25年后的今天,我们才刚刚开始在理解大脑的道路上有所迈进。在商界,时机决定着一切。不过当时我仍然感到很失落。
我原打算寻求一条捷径来实现目标,在英特尔公司研究大脑本该是最便捷的。既然此路不通,我只好退而求其次,决定去申请麻省理工学院(Massachusetts Institute of Technology, MIT)的研究生。该学院一向以在人工智能方面的研究著称,这对我将来的研究之路大有助益。初看之下,我似乎完全具备申请条件:在计算机科学方面接受过广泛训练——符合;渴望建造智能机器——完全符合;想先从研究大脑开始,了解它的工作原理……呃,等一下,好像有哪里不对了。这最后一项——弄清大脑如何工作,在MIT人工智能实验室的科学家眼里,是“不可能完成之任务”。
我仿佛一头撞在了南墙上。当时的MIT是人工智能领域的航母。在我申请的同时,大批有才华的头脑正向这里汇聚,着迷于用计算机编程来产生智能行为。对于这些科学家来说,视觉、语言、机器人学和数学都只是编程的问题。既然计算机能够做到大脑所做的一切,甚至更胜一筹,那么我们何必再用大脑这纷繁芜杂的生物性机理来束缚住我们的思想呢?他们认为研究大脑会限制思想,而更好的办法是研究数字计算机所能表现的计算能力的极限。他们的“圣杯”便是编写能够与人脑媲美并最终超越人脑的计算机程序。他们采取了一种以结果来验证手段的研究方法,而对真实的大脑如何工作毫不关心,有些人甚至为自己绕开了神经生物学而沾沾自喜。
正是这一解决问题的错误方式深深震撼了我。直觉上,我认为人工智能的方法不仅无法创造出能模仿人类行为的程序,它甚至也不能告诉我们智能是什么。计算机和人脑的工作原理完全不同,一个只是被编出来的程序,另一个则拥有自我学习的能力;一个必须做到绝对完美才能运行,另一个则天生能够灵活应对,对失误有容忍度;一个具有中央处理器,另一个则不存在中央控制。类似的差别不胜枚举。我之所以认为计算机无法实现智能,最重要的原因是,我从晶体管层面上理解计算机的工作原理,而这些知识令我产生了一种直觉,即大脑与计算机在本质上完全不同。我无法证明这一直觉,但它之于我,就像人们凭直觉所能确定的任何事一样。最终我得出了结论:人工智能领域的研究或许会催生出有用的产品,但它绝不会建造出真正意义上的智能机器。
与人工智能相反,我想要做的是了解真正的智能和知觉,研究大脑的生理学和解剖学基础,响应弗朗西斯·克里克所提出的挑战,构建一个能解释大脑工作原理的大框架。我把目光投向了大脑的新皮层——哺乳动物的大脑在进化中最新发展出的部分,也是智能的产生之处。只有在认识了新皮层的工作原理之后,我们才能够开始建造智能机器。
遗憾的是,我在MIT的教授和同学中从未遇到知音。他们认为,理解智能和建造智能机器,根本不需要去研究真正的大脑——他们确实是这么说的。1981年,MIT拒绝了我的申请。
今天,许多人认为,人工智能领域仍然是一片生机,只待计算机拥有足够的计算能力,便可以兑现其许下的种种承诺。按照这一思路,一旦计算机拥有足够的内存和强大的处理器,人工智能的程序员们便能够制造出智能机器。我不同意这一观点。人工智能领域存在着一个根本性的错误:它无法充分解释智能是什么,也无法回答理解事物的能力究竟意味着什么。简要回顾一下人工智能的历史及其建立时的信条,我们就能够看出它是如何偏离正确轨道的。
人工智能的方法是伴随数字计算机的出现而诞生的。早期人工智能运动中的关键人物,英国数学家阿兰·图灵(Alan Turing),也是“通用计算机”这一想法的提出者之一。他的卓越贡献在于正式提出了“通用计算”的概念:尽管建构的细节存在差异,但从原理上来说,所有的计算机都是相同的。他设想了一个虚拟机器来证明这一点。这个机器由三部分组成:一个处理盒、一条纸带以及一种能从纸带上读取和写入标记、并能来回移动的装置。纸带是用来存储信息的——就像大家熟知的计算机代码1和0一样(当时内存和硬盘还未发明,图灵想象用纸带来存储信息)。处理盒,即今天所谓的中央处理器(CPU),遵循一套固定的规则从纸条上读取和编辑信息。图灵从数学层面上证明,如果为CPU选择了一套正确的规则,并给予它无限长的纸带,这台机器便能够运行宇宙中任何可定义的操作。它可能相当于现在被称为“通用图灵机”的众多机器之一。无论是计算平方根、计算弹道轨迹、玩游戏、编辑照片,还是银行对账,其底层皆是1和0代码,任何一台图灵机都可以通过编写程序来解决这些问题。无论采用何种形式,信息处理就是信息处理。所有的数字计算机在符号逻辑上是等价的。
图灵结论的正确性无可辩驳,在应用上亦富有成效。计算机革命及其所有成果都以此为基石。随后,图灵转向了如何建造智能机器这一问题。他一方面感到计算机可以拥有智能,另一方面却不愿被卷入对其可能性的争论之中。由于认为自己无法给智能一个正式的定义,他甚至没有作出尝试。取而代之的是,他提出了一个证明智能存在的方法,即著名的图灵测试:如果一台计算机能够骗过人类询问者,诱使他相信它也是人类,那么从定义上来说,这台计算机就拥有智能。以此测试作为检测工具,以图灵机作为媒介,图灵就这样帮助开创了人工智能领域。这一领域的信条是:大脑不过是另一种类型的计算机。因此,只要能让人工智能系统产生与人类相似的行为即可,如何设计它并不重要。
人工智能的拥护者们看到了计算机和人类思维之间的相似之处。他们说:“你看,人类智能行为中最令人印象深刻的,莫过于对抽象符号的操纵——这一点计算机也可以。当我们在说和听的时候,大脑里发生了什么?我们正是在使用恰当的语法规则操纵着被称为词的心理符号。下棋时呢?是在使用抽象的心理符号来表征各个棋子的属性和位置。看东西时又是怎样呢?我们用抽象心理符号来表征对象的位置、名称和其他属性。当然,人们用以完成这一切的是大脑,而不是我们所建造的各种计算机,但图灵已经表明,如何实现或操纵这些符号并不重要。你可以使用齿轮、电子开关系统或大脑中的任何神经元网络做到这一点,只要你的媒介可以实现与通用图灵机相同的功能。”
这一假设得到了一篇极富影响力的科学论文的支持。该论文于1943年由神经生理学家沃伦·麦卡洛奇(Warren McCulloch)和数学家沃尔特·皮茨(Walter Pitts)共同发表。在论文中,他们描述了神经元如何能够执行数字功能——神经细胞如何以可理解的方式复制计算机的核心形式逻辑。该想法认为,神经元能够像电脑工程师们所谓的逻辑门一样工作。逻辑门能够实现简单的逻辑运算例如and、not和or,计算机芯片即是由数百万逻辑门连接在一起而组成的精确、复杂的电路,CPU就是逻辑门的集合。
麦卡洛奇和皮茨指出,神经元也可以被连接在一起,以精确的方式执行逻辑功能。神经元彼此之间收集信息输入并加以处理,来决定是否发放输出信息,由此可以想象,神经元可能是活生生的逻辑门。他们推断,大脑可能是由神经元所搭建的and、or等逻辑门和其他逻辑元件构成,就像数字电路一样。我们不清楚麦卡洛奇和皮茨是否真的认为大脑是这样工作的,他们只是说,有可能是这样。而且从逻辑上讲,对于神经元的这种观点亦不无可能。从理论上讲,神经元可以实现数字功能。然而,没有人去追问,神经元在大脑中究竟以何种方式相连。尽管缺乏生物学上的证据,他们依然将这一理论作为“大脑只是另一种计算机”的证据。
还有一点值得我们注意的是,在20世纪上半叶,人工智能的理念得到了心理学中一个占主导地位的流派的支持,这一流派被称为行为主义。行为主义者认为,大脑内部的运作机制是不可知的,他们将大脑称为“密闭的黑盒子”。但是人们可以观察和测量动物的环境和它们的行为——它们感受到了什么、做了什么,它们的输入信息和输出行为分别是什么。他们承认大脑具有反射机制,可用于训练动物形成条件反射,通过奖励和惩罚令它们学会新的行为方式。但是,除此以外,没有任何必要去研究大脑,尤其是那些混乱的主观感受,如饥饿、恐惧,或者理解某件事物的意义。不用说,这一研究理念最终在20世纪后半叶消亡了,然而人工智能领域却在很长一段时间内仍滞留于此。
二战结束后,电子数字计算机有了更广泛的应用,人工智能的先驱们纷纷卷起袖子开始了编程。实现语言之间的翻译?简单!就像破译密码一样,只需要将系统A的每个符号映射到系统B中的对应部分即可。处理视觉图像?似乎也不难。我们已经了解了处理图像旋转、缩放和位移的几何定理,而且能够轻松地将它们编成计算机算法代码,至此已经事半功倍了。人工智能专家们煞有介事地宣布,计算机的智能将很快赶上并最终超越人类。
具有讽刺意味的是,最有可能通过图灵测试的,是一个叫作Eliza的程序,它能够模仿精神分析师,将你的问题重新表述成新问题来反问你。例如,如果你输入“我和我的男朋友不说话了”,Eliza可能会回应:“跟我说说你的男朋友吧!”或者“是什么原因让你同你的男朋友不再说话了呢?”尽管它只是个被当成玩笑设计出来的无聊程序,但还是成功地骗过了不少人。也有一些正正经经设计出来的程序,比如积木世界(Blocks World),它模拟出一个包括许多不同颜色和形状积木的房间。你可以向程序提问,例如“在大红色方块上面有一个绿色金字塔形的积木吗?”或者向它发出指令,例如“请把蓝色方块移动到红色的小方块上面”,它能回答你的问题,或者按照你的要求工作。这一切都是模拟的——也确实管用。然而它只局限在完全虚拟的积木世界里,程序员们无法将其扩展到实际的应用中。
与此同时,人工智能技术领域的一连串表面上的成功和相关新闻给公众留下了深刻的印象。最初引起人们兴奋的是一个能够解决数学定理问题的智能程序。自柏拉图以来,多步演绎推理就被视为人类智慧的巅峰,因此起初看来,人工智能就像中了头彩。然而结果证明,同“积木世界”一样,这个程序的能力也是有限的,它只能找出非常简单的定理,且都是一些已知定理。随后,一个名为“专家系统”的数据库引发了公众的巨大关注,它包含了能够回答人类用户所提问题的细节事实,比如,“医学专家系统”能够根据列出的症状来诊断患者的疾病。然而,它们再一次被证明作用有限,并且没有任何接近广义智能的表现。计算机程序还一度在棋盘类游戏中达到了专家水平,IBM的“深蓝”电脑对战国际象棋世界冠军加里·卡斯帕罗夫(Gary Kasparov)时的大获全胜曾经轰动一时。但是这些胜利毫无意义,因为“深蓝”电脑并非赢在比人类更聪明,而是赢在比人类快了几百万倍的运算速度上。“深蓝”没有直觉。人类象棋大师综观盘面,一眼就看得出棋盘上的有利和危险区域,而一台计算机对于这些重要信息没有天生的直觉,必须去试探更多的选择。除此之外,“深蓝”对于象棋的历史毫无概念,对自己的对手也一无所知。就像计算器能够做算术却不懂数学一样,“深蓝”能够下棋,但并不是真正了解象棋。
在任何情况下,再怎么成功的人工智能程序也只是擅长于它们被设定处理的特定领域。它们无法概括,也不具有灵活性,甚至连它们的创造者也承认它们不会像人类一样思考。一些起初被认为容易解决的人工智能问题最后都无功而返。至今仍没有一台计算机能够在语言理解能力上超过3岁的幼儿,或在视觉能力上超过一只老鼠。
多年的努力换来的只是无法兑现的承诺和不被认可的成果,人工智能逐渐开始失去它的光环。一些科学家转向了其他领域。初创公司纷纷倒闭,资金支持也越来越少。就连编写一段执行感知、语言和行为等最基本功能的程序似乎都是不可能完成的任务。这种状况到今天也没有改变。正如我先前所说,尽管仍有人相信人工智能所面临的问题能够通过运行更快的计算机来解决,但大多数科学家认为,以往所有的努力都存在问题。
我们不应该由此责难人工智能的先驱们。阿兰·图灵的确是伟大的。他们中的每个人都会告诉你,图灵机将要改变世界——它也确实改变了,但不是通过人工智能。
在申请MIT时期,我对于人工智能领域种种论断的怀疑进一步加深了。加州大学伯克利分校的著名哲学教授约翰·塞尔(John Searle)当时提出,计算机不是智能,也无法获得智能。为了证明这一点,1980年,他想出了一个被称为“中文屋”的思维实验:
假设有间屋子,墙上开了一条缝。屋里的桌子旁边,坐着一个会说英语的人。他手头有一本很厚的说明手册,还有足够用的铅笔和草稿纸。通过翻阅手册,他能够根据用英文写成的说明,来处理、排序和比较汉字。重点是,手册中的指令同汉字的含义没有丝毫关系,它们只负责解决汉字应如何被复制、删除、重新排序和转录等问题。
屋外有人从墙上的缝里塞进来一张纸,上面用中文写着一个故事和与之相关的问题。屋内的人对中文一窍不通,但他接过纸来,开始按照手册上的指令工作。这是一种生搬硬套的辛苦活儿,指令有时让他在纸上写下一些汉字,有时又让他移动或删除一些汉字。他按部就班地根据规则写写删删,直到指令告诉他工作已经完成为止。这时,他已经写出了一页新的汉字,这正是那些问题的答案,而他对此并不知情。按照指令,他需要将这页纸从缝中送出去。他照做了,心中却充满疑惑:这个乏味的游戏究竟是在做什么?
屋外,一个懂中文的女人读罢这页汉字后,表示答案完全正确——甚至还很有见地。如果你问她,这些答案是否出自于一个透彻地理解了故事的聪明头脑?她一定会说是的。但她说得对吗?是谁理解了这个故事?当然肯定不是屋里的人——他完全不懂中文,对这个故事一无所知。但也不可能是那本手册吧——它只不过是一本安静地躺在纸堆里的书。那么,理解是从何处产生的呢?塞尔的回答是:根本没有“理解”这回事——有的只是无须动脑地翻书和写写画画而已。现在让我们转向问题的关键:“中文屋”与数字计算机何其相似!屋里的人就相当于是CPU,只会无意识地执行指令;手册相当于向CPU下达指令的软件程序;而那些纸就是内存。因此,一台通过产生相同的人类行为来模拟智能的计算机,无论设计得多么巧妙,也不会具有理解能力和智能。(塞尔曾明确表示,他不知道什么是智能——这句话的言外之意是,不管智能是什么,计算机肯定没有。)
这种说法令哲学家和人工智能专家之间产生了巨大分歧。它催生了数百篇夹杂着尖刻言辞的相互攻击的文章。人工智能的捍卫者们提出了许多论据来逐条反驳塞尔,例如,他们声称:虽然屋子的各组成部分都不懂中文,但如果将其视为一个整体来看,它还是懂的;屋里的人是懂中文的,只不过他没有意识到这一点。在我看来,塞尔的说法是对的。当我谨慎思考过“中文屋”实验的论证和计算机的工作原理之后,我并没有看到任何地方有“理解”的产生。这让我坚信,我们需要弄清什么是“理解”,并为它下一个定义。这个定义应当能够清楚地告诉我们,什么样的系统是智能的,什么样的不是;什么样的系统懂中文,什么样的不懂。而仅仅凭借系统的行为,是无法进行判断的。
人并不需要刻意去“做”任何事来理解一个故事。我可以安静地读一个故事,虽然没有任何外显的行为表明我清楚地理解了,但至少对我而言,这是个事实。另一方面,你无法从我安静的行为上看出我是否理解了故事,你甚至无从得知我是否懂得这个故事的写作语言。虽然过后你可以向我提问,但我对故事的理解发生在我阅读之时,而非回答之际。本书的其中一个主题便是:理解是无法通过外部行为来测量的,相反,它是对大脑如何形成记忆并利用这些记忆来作出预测的一个内部度量。关于这一点,我们将在接下来的章节中谈到。“中文屋”、“深蓝”电脑和大多数计算机程序在这一点上有个相似之处,就是它们并不理解自己在做的事情。而我们判断一个计算机是否智能,除了通过它的输出(即行为)外,并没有别的途径。
人工智能为自己辩护的最终论据是:理论上讲,计算机能够模拟整个大脑。一台计算机可以模拟所有的神经元和它们之间的连接,一旦它做到这一点,就意味着大脑“智能”和计算机的模拟“智能”之间不再有任何区别。虽然这在实际中不太可能,但我同意这一看法。遗憾的是,人工智能的研究者们并没有模拟大脑,因此他们的程序没有智能。而在理解大脑如何工作之前,也无法去模拟它。
被英特尔和麻省理工学院拒绝之后,我一时不知该何去何从。当你不知下一步怎么走时,最好的办法就是原地驻足,耐心等待转机的出现。于是我继续在计算机行业工作。我在波士顿过得心满意足,一直到1982年,我的妻子想要移居加州,我们便举家搬了过去(这也是让摩擦最小化的办法)。我在硅谷的一个初创公司Grid Systems找到了工作。Grid发明了第一台笔记本电脑,这台美妙的机器后来成为了纽约现代艺术博物馆的第一个计算机藏品。我先后在市场部和工程技术部工作过,直到后来我发明了一种高级编程语言,它被我命名为GridTask。随着这个发明连同我本人对Grid公司越来越重要,我的职业生涯也渐入佳境。
直到那时,我仍然没有办法将对大脑和智能机器的好奇抛诸脑后。我像着了魔一样地渴望去研究大脑。我报名参加了一个人体生理学的函授课程,开始自学(还好函授学校不会拒绝任何人!)。在学习了一定的生物学知识后,我决定申请一个生物学的研究生项目,打算从生物科学内部去研究智能。如果计算机科学界不需要大脑研究的理论家,或许生物学界会欢迎一个计算机科学家。那时还没有理论生物学这一科目,尤其是理论神经科学,因此对我的兴趣来说,生物物理学是最相近的领域。我努力学习,参加了入学考试,准备了简历,恳请曾就职的公司写了多封推荐信,最后……瞧,我终于被加州大学伯克利分校接收,成为一名生物物理学的全日制研究生。
我欣喜若狂地想,这下终于可以开始认真地研究大脑理论了!我从Grid公司辞了职,也没打算再重回计算机行业。当然,这意味着无限期地放弃我的高薪。我妻子那时正纠结于“是时候买房生娃过日子了”,而我却心甘情愿地成为一个不能养家糊口的人。这对于我们来说,绝对不是一个容易的选择。但对我个人来说,它却是最好的选择,我的妻子也因此支持了我。
在我离开公司之前,Grid的创始人约翰·艾伦比(John Ellenby)将我拉进他的办公室,对我说:“我知道你并没有打算再回到Grid公司或者计算机行业,但谁都不知道未来会发生什么,对不对?你与其完全退出,何不就把它当个休假呢?那样的话,如果一两年之内你返回来,就可以按照你离开时的标准,重新领薪水,继续做你的职位,拿你的股份。”这是一个非常友好的姿态,我于是接受了他的建议。但我心里却明白,自己这次是要永远告别计算机行业了。