机器是世界具有潜在意识的大脑。
——杰拉尔德·李
关于“人工智能”(Artificial Intelligence,简称AI)的起源,比较公认的说法是1956年的达特茅斯会议(又名达特茅斯夏季人工智能研究计划,Dartmouth Summer Research Project on Artificial Intelligence)。与会者包括来自达特茅斯学院、卡耐基理工学院、普林斯顿大学、麻省理工学院等常春藤学府的多位大师级人物。这场群星闪耀的会议使得1956年成为人工智能元年。然而鲜为人知的是,在那之前,人工智能还有很多精彩的前奏。
“机器智能” 的思想早在1936年就在图灵那篇开天辟地的论文中初现苗头了。图灵1936年发表《论数字计算在决断难题中的应用》,这是迄今最公认的计算机科学的源头。在这篇论文中他对“可计算性”下了一个严格的数学定义,并提出一种抽象计算模型,这种模型后来被他的导师丘奇称为“图灵机”。
图灵机是用机器来模仿人类计算者 用纸笔进行数学运算的过程。计算所需的笔、草稿纸、运算规则,被对应为探头、无限长的纸带、内部状态转移表。
图灵机的强大能力在于,它的装置和规则是如此简单,却被证明与当时已经出现的各种高级计算装置等价。其中包括冯·诺依曼(John von Neumann)的细胞自动机、丘奇的λ演算、哥德尔的递归函数、Post系统、乔姆斯基0型语法等。哥德尔本人之前对自己的递归函数是不是最广义的甚至都不是很有自信,是图灵机的出现让他信服。事实上,丘奇—图灵论题(Church-Turing Thesis)提出,所有功能足够强的计算装置的计算能力都等价于图灵机。注意这只是个论题,并不是定理。但是图灵机的意义是不容置疑的,它使得原本晦涩的纯逻辑或数学的理论和物理世界有了联系,抽象和具象之间有了桥梁。这对AI尤其重要,因为它首先奠定了数学推理机械化的基调,激发了科学家们探讨让机器思考的可能性的热情。
图灵机
20世纪40年代和50年代,来自不同领域的科学家们开始探讨制造人工大脑的可能性。麦卡洛克(沃伦·麦卡洛克,Warren McCulloch)和皮茨(沃尔特·皮茨,Walter Pitts)1943年在《数学生物物理学公告》上发表的《神经活动中内在思想的逻辑与演算》(A Logical Calculus of Ideas Immanent in Nervous Activity),是神经网络的第一篇文章,让人们了解到计算机可以如人脑一样进行“深度学习”。这篇文章也是控制论的思想源泉之一。
左:沃伦·麦卡洛克,右:沃尔特·皮茨 |
图灵早在1941年就开始思考机器与智能的问题。1947年,他在伦敦皇家天文学会就机器智能发表演讲,1948年又将这次演讲整理成文,题为《智能机器》(Intelligent Machinery),作为英国国家物理实验室(National Physical Laboratory,简称NPL)的内部报告。同年,图灵回到母校剑桥大学国王学院兼职研究员,他本科时的导师纽曼(J. R. Newman)在曼彻斯特大学数学系担任主任。曼彻斯特大学电工系主任威廉姆斯(Frederic C. Williams)正在建造当时的另一台存储程序计算机Mark—1。当地报纸把这台机器叫作“Electric Brain”,这大概是计算机头一次被媒体称作“电脑”。纽曼试图让图灵过来帮威廉姆斯做Mark—1的软件,但被图灵婉拒了。他在私信里表示自己的兴趣已转向“如何构造大脑的动作”。关于“电脑”这个称呼,英国公众知识分子还辩论过是否合适,反对者之一就是图灵的好朋友——科学哲学家波拉尼(Polanyi)。波拉尼鼓励图灵把他的想法写成文章,就是那篇写于1950年的划时代论文——《计算机与智能》,发表在哲学杂志《心》上。
严肃的“机器智能”概念应该是1948年的这篇文章最早提出的。而1950年的文章使得“机器智能”的说法被更广泛地流传。麻省理工学院的机器人专家布鲁克斯认为图灵1948年的文章比1950年的更重要。1950提出的“模仿游戏”和“图灵测试”,在1948年文章末尾就已初见端倪,它是这样描述的:假设A、C为人类棋手,C处于一个独立房间,另一个房间里可能是A或者一台会下棋的机器。C需要判断与自己下棋的是人类棋手A还是机器。为了避免其他因素影响对C的判断造成干扰,另有B作为传递棋招的中间人。
图灵测试
图灵1950年论文第一部分标题是“模仿游戏”,A和B为一男一女,分别位于两个房间,C作为提问者,通过打印字条或者中介方式和两个房间进行通信。游戏结束时C需要区分出两个房间内人员性别。其中A的任务是诱导C做出错误辨识(撒谎或者其他误导信息),B的任务是帮助C(最好的策略可能是诚实回答)。图灵提出用机器来替代A。那么问题就可以变成,C能否区分与他交流的到底是人还是机器?这就是后人说的“图灵测试”。图灵认为,如果一台机器能够通过电传设备,与人类展开对话而不被辨别出其机器身份,那么这台机器就被认为具有智能。图灵文章随后回答了各种可能的针对这一假说的质疑。“图灵测试”的意义在于首次提出了人工智能的评判标准。
《模仿游戏》海报
电影《银翼杀手》中的维特甘测试(Voight-Kampff test)就来自图灵测试。为了区分人类和复制人,男主角德克向他们提问,观察回答、即时反应以及眼动等生理现象来判别他们是否是人类。此外,人们对机器人通过图灵测试的假想被拍成了电影《机械姬》,电影中机器人艾娃(Eva)伪装成无辜的被囚禁少女,骗过了测试员,成功实施“越狱”,并杀害了研制出自己的主人纳森(Nathan)。
《银翼杀手》中的维特甘测试 |
《机械姬》中Eva在接受图灵测试 |
“图灵测试”取得里程碑式的进展是在2011年,IBM的“沃森”超级计算机在美国的电视智力节目中击败了人类。
图灵在1950年文章的第七部分指出:Instead of trying to produce a programme to simulate the adult mind, why not rather try to produce one which simulates the child’s?与其赋予一个程序以人类的智力水平,不如让它像人类孩子一样拥有学习的特性。与其设计一个功能完备的计算机,不如创造一个“婴儿”计算机,让它从周围的原始数据中吸收信息,慢慢成长,越来越接近人类的能力。由此可知,机器学习的思想很早就出现了。
思考与实践
2.1 你还能回想起图灵机的组成部分么?它们分别有什么作用?
2.2 请用你自己的语言解释一下图灵测试。
除了图灵,在20世纪40年代和50年代,还有两位巨匠对人工智能的诞生做出了不可磨灭的贡献,他们就是诺伯特·维纳(Norbert Wiener)和克劳德·艾尔伍德·香农(Claude Elwood Shannon)。
最初人类试图用电子管制造计算机,这可以说是人类最天才的想法之一。这一灵感来自维纳——早在1940年,维纳就提出了数字计算实际上是类似开关的二值操作。根据贝尔实验室的研究,计算机内部机理应该是二进制的,这也是维纳提出的另一指导原则。在后来出版的《控制论》中,他对1940年提出的几项指导原则进行了更完备的数学推理。
维纳本人无疑是极具远见卓识的。在第三次工业革命尚未发生时,维纳就预测这场科技革命将引起人脑在简单思考和判断上的贬值,因为科技的更新换代会导致人类疲于思考。
维纳被称为“控制论之父”,也是行为主义学派的奠基人。他于1948年出版的《控制论》是自动控制、传播学、电子技术、无线电通信、神经生理学、心理学、医学、数学逻辑、计算机技术和统计力学等多种学科相互渗透的产物。在这本书出版之后的几十年,控制论思想渗透到几乎所有自然科学和社会科学领域中。维纳的控制论被认为是行为学派的起源。
在《控制论》中,维纳从“反馈”的角度揭示了“信息”和“控制”两者间的关系,尤其是负反馈,对自然环境的生态平衡、产业链的良序发展都有非常好的调节作用。信息被反馈到本体,从而使得本体能够控制自己的行动。例如老鹰捕猎兔子时,老鹰将看到的兔子图像传达到脑部,处理成它与猎物之间距离的信息,从而控制飞行轨迹。如果信息模糊或缺失,就不能实现有效控制。比如,倘若老鹰眼睛因为进了沙子等原因导致看不清,就不能捕获兔子。
维纳认为,反馈是控制论的基石。机器是否获得智能的标准是机器能否像生物一样,通过反馈控制自己。维纳的控制论对后来神经网络的发展有着很深远的影响。
1948年无疑是信息时代具有里程碑的一年。除了维纳的控制论,香农的《通信的数学原理》也于这一年横空出世,香农因此也被誉为信息论的创始人。在香农的这篇论文里,他首次提出用“比特”来表示二进制数位。和维纳不同,他用信息熵来阐述信息量。维纳本人认为香农的这篇信息论是受到他的影响,而香农认为维纳的这种错觉来源于其根本不了解信息论。
香农提出“信息就是不确定性的消除”这一基本论点,不仅适用于描述通信的过程,也适用于描述认知的过程:人类每次认知的结果,都是对于外界事物信息的不确定性的减少或完全消除。信息论的精髓在于将通信内容抽象为信息,赋予其数学的形式,将通信过程中的信息加工变为严格的数学运算。“消除不确定性”的关键在于对信源做数学变换,压缩其到接近甚至等于原始信源的信息熵。人类认知活动也是一种信息加工的活动,原则上说,也可以用严格的数学运算来加以描述。一旦这个运算认知活动的数学模型实现了,那么可以做复杂运算的计算机也可以模拟人类认知活动过程。
图灵、维纳、香农等人早期的关于计算机如何像大脑一样思考和工作的研究,给后世人工智能的出现和发展开创了先河。他们在各自领域研究机器智能并各有建树,最终让“电子大脑”成为可能。
20世纪50年代出现了许多早期的AI程序。我们重点认识一下一个名为“博弈论”的领域。
早在1947年,图灵编写了第一个下棋程序。几乎和图灵同时,冯·诺依曼也在研究计算机下棋,他和经济学家奥斯卡·摩根斯坦(Oskar Morgenstern)合作的著述《博弈论和经济行为》于1944年出版。该书被认为是经济学中博弈论研究的开山之作,正式奠定了现代博弈论的基础。
博弈论对人工智能有多重要呢?从已知的事实看,2016年AlphaGo战胜李世石 ,2017战胜柯洁 ,这与博弈论的策梅洛定理(Zermelo theorem of game theory)密不可分;2017年初,Libratus 在单挑无限注德州扑克(heads-up no-limit hold’em)人机对战中完胜人类选手,靠的也是非对称信息博弈。当看到这段话的时候,并不要求你对所提及以及即将出现的博弈论专业名词有多么了解,只需要知道博弈论有着举足轻重的作用就可以了。
如果你能坚持看完奥斯卡最佳影片《美丽心灵》,那么一定对男主角印象深刻。事实上,这部电影的主角确有其人,他的名字是约翰·纳什(John F. Nash)。纳什1950年的博士毕业论文“非合作博弈”(non-cooperative games)提出了一个重要概念,就是助其44年后取得诺贝尔经济学奖的“纳什均衡” 。他同年发表于《美国国家科学院院刊》(Proceedings of the National Academy of Sciences of the United States of America,简称PNAS)的著作Equilibrium Points in n-Person Games只引用了两条文献,其一就是《博弈论和经济行为》。
《美丽心灵》剧照
冯·诺依曼和摩根斯坦的著作《博弈论和经济行为》对纳什的影响是巨大的,它首先提出了二人博弈的Minimax算法。Minimax算法能保证在非常一般的情况下,二人零和博弈总是存在“最小最大均衡”。而纳什推广了Minimax原理,在非合作博弈领域找到了普遍化的方法和均衡点。
纳什一生著作主要集中在这两年,但其研究成果是开创性的,奠定了现代非合作博弈论的基石。也因此,业界常对博弈论源自冯·诺依曼还是纳什尚有争议。
其实具有博弈性质的问题可以追溯到更早,例如,1838年古诺(Cournot)模型应该是纳什均衡应用的最早版本;中国 2000多年前的“田忌赛马” 致胜策略是寻找混合纳什均衡(见表 4—1);《三国演义》诸葛亮设空城计 利用的是信息不对称博弈(见表4—2);相反地,曹操在华容道的博弈 则是一个完全信息博弈(见表4—3)。对博弈论感兴趣的读者可以深入思考和了解一下。博弈论的历史和人工智能的历史一样,可以追溯,但非要究其“创始人”,寻其“源头”,那就不是三言两语可以解释清楚的了。
表4—1 田忌赛马博弈
表4—2 《三国演义》空城计博弈
表4—3 《三国演义》华容道博弈
计算机下棋一直是人工智能发展水平的度量之一。香农1950年在《哲学杂志》发表的《计算机下棋程序》(Programming a Computer for Playing Chess)一文,最早提出用计算机写国际象棋程序的设想,正式开启了计算机下棋的理论研究。1951年,图灵的朋友斯特拉切(克里斯托弗·斯特拉切,Christopher Strachey)在曼彻斯特Mark—1上写了第一款西洋跳棋(checkers)程序,图灵在1952年曾与之对弈一局。当时计算机下棋的水平还没有如今这么高,所以图灵轻松取胜。同年,图灵的同事普林茨(迪特里希·普林茨,Dietrich Prinz)写了一个国际象棋程序。
除了博弈论和计算机下棋,早期还有很多有趣的AI研究。
1953—1954年,国际商业机器公司(International Business Machines Corporation,简称IBM)资助美国乔治敦大学(Georgetown University)进行有史以来的第一次机器翻译。该项实验成功将60句俄文自动翻译成英文,被视为机器翻译可行的开端。
在那时,人工智能已经以各种形式渗透到各个学科领域和生活中了。这也从另一个角度证明了,达特茅斯会议更多是使得“人工智能”这个词开始流行,而不是人工智能研究的起点。
1956年,IBM的塞缪尔(亚瑟·塞缪尔,Arthur Samuel)写了第二个跳棋程序,这款程序的特点是自主学习,这也是最早的机器学习程序之一。在其之后开发的国际象棋程序的棋力,已经可以挑战具有相当水平的业余爱好者。