我非常荣幸能有机会为图灵奖获得者杨立昆博士的新书《科学之路:人、机器与未来》撰写序言。
杨立昆博士因为在深度学习方面的杰出贡献获得了2018年度的图灵奖,他的大名在中国的计算机科学界和企业界几乎是家喻户晓。他这本结合了自传和科普的新书非常值得一读,无论是学术界、工业界的人士,还是普通读者,读了之后都会获益良多。
在《科学之路》一书的前言部分,杨立昆博士介绍了自己求学和科研的经历。他的求学经历和对教育的理解在当下对中国家长非常具有启发意义。杨立昆是法国人。在法国,如果想要成为任何一个领域的精英,通常要进入招生人数非常少的高等专科学院(grandes écoles,也被称为大学校),比如想做科学家和工程师,就需要进入巴黎高等师范学院(ENS)或者巴黎综合理工学院这样的精英学校学习。而为了考入这些录取率极低的学校,又要花两年左右的时间先学习大学预修课程备考。我想如果一个中国家长在法国,会让孩子走这条路。但是杨立昆却走了一条与众不同的求学道路,他高中毕业后就直接进入一所名气不算太大的大学——巴黎高等电子与电工技术工程师学院(ESIEE)学习。杨立昆做出这样的决定有两个原因:其一,这所大学不需要参加预科课程的学习和考试就能直接申请;其二,在这所学校,他可以获得更多的学习自主权。杨立昆讲,他用自己的经历证明了通过激烈的考试竞争进入名校,不是科学成功的唯一路径。
杨立昆在人工智能领域的研究生涯,可以追溯到他在大学时广泛地阅读课程之外的经典科学著作。在他读书的年代,人工智能是一个热门但是发展并不成熟的研究领域。杨立昆对此有非常大的兴趣,并且阅读了包括诺姆·乔姆斯基(Noam Chomsky)等人在内的很多科学家的论著,特别是苏联伟大的数学家、公理化概率论的奠基人柯尔莫哥洛夫(Kolmogorov)的著作,这为杨立昆打下了坚实的数学基础和计算机科学理论基础。从大学开始,杨立昆就沉溺于人工神经网络的研究,并且敏锐地注意到这个研究领域一个新的技术方向——神经网络的反向训练。后来他进入当时的巴黎皮埃尔和玛丽·居里大学(今天的索邦大学)攻读博士学位,并且在反向训练上取得了卓越的成绩。他的成果很快就有法国一家公司买单,而且让他得以进入当时学术氛围非常自由的贝尔实验室工作。杨立昆用自己的经历告诉我们,接受教育重要的是获得知识本身,而不是获得名校的光环。在以后的学术生涯中,杨立昆一直保持这种特立独行的做法,特别是在全世界都不看好人工神经网络这个研究领域的时候,他依然投身到这项研究中。
杨立昆进入贝尔实验室时,正赶上那个世界科学殿堂最后的辉煌时期,但是很快这个庞大的实验室就解体了。所幸的是,杨立昆得以在纽约大学担任了教职。不过,当时正赶上人工神经网络研究的低谷,虽然杨立昆坚信这项技术会在图像识别领域大放光彩,并且设计出了一个简单的人脸识别系统,但是他的成果并没有引起太多科学家的重视。从2003年到2013年大约10年的时间里,杨立昆和他曾经的领路人杰弗里·辛顿等人一直在默默地从事着各种人工神经网络算法特别是卷积网络算法的研究。他们的成果当时并不引人注目,但是正是这些研究成果,奠定了今天深度学习算法的基础。2013年之后,随着并行计算的进步和数据量的增加,以人工神经网络为基础的深度学习突然在很多应用领域显示出巨大前景,并且在一个又一个应用中,比如人脸识别、语音识别、机器翻译、计算机博弈,取得骄人的成绩,杨立昆等人的工作一下子轰动了全世界,并且让他和辛顿、约书亚·本吉奥(Yoshua Bengio)一起获得了计算机科学领域的最高奖——图灵奖。
如果要总结杨立昆的成功经验,我们可以用4句话来概括:
· 求学是为了知识本身,而不是文凭;
· 广泛地阅读高水平的专业著作,培养科学的品位;
· 特立独行,做自己感兴趣的事情,即便那件事在短时间内不被人看好;
· 长期的坚持。
《科学之路》一书的第二部分讲述了基于深度学习的人工智能的原理。虽然杨立昆博士使用了一些公式,但这部分内容依然通俗易懂。
杨立昆博士用几个例子讲述了今天人工智能的本质,就是数学公式+大量的数据+计算能力。
首先,我们要将模式识别等问题转化成数学公式。今天计算机的智能从实现方式上讲完全不等同于人的智能;但是,从结果上讲,它和人的智能等价。你可以认为这是两条殊途同归的道路。杨立昆博士用一些典型的模式识别示例告诉我们人工智能是如何实现的,读者朋友即便对里面的公式细节不感兴趣,也能体会到人工智能和人的智能之间的不同。不过,计算机在获得智能的方法上,有一点和人是相同的,那就是从观察到的现象中总结出规律,然后用规律再来预测现象。杨立昆在书中举了伽利略研究速度的例子,伽利略通过观察找到了物体运动的规律并且将它变成了数学公式,然后再把这个公式应用于计算各种运动物体的速度。机器学习也是如此,只不过机器学习的公式不那么直观。
其次,我们需要获取数据,供计算机进行学习。在任何人工智能的应用领域,原始的数据,比如图像本身,都是无法直接用来学习的,这中间要进行一个转化。这个转化的过程被称为特征提取,简单地讲,就是将真实世界的目标对象转化成计算机能够读懂的数据。杨立昆博士用模式识别的例子说明了特征提取是如何进行的。当然,如果读者朋友不想关心具体的步骤,至少需要明白一点,那就是计算机学习需要大量的数据。
最后,当数据量大了之后,就需要数学模型足够复杂才能反映出大量数据中所包含的各个细节。虽然奥卡姆剃刀原理通常很有效,但是在机器学习领域并非如此。事实上,过去基于人工神经网络的机器智能水平之所以不高,就是因为那个网络过于简单。因此,杨立昆等人提出了更为庞大而复杂的深度学习人工神经网络。于是这就遇到了第三个问题,计算能力的问题。杨立昆博士对这部分内容没有做太多的论述,毕竟这部分工作主要是由谷歌、脸书和亚马逊等公司的工程师来完成的,而非科学家关注的重点。
《科学之路》一书的第三部分讲述今天人工智能的各种应用,从语音和图像识别、自然语言对话系统,到自动驾驶汽车和医学影像识别,这些名词大家都不陌生,但是如果想了解其中的细节,杨立昆博士的讲述既权威,又直白。
《科学之路》一书的第四部分,也是最后一个部分讲述今天人工智能的局限性,这包括技术上的不足之处,以及人工智能所带来的社会风险。这部分内容是各种介绍人工智能的图书常常忽略的。杨立昆博士提醒我们,所有技术革命都有其阴暗面,但是他坚信这些问题能够得到解决。他在书的最后还谈了一些有趣的话题,比如机器人是否该拥有权力,又该遵守什么样的法律。
总的来讲,这是一本全面介绍人工智能技术,兼顾科普和专业论著特点的鸿篇大作,其中最有价值的部分是杨立昆博士作为深度学习算法的发明人之一,讲述他如何思考机器智能的问题,如何将这种现实世界里的具体问题转化为计算机能够处理的问题。从这个角度上讲,它又是一本教科书,教大家如何思考科学问题。我相信通过阅读这本书,各个层次、不同背景的读者朋友都会有巨大的收获!
2021年6月6日于硅谷