2014年,我供职的谷歌大脑(Google Brain)团队在计算机视觉领域著名的标准测试比赛ImageNet上,用一个22层的深度神经网络获得了第一名。在给这个网络起名字的时候,我们玩了一个小小的文字游戏:将Google的l大写,即写成“GoogLeNet”。比较“极客”的读者可能会马上发现,这是在致敬1989年出现的,也许是那个年代最著名的神经网络LeNet。在计算机还处于刀耕火种的年代,LeNet就已经被用在全美国的邮政系统中,来读取每一封信件上面的邮政编码。而LeNet的作者,就是今天为大众所知、图灵奖的获得者,也是这本书的作者杨立昆。
30年前,神经网络走过了非常崎岖的道路。最初的成功过后,神经网络因为本身训练的复杂性、结构的不确定性、对数据量的依赖性、理论的不清晰性等,在2000年年初的一段时间之内逐渐被更加有理论依据的凸优化、核方法、概率图模型等取代。杨立昆和其他两位同获图灵奖的大师约书亚·本吉奥和杰弗里·辛顿回忆起自己在这段时间的坚持的时候,笑称这是“deep learning conspiracy”(“深度学习的阴谋”),而他们自己是Canadian Mafia(“加拿大黑手党”),在各自所在的学校中,他们坚持自己所相信的神经网络研究。
学术界对于神经网络的负面观点是比较普遍的。例如,2010年,我和奥里奥尔·温雅尔斯(Oriol Vinyals,谷歌子公司DeepMind星际项目的首席科学家)在加州大学伯克利分校捣鼓神经网络的时候,我们的前系主任笑称“扬清和奥里奥尔在搞mumbo jumbo(大而无当的东西)”。当然他让我们继续自己喜欢的研究,这也是学术界的开放精神之所在。
但是从ImageNet的成功开始,神经网络,或者说“深度学习”,开始以摧枯拉朽之势在各个领域展示出它的优势。感知领域是最先被征服的:让计算机看懂人看得懂的图片,听懂人听得懂的声音,读懂人读得懂的文字。基于此,人工智能算法迅速开始在其他领域崭露头角,例如棋类[AlphaGo(阿尔法围棋)]和游戏、自动驾驶、人工智能医疗、公共服务等领域。可以说,今天人工智能已经成为一门“显学”,成为任何技术领域都值得了解的一个称手的工具。
从2013年加入脸书开始,杨立昆就一直领导着它的研究部门FAIR在人工智能的前沿无人区创新。FAIR集聚了大量人工智能的优秀学者,其中不乏华人的面孔,例如计算机视觉专家何恺明、增强学习和理论研究专家田渊栋等。我在脸书工作期间,一方面构建Facebook AI(脸书AI)的工程底座,一方面也参与和见证了Facebook AI给社区带来的各种成果,例如ResNeXT、Detectron、FAISS等算法,以及PyTorch通用人工智能框架、ONNX业界模型标准等。Facebook AI多年的成就,和杨立昆一直以来对于人工智能的孜孜追求是分不开的。
作为一位人工智能先驱,杨立昆对人工智能的未来也有着非常深刻的思考。他的思考一些是技术上的:如何通过自监督学习等方式,让人工智能走出数据依赖,使之更像人一样学习和进化?一些是伦理和社会学上的:如何保证人工智能服务于人类的福祉,而不被用到错误的道路上去?只有了解科学的人,才能更加深刻地洞察科学背后的社会意义和风险,杨立昆在这本书中所分享的思考,值得我们每一位感兴趣的读者细细咀嚼。
最后说一些和技术无关的小事情。杨立昆在生活中是一位非常风趣,又带着一点极客风格的人。在他的主页以及脸书页面上有各种风趣的小吐槽,例如他和SVM(支持向量机)的创始人之一弗拉基米尔·瓦普尼克(Vladimir Vapnik)一起创作的带有二次元风格的笑话,“All your bayes are belong to us”(“你所有的贝叶斯都属于我们”) 。他在2017年造访中国,来之前有朋友和他说在中国人工智能很热,“有可能走在路上就有人认出你哦”。他回到美国之后很开心地说,他在上海博物馆门口果然遇到两位学生,很兴奋地拉着他合影。杨立昆评论道,既然我真的被路人认出来,那中国一定有无数的人对人工智能怀着无比的热情。
科技改变生活,我有幸在国内见证着人工智能的蓬勃发展;科学无国界,我也有幸为杨立昆的这本新书写序。希望这本书能够给我们带来更多面向未来的思考,希望读者朋友能把这份热情转化为人工智能蓬勃发展的下一个世纪。