王飞跃
中国自动化学会监事长
中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任
当今最好的人工智能程序到底有多智能?它们是如何工作的?能做些什么?我们有必要担心机器比人类聪明且将很快夺取我们的工作吗?以上这些问题都颇受人们的关注,梅拉妮·米歇尔教授的人工智能新著《AI 3.0》以最合适的方式给出了以上问题的答案。这是一本以独特的方式观察、分析人工智能的优秀著作,不但巧妙地把创造历史的人物与改变世界的技术交织起来,而且深入浅出地介绍了人工智能的发展历史及其未来的前进方向。正如本书英文版的副书名(“A Guide for Thinking Humans”)所示,这是一本为思考的人类而准备的著作,值得每位想要弄清人工智能的影响与意义的专业或非专业人士认真地阅读并思考。
初见梅拉妮·米歇尔之名,还是20世纪80年代末研究她与侯世达关于类比推理的开创性程序“Copycat”(拷贝猫)时,只因其与当时主流的认知推理方法相去太远,就没有再深入地研究。20世纪90年代我参加圣塔菲研究所(SFI)的研讨时,与她虽有交集,但无深入交流,不过对她的遗传算法著作 An Introduction to Genetic Algorithms 印象深刻,她不愧为遗传算法之父约翰·霍兰德(John Holland)教授的高足。21世纪初,我在就任中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任之后,一直想写一本关于“复杂性科学”(complexity science)的科普书,在筹备复杂系统管理与控制国家重点实验室期间着手搜集资料,又与米歇尔的《复杂》( Complexity: A Guided Tour )不期而遇。粗读之后,我认为暂时没有必要再写一本关于复杂性科学的科普书了,因为很难超越她的水平。
2019年初,湛庐询问我是否有兴趣组织翻译米歇尔正在创作的 Artificial Intelligence: A Guide for Thinking Humans ,我读过作者已完成的部分后,十分喜爱其内容与风格,特别是书中的许多观点引起了我的共鸣,于是我随即向学生们推荐,并得到王晓研究员、即将博士毕业的李玉珂和张慧同学的积极响应。巧合的是,这三位都在从事人工智能的一线研究,且都有在美工作、学习和交流的经验,特别是王晓研究员具有主持翻译《机器崛起》( Rise of the Machines:A Cybernetic History )和《社会机器》( Social Machines: The Coming Collision of Artificial Intelligence, Social Networking, and Humanity )等数部重要著作的经验,因此,她们是翻译此书难得的人选,并能够从学术性和可读性两个方面保证质量。2019年底,借赴波特兰参加英特尔年度研发会议的机会,我来到米歇尔的办公室拜访了她,并讨论了本书的翻译工作和大家对人工智能的基本认识。
王飞跃(左)与梅拉妮·米歇尔(右)2019年11月16日于波特兰俄勒冈州立大学
借此机会,我就本书中所提出的一些人工智能的基本问题,特别是对本书最后提出的6个问题谈一些自己的认识,希望有助于读者更加开阔地去思考智能技术的影响与意义,以及如何推动人工智能和智能科学的健康发展,使其以更加安全可信的方式促进人类社会的发展与繁荣。
本书是以米歇尔的导师、“GEB”的作者侯世达教授在谷歌的一次内部研讨会上表示自己被人工智能的快速发展“吓坏了”开始。更具体地说,侯世达是被“音乐智能实验”(Experiments in Musical Intelligence,EMI)的优美创作吓坏了,他曾这样说道:“我被EMI吓坏了,完全吓坏了。我厌恶它,并感受到了极大的威胁——人工智能对我最珍视之人性的威胁。我认为EMI是我对人工智能感到恐惧的最典型的实例。”我曾听说过侯世达对人工智能的担忧,但当时不以为然,我认为一个对人工智能了解如此之深、认识如此之深刻的学者不应过度害怕智能技术。
作为一个坚信人工智能只是一项技术,不会主动侵害人类的科技工作者,我当时觉得这可能是由于侯世达远离科研一线太久或年纪增长的原因,但书中侯世达的自白,让我认识到我的猜测都不对,真正的原因在于音乐在他的心里有着一种十分神圣甚至神秘的地位。米歇尔在书中也提到了侯世达与EMI第一次相遇时所说的话:
从孩童时期开始,音乐就令我心潮澎湃,并能将我带入它最核心的地方。对于我所钟爱的每一件作品,我都能感受到它是来自作曲之人情感深处的一封“私信”,那感觉仿佛使我能够直抵作曲者灵魂的最深处,这让我觉得世界上没有任何一样东西比音乐的表达更具人性。然而,对最浅显的音节排序进行模式操纵,却能够产生听起来仿佛来自人类内心的音乐,一想到这里,我就非常非常不安。
在“GEB”一书的最后,侯世达曾列出关于人工智能的“十大问题和猜想”,其中第一个就是关于音乐的。那时他认为计算机可以谱写出优美的音乐,但并不会很快实现,因为音乐是一种关于情感的语言,在程序能够拥有我们人类所拥有的这种复杂的情感之前,它绝无可能谱写出任何优美的作品。
我认为,侯世达由此对人工智能产生的“恐惧”是中国艺术家潘公凯 (7) “错构”理论的一种典型的体现,它不是一种在理性或技术层面的反应,而是一种本然的艺术或哲学性的反映。对此,我希望结合智能研究的起源以及我一直提倡的“广义歌德尔定理”来说明我的看法。
近代以来,人们对智能的认识源自数学家希尔伯特(D. Hilbert)的梦想,即数学推理机械化的“希尔伯特纲领”。伯特兰·罗素(Bertrand Russell)与阿尔弗雷德·怀德海(Alfred N. Whitehead)为了给这一梦想奠定坚实的基石,二人花了10年的心血成就了一部三卷本的《数学原理》。但是不久,这基石就让三个年轻人击碎。先是歌德尔证明了不完备定理,接着图灵提出了图灵机,并将计算的本质归于机械的操作,进而约翰·冯·诺依曼(John von Neumann)建立了数字计算机的逻辑操作结构。自此,我们有了现代计算机,并开始了人工智能研究,成就了今日之信息产业“旧”IT(information technology,信息技术),目前,已开始迈向智能产业“新”IT(intelligent technology,智能技术)。在这一智能的计算化过程中,从邱奇-图灵论题(Church-Turing thesis)开始,在诺依曼有意无意的引导下,学界关于智能的思考和认识逐渐形成了两个派别:“图灵派”和“歌德尔派”。
图灵派本质上是计算主义,认为基于简单规则的计算可以涌现出复杂的行为和智能。从物理符号系统的逻辑智能到联结主义的计算智能,这一思想主导了人工智能至今的发展历史,是构建智能系统的主要理论和方法源泉。歌德尔派认为根本没有构建智能的一般规律和方法,而且现有的一些规律和方法不应成为第一性的,只有动因和信念才是本质,接受现状继续演化是发展人工智能的唯一途径。歌德尔派在人工智能的研究上至今并没有产生很大的影响,然而,在理解智能的影响和意义方面,歌德尔派的认识则非常重要,而且对智能科学的未来发展更具有指导性意义。
歌德尔认为,存在先于可计算的不可计算,即存在不可计算的客观存在。存在不可计算的物理、生命和数学过程,且计算机不能真正理解语言和想象等相关的活动。研究人工智能的第一位华人学者王浩晚年曾致力于歌德尔的思想与哲学的研究,他总结道:“歌德尔认为机器不可能超越人脑,除非数学不是人类发明的。而且,就算数学不是人类发明的,机器还是无法超越人脑。”
我曾把歌德尔关于智能的思想总结为“广义歌德尔定理”,即智能分为算法智能(algorithmic intelligence,AI)、语言智能(linguistic intelligence,LI)和想象智能(imaginative intelligence,II)三个层面,算法智能无法超越语言智能,语言智能又无法超越想象智能。正如歌德尔在普林斯顿高等研究院的同事爱因斯坦所言:“智能的真正标识不是知识,而是想象。”
我们可以从两个方向来理解广义歌德尔定理:一是图灵的想法,即AI的全体和极限是LI,LI的全体和极限是II;二是II的局部和具体化是LI,而LI的局部和具体化是AI。计算机的智能只能是AI,无法达到人类所具有的LI和II层面。
歌德尔对智能的认识及理解与中国哲学史上人们对《道德经》开头的两种不同解读十分相似:一是“道可道,非常道”,即凡是能被言说的道,就不再是永恒的本源之道,就像世上每一个能被看到的具体的圆形,都无法符合圆形的抽象定义一样;二是“道,可道,非常道”,即道有三种形态,自然中可执行的道(算法之道)、只能说出来的道(语言之道)、只能想象出来的道(想象之道)。总之,“道”一经说出,就不是本来的自然之道了。
哲学家伏尔泰曾说:“定义你的术语……否则我们将永远无法相互理解。”然而,前文的讨论使我们认识到,即便有了定义,我们在语言和想象层面上可能也无法彻底理解。而且,正如本书所言,在人工智能领域,“智能”“思维”“意识”“认知”“情感”等术语很难定义,且至今没有达成共识。这也正是20世纪的科学哲学家托马斯·库恩(Thomas Kuhn)在其“3C”理论中所阐述的:在人类语言词典及其多维结构里,我们进入一种本质上不可公度 (8) 、不可比较、不可交流的境地。或许,在量子力学中的“薛定谔的猫”或海森堡的“测不准原理”之外,我们在智能的AI、LI、II层面上是否分别存在各自的“算不清原理”“说不明原理”“想不准原理”?
回到侯世达对人工智能的“过激反应”这一问题,我想再用世界围棋高手柯洁的例子加以说明。在李世石以1:4输给AlphaGo之后,柯洁发表了迫不及待想要挑战AlphaGo的声明:“就算AlphaGo战胜了李世石,但它赢不了我。”在以0:3的比分负于AlphaGo之后,柯洁浑身颤抖,只想大声痛哭,认为AlphaGo实在太完美了,并称它就是“上帝”。我记得在《时代》杂志上首次看到这一报道时,我的第一反应就是:“上帝?谁的上帝?反正不是我的上帝。”在我看来,柯洁的反应与侯世达是一样的,是专业执着后的应激错构,我们没有因为柯洁的失利而对AlphaGo感到畏惧,也无须因侯世达而对人工智能感到担忧。实际上,我认为,对这类问题进行持续深入的讨论应是哲学家或有闲阶级培养智能科学素质的脑力练习,专业人员更应关注探索人工智能技术及应用的合法、合规、合理与合情问题。
讨论完对人工智能的“恐惧”之后,我们再来看看人工智能对人类工作的冲击。近年来,在这方面总有许多令人担忧的言论,如“机器取代人”“人工智能将使50%~70%的人失业”,有些世界著名的科学家和企业家甚至声称人工智能的兴起意味着人类文明的终结。关于人工智能是否会导致人类大规模失业,作者在本书中做了许多论述。
正如哲学家黑格尔所揭示的:历史给我们的教训是,人们从来都不知道汲取历史的教训。实际上,人类在过去100多年内至少经历了三次这种担心,这就是“老”“旧”“新”三次IT变革。当年,人们对老IT(工业技术)的担心远大于今天我们对新IT(智能技术)的担心。在工业革命的发源地英国,纺织工业诱发“羊吃人”现象,女王担心机器的大规模使用将使她的臣民变成乞丐,民众更是揭竿而起,干脆一把火将机器烧了。
70多年前,诺伯特·维纳的控制论和数字计算机的出现开启了旧IT(信息技术)的变革,又一次引发社会对机器取代人类工作的担心。为此,维纳还发表了《人有人的用处》( The Human Use of Human Beings )来专门讨论这一问题,其中特别强调“信息永远不能取代启迪”(Information will never replace illumination.)。启迪是语言和想象的核心功能,因此机器及其生产的代码与信息根本无法取代人类,而且,计算机还为“机器取代人”做了一个绝好的说明。20世纪50年代之前,英文中“computer”一词其实是指从事计算工作的人类,但今天作为机器的“computer”已经完全代替了作为人类的“computer”;然而,被称为“computer”的机器,不但没有使人类大规模失业,而且还为人类创造了更好、更多的新工作,比如程序员、架构师、算法工程师、网络管理员,等等。事实胜于“恐”辩,尽管机器可能造成一定程度的短暂的社会错位,使一些人失去工作,但不会造成人类的大规模失业,相反,机器能够创造出更多、更好、适合人类的工作,推动社会进步。
其实,这个问题在100多年前就已被研究清楚,这就是著名的“杰文斯悖论”(Jevons paradox)。威廉姆·斯坦利·杰文斯(William Stanley Jevons)是19世纪英国的数学家、哲学家和经济学家,现代经济学中的边际效用理论的主要奠基人。在英国工业革命时期,工业大量消耗煤资源并产生了严重的污染,引发了利用技术提高燃煤效率的讨论,但杰文斯的研究表明:烧煤效率越高,耗煤量将会越大。这就是杰文斯悖论:技术进步可以提高自然资源的利用效率,但结果是增加而不是减少人们对这种资源的需求,因为效率的提高会导致生产规模的扩大,这会进一步刺激需要。
计算机的“机器取代人”的例子说明广义的杰文斯悖论也成立:技术进步可以提高人力资源的利用效率,但结果是增加而不是减少社会对人力资源的需求,因为效率的提高将导致生产规模的扩大。计算机的确完全消灭了名为“computer”的职业,使其变成了一种真正的机器,但同时也扩大了社会对计算机生产、操作等相关人员的需求。还有很多这方面的例子,比如全球定位系统取代了许多测量工作岗位,但却产生了更多基于位置的服务(location based services,LBS)的相关工作以及导航算法工程师等岗位;机器学习取代了很多统计员,但却增加了更多不同的数据工程师工种。可以预见的是,随着智能技术的发展,这类例子将会越来越多。
我们相信,表面上以取代人力为目标的智能技术,将产生更多更适合人类的新的工作岗位,例如学习工程师、决策工程师、法务工程师,等等。智能技术可能会将今日之“码农”解放出来,使其变成明日之“智农”,成为“人机结合,知行合一,虚实一体”的“合一体”智慧员工。如此一来,维纳所说的:“人有人的用途,机有机的用处”将会实现。
40多年前,侯世达在“GEB”之末提出了关于智能的十大问题和猜想,吸引了年轻的米歇尔转行随其学习和研究人工智能。现在,米歇尔在本书的结语中也提出了当下人工智能领域备受关注的六个问题及其答案或推测,这本质上也是对未来智能技术发展的探讨与期望。在此意义下,将本书中文版命名为《AI 3.0》也算合理。我个人更是坚信人工智能必须从长期占据主导地位的逻辑智能(AI 1.0)和近20年来作为主力的计算智能(AI 2.0),向人机混合、虚实交互的平行智能(AI 3.0)迈进。
未来的智能科技,必须将人以新的方式置于核心地位,切实落实“人有人用,机有机用”的根本原则。社会物理信息系统(cyber-physical-social systems,CPSS)将成为智能系统的基础设施,进而保证数据之力、计算之力、算法之力、网络之力和区块链之力能够“五力合一”,使智能科技能上“真”[TRUE=trust(可信)+reliable(可靠)+useful(有用)+effective(有效)]之“道”[DAO=distributed/decentralized(去中心化的)+automated/autonomous(自动的)+organized/ordered(有序的)=decentralized autonomous organizations(分权自治组织)],实现系统学习和系统智能,迈向智能组织和智慧社会。
政治哲学家和经济学者弗里德里希·哈耶克(Friedrich Hayek)曾说:“科学走过了头,自由将无容身之地。”同理,智能越过了界,人性将无处安身。如何保证人工智能不越界?根据广义哥德尔定理,我们不是不相信智能技术,我们只是不相信智能技术背后的人类。因此,人工智能的合法合规,必须依靠人类本身的文明和法制保证,智能科技只能起辅助作用。人类社会发展的历史告诉我们,随着技术的发展,我们需要越来越多的法务工作者。将来,或许罪犯会非常少,但“智警”或“法务工程师”会成为智慧社会的重要从业人员,远多于普通的警察和法官。这是随智能产业发展而来的智慧社会的可能形态,也是我们研发新一代人工智能应该考虑的问题。
前段时间,明略公司的研究院院长吴信东教授和创始人吴明辉先生向我介绍了他们的“好智能”(“HAO”intelligence)计划,就是将人类智能、人工智能和组织智能融合起来,创造出“HAO”好智能。我十分赞同,不但是因为这与我个人的理念相同,更因为这是通向“6S”智慧社会的唯一途径。所谓的“6S”是指,未来的智能技术必须使人类社会在物理空间安全(safety),在网络空间安全(security),在生态空间可持续(sustainability),具有个性化的敏捷感知能力(sensitivity),完成有效的服务(service),展示有益的智慧(smartness)。
我个人的兴趣在于知识自动化和平行智能,且部分研究已发表于清华大学出版社出版的《人工智能:原理与技术》一书。对我来说,知识自动化和平行智能曾经是一个遥远的目标,然而,时至今日“云计算”“边缘计算”以及“数字孪生”技术的迅猛发展使平行智能变得可行。目前,我和团队正在研究“Copycat”及其后继者“Metacat”在平行智能和知识自动化中的可能应用,期望今后有机会与米歇尔和相关学者就此合作,让AI 3.0早日成为现实。
最后,再次祝贺米歇尔的又一力作《AI 3.0》问世。希望能有更多的读者有机会阅读此书,正确地理解人工智能,促进智能科技的健康发展。