近年来,以机器深度学习为代表的人工智能技术得到了突飞猛进的发展,在一些比较成熟的应用领域,人工智能技术正在实现从理论研究到工程实践的飞跃,开始对人类社会做出越来越大的贡献。但与此同时,当越来越多的企业了解到人工智能的巨大功用,并且迫不及待地尝试利用现有的机器深度学习理论与方法,去开拓新的人工智能应用领域时,却发现结果往往不尽如人意。这就产生了一个很有趣的现象,大致可以描述为:“人工智能作为一门科学在研究领域的进步”与“人工智能作为一种工程实践在现实社会中的应用落地”之间的矛盾。
产生这种矛盾的原因很多,各家有各家的难处,但总结下来,尤其是在企业的实际应用过程中,主要集中在三点:
第一,企业的决策者与业务部门对于机器智能能力的期望和技术部门真正能够实现的机器能力之间的落差。这个问题可以通过大家一致努力的学习来解决,但是即使解决了这个落差,在具体实现之前也会出现第二个现实问题。
第二,企业为了拥有这种机器能力而在资源与时间上的投入和技术部门为了实现这种机器能力所需要的资源与时间的落差。这个问题可以通过大家共同商讨、分析和判断实现这种能力的前提条件来解决。在更具体的工作过程中,有关确定性与不确定性之间的这对麻烦的矛盾又会出现。
第三,企业对于计划实施的确定性要求和“黑天鹅”“灰犀牛”现象层出不穷的时代的复杂性之间的落差。这要求企业决策者和广大员工能够共同建立起一个具备充足韧性的企业文化、组织架构、业务流程、人员素质以及产品与服务系统。这种韧性系统要求决策者具备针对事物本质的深刻洞察,在这个技术与人文的综合素质决定企业与个人能力的时代,这种洞察不仅来源于固定的知识本身,也来源于系统的发展观;对于发展的理解,离不开对于历史规律,尤其是人工智能历史规律的洞察。
我的日常工作主要是与各行各业的合作伙伴进行智能技术应用落地的实践,在这个过程中,既有客户需求终于被技术实现的喜悦,也有明明是好想法却始终无法落地的遗憾。我相信所有从事智能技术落地的工程技术人员,都有同样的体会。也可以这么理解,上述理论与实践的矛盾是当今智能技术领域的普遍现象。那么这个问题有没有解呢?
泛泛而言,答案就是我们必须要不断学习。在这个巨变的时代,我们每一个人,尤其是企业的决策者和业务人员需要努力学习并理解机器智能实现与应用的基本原理,同时利用自己对相关领域商业逻辑的深刻洞察,与技术人员配合,通过合法、高效、全面地使用智能机器实现企业与个人能力的飞跃。这种泛泛而谈的学习的确覆盖面太广了,经常会让人们不知从何下手。但确实有一些快速入手的途径,在我看来,现在在你手中摊开的这本书,可能就是其中的一条途径。
对大部分读者而言,这本书的作者杨立昆最出名的可能就是与杰弗里·辛顿和约书亚·本吉奥一起获得的由美国计算机协会(ACM)颁发的2018年度图灵奖。当然业内人士大都知道他与卷积神经网络的不解之缘,还有那个1993年拍摄的用LeNet 1卷积神经网络(一个以他的名字命名、拥有4600多个单元、接近10万个连接的卷积神经网络)对于手写数字自动识别的演示视频,这套系统在1995年就开始正式商业落地。要知道那可是将近30年前的事情啊!也就是说,现在广为流行的基于深度卷积神经网络的计算机图像识别系统,在近30年前就已经开始商用了。
其实杨立昆在业界还以“敢言”出名。当初在2017年NeurIPS大会上,获颁“长期成就奖”的机器学习专家阿里·拉希米(Ali Rahimi)在他的获奖演讲中,对人工智能的现状进行了批判。拉希米提醒当时的听众,“我们对人工智能的发展过于自大了”。他先用吴恩达对人工智能的著名判断“人工智能是新时代的电力”举例,之后话锋一转,在屏幕上打出一个中世纪炼金士的图像,转而说:“目前的人工智能更像是炼金术,只不过是一个还能用的炼金术。”此言一出,激起了本书作者杨立昆的强烈反击,因此在网络上形成了一场关于人工智能到底是不是炼金术的大讨论,这场论战在当时可谓风靡一时。
客观而言,当时论战双方都是基于各自角度和立场的合理论证,并不能简单地判断谁对谁错;但是这种公开的讨论,对大众而言就是一次难得的学习机会。并不是每个人都能够亲身经历机器学习行业几十年的发展历程,也不是所有人都有相应的知识与精力认真思考和研究这些针锋相对的观点和意见。杨立昆的这种敢想、敢做、敢说的风格,的确能够帮助广大民众从他的言论与论著中学到除了技术以外的一些哲学思想内容,而这些思想对需要利用技术解决业务问题的企业决策者和业务人员而言,就变得大有益处了。
作为图灵奖的获得者,同时是机器学习领域,尤其是以卷积神经网络为代表的深度机器学习领域的领军人物,杨立昆在写作本书时,有意识地不把它写成一本纯粹的技术书,更多的是把他在机器学习领域几十年所走过的道路与读者分享。整本书读下来,尽管也有许多有关机器学习算法设计与实现原理的分析与讨论,但更多的是他在这个行业摸爬滚打几十年的心得体会,值得我们深入阅读与思考。
正如前面所讲,现在妨碍智能机器能力落地的主要障碍,很多情况下不是技术本身,而是对技术能力的期望值和技术有限性之间的矛盾,以及应对复杂现象的能力。这正是杨立昆在他的书中始终强调的观点。
本书的写作风格,与杨立昆自诩为工程师的为人一样,非常坦诚、直率、目的明确、不事雕琢。喜欢那些用词优美、语意流畅、文学性强的文章的读者,可能需要习惯一下他这种工程师式的写作方式。同时也由于过去几十年人工智能的发展道路非常坎坷,杨立昆又坚持选择了一条并不为大多数同行看好的深度机器学习之路,让他和少数同路人没有少受委屈,这也让他偶尔会怀疑自己选择的道路是否能走向成功的未来。我相信正是他的这种真情实意,使得这本书的内容对广大读者来说有非常真实的借鉴意义;同时我也相信,正是因为他经历了人工智能这几十年真实不虚的起起伏伏,他才有那么坚定的信心、意愿与各种对于人工智能发展的观念与思潮进行坦诚的辩论与交流。
本书中最令我动容的是他在第二章“深度学习的阴谋”那一节里有关信心与动摇的描写。那是1987年12月6日,也就是杰弗里·辛顿生日当天发生的事情。辛顿本是个很有幽默感的人,但那一天他苦涩地坦陈:“今天是我40岁生日,我的职业生涯也到头了,什么也做不成了。”的确,那时候才是1987年,辛顿已经40岁了,离他和他的团队在2012年利用深度卷积神经网络将计算机图像识别的错误率从25%一下子降到16%还有25年,离AlphaGo在2017年中国乌镇围棋峰会上以3∶0击败围棋世界排名第一的柯洁还有30年,离他与本吉奥和杨立昆在2019年共同获得2018年度图灵奖还有32年。正因为如此,作为辛顿的朋友和图灵奖的共同获得者,杨立昆可以自豪地讲:“我们在20年后又有了新的想法,但我们碰见的大多数人都不如辛顿这样,他们都很傲慢。”我相信他们几位先行者的经历,也能够给中国莫名其妙流行的程序员“35岁现象”起到正面的借鉴意义。
类似的警句在本书中比比皆是,在我拿到的中信出版社给我的试读本中,我已经做了非常多的标注,让我跟大家分享一些我收集的例子,与大家共勉。
本书一开篇就写道,“人工智能正在逐步占领经济、通信、健康和自动驾驶汽车等领域。很多观察家不再将其视为一次技术演变,而视其为一场革命”。杨立昆所坚信的“深度学习就是人工智能的未来”。第九章里他把机器学习的各种方法比作黑森林蛋糕。作者还是一个不希望把技术神化的具有踏踏实实工程师个性的科学家,当他解释机器学习算法的时候,他希望读者理解的是它背后的思维本质,而不是多么高不可攀的术语和公式。对于算法,他说:“算法是指令序列,这就是它的全部,没有任何神奇、难以理解的地方。”他对机器自动学习原理的解释就是与“物理学的基础”一样,“从观察到的现象中总结出定律,并用定律预测现象”。
另一个有趣的例子是他对SVM算法的观点。尽管SVM是他的朋友和同事一起发明的,但他在书中明确写道:“我对我的朋友和同事深怀敬意,但必须承认我本人对这个方法并不是特别感兴趣,因为它并没有解决特征提取器自动训练的关键问题。不过,SVM方法吸引了很多人的注意。”
我所接触到的绝大多数科学家,都与杨立昆的风格类似,他们都有一个共同的素质,就是始终带有批判性思维。当这些优秀的科学家或工程师对一种技术或者方法进行研究与推广的时候,永远都要先阐述它能够起作用的前提约束条件,不会一味推崇某种技术的好处而不阐明因为某种优势所必然带来的某种劣势。这些科学家的技术与工程理念可以综合地解释为,“任何一种强大的技术,有其正面就必定有其负面,不理解它的负面,就不能更好地发挥它的正面;不能够关闭某种神奇的工具,就不能轻易地把它打开”。这种思想方式始终贯穿本书。
在与大量客户的合作过程中,我也发现企业的决策者容易被技术发展的单方面描述误导,尤其在这个手机朋友圈知识远大于传统知识渠道的时代。人们得到了知识获取的便利性,但同时又面临着判断知识真假的挑战。虽然以机器学习为代表的智能技术表现出了非常强大的潜力,也让我们看到了这种强大的智能技术在一些领域中的应用所带来的翻天覆地的变化,但是这种应用领域的范围还极为狭窄,还有大量的未知领域需要人们以探索的精神来找到落地的方法。但现实是人们很容易在没有理解和认知某种先进技术的负面因素的前提下,就做出了一个不具备批判性观点的决策。这种决策方法极易将本来可以在一定范围内为企业发展做出贡献的技术,仅仅由于没有考虑到在使用过程中应该避免的负面效果而前功尽弃。在现实中,这种决策方法所造成的后果可能更严重,因为这种前功尽弃的现象,又会使企业的决策者完全丧失对于使用先进技术提高自身竞争实力的信心,以至干脆放弃对先进技术的追求与坚持。这种结果几乎可以称为“双倍的得不偿失”。
机器学习的能力很强大,但是要想用好这种能力并不容易。人类社会发展到今天,进入智能化时代,是一个大概率事件。理解、掌握并用好机器学习的能力,已经成为每个组织与个人生存与发展的必选项,而不再是一个可选项。同时,由于这种技术的复杂性,它要求人们不仅能够学习固定的知识,还需要具备应对变化的能力,而这种应对变化的能力其实也是机器学习的基础能力范式。机器学习已经发展到了能够帮助人类扩展自身认知空间的阶段,也就是说,人类不仅能够利用机器学习的能力,也可以向机器学习新的学习方法,这种方法的核心就是在变化和不确定的情况下随时适应新情况的方法。
刚才在前面跟大家介绍了杨立昆与拉希米关于机器学习是否是炼金术的争论,在那场争论中,杨立昆坚决地站在机器学习不是炼金术的一方,但科学探索的本质就是不断接近真相但永远不会到达真相,在这个寻求真相的过程中会随时根据周围环境的变化和新的现象而做出修正。读书也是一样,“尽信书,不如不读书”。本书作者以他自己“科学之路”的经历告诉我们同样的道理,那么就让我们以他自己在前言部分写的一段话作为收尾吧!
深度学习的探索之旅并不容易,我们不得不与各个方面的怀疑论者做斗争……深度神经网络,即我们提出的深度学习,就是突破局限性的方法。深度神经网络十分有效,但是运作也非常复杂,并且难以进行数学分析,但我们还是如同炼金术士般不懈追求着。