购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

一、深度学习初露锋芒

2006年,一篇来自多伦多大学的关于“深度学习”(deep learning)的文章走进了人们的视野,随后便拉开了人工智能(artificial intelligence,AI)研究热潮的序幕。这篇文章的作者正是有“AI教父”之称的杰弗里·辛顿(Geoffrey Hinton)(图1-1),在这篇文章中,他用确切的实验结果向人工智能研究人员展示了深度学习的潜力与实现的途径,这对于当时还处于黑夜中的人工智能领域来说,宛如破晓的黎明。

图1-1 “AI教父”Hinton

早在1980年,Hinton教授首次提出最具代表性的深度学习模型——多层感知器模型 [1] ,而如何让这个深度学习模型进行“学习”,研究人员采用了当时被认为最适合训练神经网络的反向传播算法。我们可以将这种方法理解为“如何考满分”:为了考到满分,我们一次又一次地从扣分的区域发现扣分的原因,再回过头来修改答题思路,最终解决“扣分”的根本问题,形成能够达到满分的考试思路。

然而,这一具有“深度”的多层感知器模型并没有如人们设想的那样拥有更强大的智能,反而暴露出当时训练神经网络的反向传播算法存在诸多问题。部分研究人员将这些问题归结于“深度”的神经网络本身结构设计的问题,并转入到更依赖人工总结知识以及简单的数据信息挖掘等机器学习算法的研究热潮当中。

这种模拟人脑深度神经元连接的模型似乎需要一种更为合理的设计与更加有效的权重学习方法,来向世人证明它对人脑的模仿是构造人工智能不可缺少的一环。而站在我们所处的时代,已经很难想象GhatGPT [2] 、Stable Diffusion [3] 与DALL-E 2 [4] 这些先进的人工智能产品底层的神经网络是怎样一步步演变到今日如此庞大的结构。为了更好地对AIGC(artificial intelligence generated content,人工智能生成内容)这个浪潮有更加客观的认识,我们不得不追溯神经网络的起源及其发展历史。

(一)模仿人脑的设计

20世纪40年代,美国神经生理学家沃伦·麦卡洛克(Warren McCulloch)与数学家沃尔特·皮茨(Walter Pitts)首次模仿生物的神经元在机器语言上设计了神经元模型——M-P模型 [5] (图1-2)。

图1-2 神经元模型(M-P模型),输入进行加权等计算得到神经元的输出结果

类比神经元,M-P模型有用于接受上一个神经元信号的输入端,其可利用各个输入端权重的设置对这些输入的信号进行处理,之后神经元会发出一个处理后的信号,并传递给下一个神经元。在20世纪50年代,罗森布拉特(Rosenblatt)等人在这种神经元模型基础上进行了相应的改良设计,提出了一种可以通过训练得到固定神经元连接权重的感知器 [6] ,这也是人工神经网络(artificial neural network,ANN)的雏形。由于其理论基础不够完善,1969年,深耕于人工神经网络的马文·明斯基(Marvin Minsky)指出了感知器无法解决“线性不可分”这一致命的问题 [7] ,令感知器这一初代神经网络遭遇了第一次滑铁卢。

虽然感知器模型的相关研究在很长一段时期内都陷入低谷,但仍有锲而不舍的研究人员不愿意放弃这一课题。Hinton曾经说过这样一句话:“如果你想了解非常复杂的设备,像大脑这样的,你必须自己做一个。”这句话使神经网络研究者们坚信模仿人类神经网络设计出来的模型是通往人工智能的必经之路(图1-3)。为了实现这一理想,无数科学家摸着石头过河,渐渐在布满迷雾的感知器神经网络研究森林里找到了一条若隐若现的小路。1974年,保罗·韦伯斯(Paul Werbos)发明反向传播算法 [8] ,并提出了将其运用于人工神经网络的可能性;1980年,Hinton设计了多层感知器模型,这也是深度神经网络的雏形;1983年,物理学家霍普菲尔德(Hopfield J. J.)首次采用神经网络来求解旅行商问题,并在相关的算法比赛中打败了其他传统的方法,取得了最好的成绩。

图1-3 深度神经网络与神经元

直至1986年,大卫·鲁梅尔哈特(David Rumelhart)与Hinton等多名研究人员经过反复实验推理,对反向传播算法训练神经网络做出完整的描述 [9] ,解决了明斯基指出的线性不可分问题,神经网络才重新回到人们的视线。至此,明斯基压在神经网络领域长达数十年的消极论断,如斑驳的铜锁,在这些神经网络先行者的猛烈撞击下轰然破碎。

此后便是长达数十年的神经网络技术积累。直到2006年Hinton等科学家发表了一篇有关深度学习的文章 [10] ,人工智能正式进入了深度神经网络时代。这篇文章推翻了学术界对深度神经网络的质疑,并形成了此后广为人知的定义——深度学习。这项工作在当时的数据挖掘与识别任务上达到了惊人的效果,受到了众多学者的追捧与推广,也由此开启了人工智能的全新篇章。

(二)AlphaGo闯入了人类世界

21世纪以来,深度学习概念虽然活跃于学术界,但却不为外人所知晓。一部分研究人员开始着手将这一前沿的理论研究拓展到人类生活中的具体应用上。从2009年开始,微软亚洲研究院与Hinton展开合作,于2011年推出了基于深度学习的语音识别系统,其精准的识别效果颠覆了当时传统的语言识别框架。随着深度学习技术的不断发展,在2012年,Hinton及其学生在法国计算机学家杨·立昆(Yann LeCun)于1989年提出的卷积神经网络(convolutional neural networks,CNN) [11] 的基础上,利用深度学习的方式,搭建了深度卷积神经网络 [12] ,使神经网络实现了在没有人为经验的帮助下,自动地学习图像信息并识别其类别,极大地推进了图像识别的发展。这些工作引起了当时各大互联网公司的关注,谷歌(Google)、微软(Microsoft)、百度、腾讯以及阿里巴巴等著名企业纷纷入场,技术与产业的碰撞激荡出阵阵波澜。

然而,一些研究人员并不满足上述在语言和视觉领域的技术突破,他们大胆地将深度学习对准了人类引以为豪的博弈智慧结晶——围棋!围棋棋盘横竖各19线,落子之处多至361处,而黑白执棋者交替落子,整个棋局共有10的171次方数量的可能性,这是一个几乎无法穷尽的可能性!

于是在2014年,谷歌启动了AlphaGo计划。这个拥有当时最顶尖深度学习技术的AlphaGo一经面世便以横扫千军的姿态战胜了包括Crazy Stone与Zen在内的一众人工智能围棋程序。2015年,AlphaGo第一次击败了职业围棋选手樊麾,并很快在第二年以4∶1的结果击败了围棋职业九段顶级选手李世石,在人工智能界引起轰动(图1-4)。

图1-4 AlphaGo与职业九段棋手李在石的对弈

就当人们庆幸人工智能围棋程序与人类顶级棋手之间仍互有输赢的时候,一位名为“大师”(Master)的网络棋手在围棋对战网站上击败了中日韩一众高手,以全胜的结果成为真正的“大师”。这位“Master”正是新版AlphaGo的化身,它以人类难以想象的学习速度提升自己的围棋水平,并在2017年5月的乌镇围棋峰会上正式战胜世界第一棋手柯洁。这是深度学习第一次在一个领域上完全战胜人类!人们开始意识到人工智能并非镜花水月,它实实在在地闯入了人类的世界。

(三)AI润物细无声

这种具有自我学习能力的深度学习技术在世界上掀起了一场深入的研究与投资狂潮。既然以深度学习为代表的人工智能技术能够胜任如此复杂的围棋对弈决策场景,那么基于这样的一套学习理论是否可以被广泛运用到各行各业需要做出决策的场景中呢?显然,2017年的AI事件井喷已经很好地回答了这个问题。

在无人驾驶领域,2017年7月,百度首次开源自动驾驶系统阿波罗(Apollo),使无人驾驶概念进入大众视野(图1-5)。无人驾驶的可行性引发热议,北京交通委在2017年底印发的中国第一份自动驾驶车管理规范《北京市关于加快推进自动驾驶车辆道路测试有关工作的指导意见(试行)》。在人脸识别领域,苹果公司在2017年9月推出了手机的人脸解锁功能,其基于深度神经网络的人脸识别高准确率令人惊讶,世界各手机制造企业纷纷对自家的手机进行人脸解锁功能部署。同年10月,机器人“索菲亚”被沙特阿拉伯政府授予了公民身份,而阿里巴巴集团投资千亿成立了“阿里巴巴达摩院”,专注于以人工智能为主的科学研究。

图1-5 自动驾驶系统概念图

人工智能自此闯进人类的生活,并在后续逐渐融入人们日常生活的各个方面。例如:我们乘坐高铁或出入重要场所由人工检验身份升级为人脸识别身份;我们家居清洁工具由扫帚、拖把转变为扫地机器人;我们使用的社交媒体软件会推送我们感兴趣的内容;我们使用的“天猫精灵”或者“小度”能够响应我们的语音指令;我们使用的摄影摄像设备可以精准地捕捉到人物的行动。此外还有许多经过人工智能技术升级的产品逐渐融入我们的生活中。

即使在这期间,有许多科学家指出人工智能技术的发展可能会给人类带来无法控制的灾难,但人工智能乘坐着历史的马车,以无法阻挡的力量推动社会走向智能化的道路。深度学习初露锋芒之后,AI几乎无处不在了! oOZnQF0Obtx4w0x2Zz51ecjepdivX20lRMHKHmpjAzTD8MAWdQ7VUQ8Ud+rL7nIL

点击中间区域
呼出菜单
上一章
目录
下一章
×