购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第一章
人工智能的发展历程

人工智能曾经的发展并不像今天这样顺利。科学家们经历了60余年的沉淀,不断尝试、推陈出新、潜心钻研才有了今天的研究成果。了解人工智能的成长历程能让我们更好地理解人工智能,进一步明确未来人工智能的空间有多大。

1.1 初生——达特茅斯会议

1956年,即图灵去世后的第二年,在达特茅斯会议上人们将“人工智能”一词确定下来,人工智能自此成为一个特定的学术领域,部分研究成果得到了共享,为后续研究奠定了基础,这是这次会议最重要的成果。

达特茅斯会议召开后,20世纪50年代后半期至70年代初期出现了第一次人工智能热潮,这一时期被称为“推论·探索的时代”或“智能的时代”,该时期模仿人脑运行的研究非常符合人工智能这一名称。人工智能大展身手的第一个学科是数学学科,纽埃尔和西蒙在达特茅斯会议上展示了人类历史上首个人工智能程序“逻辑理论家”,该程序不仅证明了《数学原理》中的38个定理,而且给出了一些比罗素本人的证明更加简洁的解法。随着机器定理证明研究的深入,在1963年,“逻辑理论家”程序已经升级到可以证明《数学原理》中的前52条定理。

“逻辑理论家”程序在人工智能的历史上具有里程碑式的意义,它验证了人工智能的重要性和合理性。自1946年首台计算机诞生以来,计算机都是用来解决具体数值的计算的,如导弹弹道计算、核反应模拟,而证明抽象化、符号化的数学定理一直被认为是不可行的。在持续的研究中人们发现,计算机推演了数十万步也无法证明两个连续函数之和仍是连续函数;最糟糕的是人工智能在机器翻译领域的表现不佳。之后,人工智能的研究方向转变为寻找国际象棋与迷宫游戏的最优解。例如,在国际象棋这样的游戏中,人工智能能够连续反复计算从有限个数的选项中找出最优解。由于这种方法从像树枝一样不断分叉展开的选项模式中找出最优解,因此该方法也被称为搜索树。如果能够一个不落地确认搜索树的所有可能性,那么就能够找到最优解。然而,在可选项过多以至于无法确认全部可能性的情况下,这种方法则需要进行一些改进。

搜索树研究只是遵照人类设定的公式或推论,通过理论与结果之间的运算法则发挥作用。搜索树研究在游戏模式较为单一、计算量不大的情况下尚且有效,但是当模式数量繁多,或者涉及问题过于分散以至于无法具体分类时则难以应对。此外,当时的计算机性能较差,普及程度也并不广泛。因此,第一次人工智能热潮便退去了。

人工智能再一次受到关注是在20世纪80年代。当时,人们对于专家系统的期待非常高。专家系统是指原本需要专家做的工作由机器代为进行,其特点是将专家的知识进行规则化以便灵活运用。专家系统的应用尝试在医疗、会计、金融等领域进行,均取得了较好的效果。但是好景不长,在专家系统或知识工程获得大量的实践经验之后,弊端也开始逐渐显现,专家系统存在知识瓶颈的问题,因为它的运作需要大量的先验知识作为输入。由于专家系统的应用在20世纪90年代被认为已经达到了极限,因此人工智能再次进入“冬季”。

这个棘手的问题为人工智能带来了革命性的改变,人工智能逐渐演化成三大不同的学派——符号主义学派、联结主义学派和行为主义学派,并沿着不同的路径继续发展。

1.2 竞争——三大学派

专家系统遇到的难题使人们开始寻求其他的解决方式——如果让知识通过自下而上的方式涌现,而不是让专家们自上而下地设计出来,那么机器学习的问题其实可以得到很好的解决。自此人工智能逐渐演化为三大学派:一些人认为可以通过模拟大脑的结构(神经网络)来实现,被称为联结主义学派;还有一些人认为可以从那些简单生物体与环境互动的模式中寻找答案,被称为行为主义学派;而传统的人工智能则被称为符号主义学派。

1.2.1 符号主义学派

符号主义学派认为人工智能源于数理逻辑。数理逻辑从19世纪末开始迅速发展,到20世纪30年代用于描述智能行为,并在计算机上实现了逻辑演绎系统。我们在前文提到的“逻辑理论家”程序表明了计算机通过研究人类的思维过程可以模拟人类的智能活动。在人工智能中,机器定理证明是典型的符号主义的一个代表,而机器定理证明的方法之一是吴文俊先生创立的“吴文俊方法”。

该学派认为人类认知和思维的基本单元是符号,而认知的过程是对符号的逻辑运算,因此,人类抽象的逻辑思维就可以通过计算机中逻辑门的运算来模拟,实现机械化的人类认知。而麦卡锡则强调人工智能的智能并不体现在真实的具体行为中,而是体现在思维方式上。

基于麦卡锡的观点,发明“逻辑理论家”程序的纽埃尔和西蒙进一步推演得到物理符号系统假说,该假说认为任何能够将某些物理模式或符号转化成其他模式或符号的系统都有可能产生智能的行为,这也是符号主义学派名字的由来。基于该假说,符号主义学派的研究者们聚焦人类智能行为,如推理、决策、知识表达等,并取得了巨大的成功。

2011年,在美国电视节目《危险游戏》中,超级计算机沃森通过处理自然语言线索,在涉及各个领域的知识问答上战胜了人类。这说明计算机不仅能在初始条件确定的棋盘中获胜,而且在不确定的初始条件下,仍能够表现优异。但是经过一段短暂的喜悦后,符号主义学派逐渐走向衰弱。

1.2.2 联结主义学派

联结主义学派并不认为人工智能源于数理逻辑,也不认为人工智能的关键在于思维方式,这一学派将人工智能建立在神经生理学和认知学的基础上,强调人工智能是由大量简单的单元通过复杂的相互连接后并行运行的结果。

1959年,Hubel和Wiesel进行了一项观察猫的视觉神经元反应的实验。实验发现,某些神经元具有简单的模式功能,而复杂的模式功能是由简单的模式功能所构成的。后来,通过对猴子的视觉中枢的解剖实验发现,从视网膜到大脑皮层的信息传输是从低级区域到高级区域的传递,低级区域的输出成为高级区域的输入。低级区域识别图像中像素级别的局部特征,高级区域将局部特征组合成全局特征,形成复杂的模式,模式的抽象程度逐渐提高,直至语义级别。

上述发现启发计算机科学家发明了人工神经网络。人类的智慧主要来源于大脑的活动,而大脑则是由一万亿个神经元细胞经过错综复杂的连接构成的。联结主义学派认为神经元不仅是大脑神经系统的基本单元,还是行为反应的基本单元。通过大量的低级神经元对信息的处理和传递,将形成的复杂的信息作用于高级神经元,完成复杂的思维过程。

基于上述思路,联结主义学派构建了人工神经网络来模拟人类大脑。通过编程的手段,模拟人类大脑中神经系统的结构和功能;通过构建不同的神经系统层次形成不同的网络,应用于不同的场景。

近年来,深度学习技术的发展使得人们能够模拟视觉中枢的层级结构,考察每一级神经网络形成的概念。底层网络总结出各种边缘结构,中层网络归纳出眼睛、鼻子、嘴巴等局部特征,高层网络将局部特征组合,得到各种人脸特征。这样人工神经网络就佐证了视觉中枢的层次特征结构。

有关人工神经网络的研究在20世纪80年代末至90年代初达到巅峰,联结主义学派的研究者们提出了形式化神经元模型,将反馈学习算法应用于神经网络和多层网络中的反向传播算法,这些研究成果使人工神经网络在各个领域得到了广泛的应用。但是随后人们发现,如果网络的层数加深,那么最终网络的输出结果对于初始几层的参数影响微乎其微,整个网络的训练过程无法保证收敛,并且从理解层面来讲,人们虽然可以模拟人类大脑构建神经网络,但是并不清楚这些神经网络究竟是如何工作的。在这一阶段,计算机科学家针对不同的任务开发出了不同的算法。例如,针对语音识别开发了隐马尔科夫链模型,针对人脸识别开发了Gaber滤波器、SIFT 特征提取算法、马尔科夫随机场的概率图模型。因此,在这一阶段,人们倾向于开发专用算法。

但是随后Sharma的实验结果说明,大脑实际上是一台“万用学习机器”,同样的学习机制可以用于完全不同的应用场景。人类的DNA并不提供各种用途的算法,而只提供基本的普适学习机制,人的思维功能主要依赖于学习所得。后天的文化和环境决定了一个人的思想和能力。也就是说,学习的机制人人相同,但是学习的内容决定了人的思想。相比于符号主义学派,联结主义学派的方法在一定程度上实现了人类大脑形象思维的功能。

1.2.3 行为主义学派

行为主义学派认为行为是有机体用于适应环境变化的各种身体反应的组合,它的理论目标在于预见和控制行为。行为主义学派认为人工智能源于控制论,控制论把神经系统的工作原理与信息理论、控制理论、逻辑及计算机联系起来,其研究重点落脚于模拟人在控制过程中的智能行为和作用,如对自寻优、自适应、自学习等控制论系统的研究。行为主义学派将研究焦点放在了昆虫上,昆虫可以灵活地摆动自己的身体行走,还能够快速躲避捕食者的攻击,并在大量昆虫聚集在一起时能够表现出非凡的群体智能,形成严密的社会性组织。从时间角度来看,生物体对环境的适应还会迫使生物体进化,从而实现从简单到复杂、从低级到高级的跃迁。

行为主义学派的机械代表作首推美国麻省理工学院教授罗德尼·布罗克斯设计的六足行走机器人,它被视为“控制论动物”,是一个基于感知-动作模式模拟昆虫行为的控制系统。行为主义学派的算法代表则是美国科学家约翰·霍兰提出的遗传算法和美国心理学家詹姆斯·肯尼迪提出的粒子群优化算法。遗传算法对进化中的自然选择现象进行了高度抽象,通过变异和选择实现目标函数的最优化。粒子群优化算法则通过模拟动物的群体行为解决最优化问题。

但是行为主义学派的研究方法具有很大的局限性。行为主义学派的研究切入点从动物开始,并将从动物身上得到的结论在人类身上推广,却忽视了人类的特殊性,过于极端;行为主义学派否认生理和遗传对心理的作用,认为只要给予适宜的环境刺激,就可以塑造人类相应的行为反应,却忽视刺激反应之间人的主体性因素的作用,把人类看成一台受到刺激而做出被动反应的机器,把环境特别是社会环境看作人类行为的决定力量。因此,行为主义学派在解释人类行为时,难免要犯机械环境决定论的错误。

1.3 曙光——人工智能谁领风骚

至今,人工智能技术已经走过了60年的历程,在这段曲折的路途上,人工智能技术经历坎坷:经历了二十世纪五六十年代以及八九十年代的人工智能浪潮期,也经历了七八十年代的低谷期。人工智能的研究者们一直致力于研究使机器具备人工智能的方法,这些研究者主要来自计算机科学领域和神经生物学领域。前者主要通过编写计算机程序的方式模仿人类的智能行为,后者主要研究人类大脑皮层的工作原理。伴随着第三次人工智能浪潮的发展,我们可以看到第三次浪潮与前两次浪潮明显不同。由于数据的爆发式增长、CPU计算能力的大幅提高、硬件的快速迭代和深度学习算法的发展成熟,强大的深度学习算法在计算机视觉、语音识别、自然语言处理等领域均取得了显著的成就。显然,从人工智能的研究进展来看,源自计算机科学领域的研究占据了主流。

随着互联网的发展,全球每天产生的数据量达万亿GB,为深度学习的发展提供了良好的数据基础。研究者们也积极地为各领域收集和整理相应的数据库,如为计算机视觉研究提供帮助的ImageNet数据库。2012年,吴恩达和杰夫·迪恩利用1000台计算机、16000个芯片搭建了一个深度学习系统,该系统可以自动根据图片中物体的类别将图片进行分类。深度学习在语音识别领域也取得了显著的进展,苹果公司的Siri、微软公司的小冰、vivo的小艾和百度的小度都是比较成熟的语音识别技术产品并已投放市场。

随着人工智能的逐渐普及,各大公司纷纷开发与之相关的深度学习和机器学习框架,降低算法模型搭建和训练的门槛。2013年,应用于人脸识别、图片分类等图像处理技术的Caffe框架问世。2015年,谷歌开源了TensorFlow框架,提供了丰富的与深度学习相关的API,还提供了可用于自然语言处理、计算机视觉等多领域的可视化分析工具TensorBoard。

从算法模型的不断发展成熟和支撑底层算法技术的深度学习框架的开源,到大型深度学习数据库的建设及硬件设施、云计算服务的逐步完善,人工智能的高速发展为我们揭开了一个新时代的序幕。

1.4 人工神经网络

人工神经网络只是一组数学模型,因为这一组数学模型被用于模拟人类神经系统的架构与功能,所以才被仿生地命名为人工神经网络。早在1943年,神经科学家沃伦·麦卡洛克和沃尔特·彼茨就提出了一种假说,构建了人类神经节沿着网状结构传递和处理信息的模型。该假说一方面被用于研究人类的感知原理,另一方面则被计算机科学家们借鉴,将该模型称为人工神经网络。

1958年,弗兰克·罗森布拉特提出了用于简单模式识别的“感知机”模型,它是一个基于人工神经网络的两层结构模型。但是在1969年,人工神经网络的早期奠基人之一马文·闵斯基在《感知机》一书中讨论了人工神经网络难以解决的“异或难题”,这一讨论打消了大多数研究者继续坚持研究人工神经网络的念头。直到1975年,“异或难题”才被理论界彻底解决,人工神经网络的发展又回到正轨。但是由于当时的数据规模、硬件设施和服务无法支撑研究者们将网络层数加深后的计算量,所以人工神经网络的进一步研究经历了漫长的等待。

从数学的角度来看,人工神经网络是由一层或多层节点组成的有向图,每一层的节点都通过有向弧指向上一层的节点,每一条有向弧都用一个权值来描述,同一层的节点之间并无连接。输入层的节点按照有向弧的权值进行函数变换,变换后的输出传递给第二层的节点作为输入;第二层的节点如此这般执行同样的操作,其输出再作为第三层的输入。最后在输出层,哪个节点的数值最大,其输入的信号就被划分在哪一类。

而搭建后的人工神经网络需要输入大量的数据进行训练,通过负反馈的方式动态调整人工神经网络中的权重值,使其参数尽可能地逼近真实模型的参数。既然我们希望网络的分类结果尽可能地接近真正的情形,就可以通过比较网络当前的输出值和真实值,再根据两者的差异情况来更新每一层的权重值以降低偏差。如果人工神经网络的预测值偏高,就调整权重值使输出变低;反之,则调整权重值使输出变高。就这样不断地调整,直到偏差小于某个特定的阈值为止,这时我们就认为人工神经网络达到了精确的分类。具体的训练方法则依靠反向传播算法:最开始输入层输入特征向量,通过人工神经网络层层计算获得输出,输出层发现输出和正确的类号不一样,这时它就让最后一层神经元进行参数调整,最后一层神经元不仅自己调整,还会勒令连接它的倒数第二层神经元调整,层层往回倒退调整。经过调整的人工神经网络会在样本上继续测试,如果输出还是老分错类,那就继续来一轮“回退调整”,直到人工神经网络的输出令人满意为止。

网络结构和激活函数的协调性、训练数据的质量和完备性、训练方法的合理性决定了人工神经网络预测结果的准确性。其中,网络结构的类型和激活函数是预先设计的,而训练数据是由外部导入的,训练方法是作为超参数输入的。决定模型好坏的首要因素是网络结构和激活函数,其协调性决定了人工神经网络的输入数据在应用场景中的合理性。此外,训练数据的质量和数据预处理的方法对人工神经网络的输出也有很大的影响。我们将在后面的章节中逐一介绍人工神经网络衍生的几种算法模型。 L8prsFcXo364qs5ak2pHu18s2XrweEnr0/SiGWmkC2FULDX6ylycmLWu/VN80oyc

点击中间区域
呼出菜单
上一章
目录
下一章
×