将人类与其他动物区分开的特征之一就是省力工具的使用。人类发明了车轮和杠杆,以减轻远距离携带重物的负担。人类发明了长矛,从此不再需要徒手与猎物搏斗。数千年来,人类一直致力于创造越来越精密复杂的机器来节省体力,然而,能够帮助我们节省脑力的机器却只是一个遥远的梦想。时至今日,我们才具备了足够的技术实力来探索更加通用的思考机器。虽然计算机面世还不到100年,但我们日常生活中的许多设备都蕴藏着人工智能技术。
1950年,在计算机发明后不久,图灵提出了一套检测机器智能的测试,也就是后来广为人知的 图灵测试 。在测试中,测试者分别与计算机和人类各交谈五分钟,随后判断哪个是计算机,哪个是人类。当时图灵认为,到2000年,测试者答案的正确率可能只有70%。每一年,所有参加测试的程序中最接近人类的那一个将被授予由图灵创办的勒布纳人工智能奖。
到目前为止,还没有出现任何程序能够如图灵预测的那样出色,但它们的表现确实越来越好了,就像象棋程序能够击败象棋大师一样,也许计算机最终一定可以像人类一般流畅交谈。当那天来临的时候,会话能力显然就不能再代表智力了。
数十年来,研究人员一直使用图灵测试来评估机器仿人思考的能力。如今,研究者认为应该更新换代,开发出新的评判标准,以驱动人工智能研究在现代化的方向上更进一步。新的图灵测试会包括更加复杂的挑战,例如,由加拿大多伦多大学的计算机科学家赫克托·莱维斯克所建议的“威诺格拉德模式挑战”。这个挑战要求人工智能回答关于语句理解的一些常识性问题。例如,这个纪念品无法装在棕色手提箱内,因为它太大了。问:什么太大了?回答0表示纪念品,回答1表示手提箱。
也有学者建议在图灵测试中增加对复杂资料的理解,包括视频、文本、照片和播客。例如,一个计算机程序可能会被要求“观看”一个电视节目或者视频,然后根据内容来回答问题,像“为什么电视剧《天龙八部》中,契丹人萧远山的儿子叫乔峰?”
作为计算机科学的一个分支,人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术学科,是一门自然科学、社会科学和技术科学交叉的边缘学科,它涉及的学科内容包括哲学和认知科学、数学、神经生理学、心理学、计算机科学、信息论、控制论、不定性论、仿生学、社会结构学等。
人工智能研究领域的一个较早流行的定义,是由约翰·麦卡锡在 1956年的达特茅斯会议 上提出的,即 人工智能就是要让机器的行为看起来像是人类所表现出的智能行为一样 。另一个定义指出:人工智能是人造机器所表现出来的智能性。总体来讲,对人工智能的定义大多可划分为四类,即机器“像人一样思考、像人一样行动、理性地思考和理性地行动”。这里“行动”应广义地理解为采取行动或制定行动的决策,而不是肢体动作。
美国斯坦福大学人工智能研究中心尼尔逊教授对人工智能下了这样一个定义:“人工智能是关于知识的学科—怎样表示知识以及怎样获得知识并使用知识的学科。”而温斯顿教授认为:“人工智能是研究如何使计算机去做过去只有人才能做的智能工作。”这些说法反映了人工智能学科的基本思想和基本内容,即人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软/硬件来模拟人类某些智能行为的基本理论、方法和技术。
可以把人工智能定义为一种工具,它用来帮助或者替代人类思维。它是一项计算机程序,可以独立存在于数据中心,在个人计算机里,也可以通过诸如机器人之类的设备体现出来。它具备智能的外在特征,有能力在特定环境中有目的地获取和应用知识与技能。
人工智能是对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考,甚至也可能超越人的智能。自诞生以来,人工智能的理论和技术日益成熟,应用领域也不断扩大,可以预期,人工智能所带来的科技产品将会是人类智慧的“容器”。因此,人工智能是一门极富挑战性的学科。
20世纪70年代以来,人工智能被称为世界三大尖端技术之一(空间技术、能源技术、人工智能技术),也被认为是21世纪三大尖端技术(基因工程、纳米科学、人工智能)之一,这是因为近几十年来人工智能获得了迅速的发展,在很多学科领域都获得了广泛应用,取得了丰硕成果。
人工智能的传说甚至可以追溯到古埃及,而电子计算机的诞生使信息存储和处理的各个方面都发生了革命,计算机理论的发展产生了计算机科学并最终促使了人工智能的出现。计算机这个用电子方式处理数据的发明,为人工智能的可能实现提供了一种媒介。
对于人的思维模拟的研究可以从两个方向进行,一是结构模拟,仿照人脑的结构机制,制造出“类人脑”的机器;二是功能模拟,对人脑的功能过程进行模拟。现代电子计算机的产生便是对人脑思维功能的模拟,是对人脑思维的信息过程的模拟。于是,实现人工智能有三种途径,即强人工智能、弱人工智能和实用型人工智能。
强人工智能 又称多元智能,研究人员希望人工智能最终能成为多元智能并且超越大部分人类的能力。有些人认为要达成以上目标,可能需要拟人化的特性,如人工意识或人工大脑。上述问题被认为是人工智能的完整性:为了解决其中一个问题,你必须解决全部的问题。即使一个简单和特定的任务,如机器翻译,要求机器按照作者的论点(推理),知道什么是被人谈论(知识),忠实地再现作者的意图(情感计算)。因此,机器翻译被认为具有人工智能的完整性。
强人工智能不再局限于模仿人类的行为,这种人工智能被认为具有真正独立的思想和意识,并且具有独立思考、推理并解决问题的能力,甚至这种人工智能具有和人类类似的情感,可以与个体进行共情。强人工智能观点的倡导者指出,具有这种智能级别的事物,已经不再是人类所开发的工具,而是具有思维的个体,从本质上来说已经和人类没有差别了—因为人类也可以看作一台有灵魂的机器。既然机器有了灵魂,为何不能成为“人类”?这其中更是涉及了“何为人”的哲学探讨,这种探讨在诸多的科幻小说中也多有描述,其中重要的载体就是这种“强人工智能”。虽然强人工智能和弱人工智能只有一字之差,但就像物理学中的强相互作用力和弱相互作用力一样,二者含义有着巨大的差别:这种“强”其实是一种断层式的飞跃,是一种哲学意义上的升华。
强人工智能的观点认为有可能制造出真正能推理和解决问题的智能机器,并且这样的机器将被认为是有知觉、有自我意识的。强人工智能可以有两类:
(1)类人的人工智能,即机器的思考和推理就像人的思维一样。
(2)非类人的人工智能,即机器产生了和人完全不一样的知觉与意识,使用和人完全不一样的推理方式。
强人工智能即便可以实现也很难被证实。为了创建具备强人工智能的计算机程序,我们必须清楚了解人类思维的工作原理,而想要实现这样的目标,我们还有很长的路要走。
弱人工智能 观点认为不可能制造出能真正地推理和解决问题的智能机器,这些机器只不过看起来像是智能的,但是并不是真正拥有智能,也不会有自主意识。
弱人工智能指的是利用设计好的程序对动物以及人类的逻辑思维进行模拟,所指的智能体表现出与人类相似的活动,但是这种智能体缺乏独立的思想和意识。目前就算最尖端的人工智能领域也仅仅停留在弱人工智能的阶段,即使这种人工智能可以做到人类难以完成的事情。甚至有人工智能学者认为,人类作为智能体,永远不可能制造出真正能理解和解决问题的智能机器。就目前的生活来看,这种弱人工智能已经完全融入到了我们的生活环境之中:譬如手机中的语音助手、智能音箱等。但是说到底,这些只是工具,被称为“机器智能”或许更为贴切。
1979年,汉斯·莫拉维克制成了斯坦福马车(见图1-18),这是历史上首台无人驾驶汽车,能够穿过布满障碍物的房间,也能够环绕人工智能实验室行驶。
弱人工智能只要求机器能够拥有智能行为,具体的实施细节并不重要。深蓝就是在这样的理念下产生的,它没有试图模仿国际象棋大师的思维,而是仅仅遵循既定的操作步骤。倘若人类和计算机遵照同样的步骤,那么比赛时间将会大大延长,因为计算机每秒验算的可能走位就高达2亿个,就算思维惊人的象棋大师也不太可能达到这样的速度。人类拥有高度发达的战略意识,这种意识将需要考虑的走位限制在几步或是几十步以内,而计算机的考虑则数以百万计。就弱人工智能而言,这种差异无关紧要,能证明计算机比人类更会下象棋就足够了。
如今主流的研究活动都集中在弱人工智能上,并且一般认为这一研究领域已经取得可观的成就,而强人工智能的研究则处于停滞不前的状态。
实用型人工智能的研究者们将目标放低,不再试图创造出像人类一般智慧的机器。眼下我们已经知道如何创造出能模拟昆虫行为的机器人(见图1-19)。例如,机械家蝇看起来似乎并没有什么用,但即使是这样的机器人,在完成某些特定任务时也是大有裨益的。例如,一群如狗大小,具备蚂蚁智商的机器人在清理碎石和在灾区找寻幸存者时就能够发挥更大的作用。
图1-18 斯坦福马车
图1-19 华盛顿大学研制的靠激光束驱动的RoboFly昆虫机器人
随着模型变得越来越精细,我们的机器能够模仿的生物越来越高等,最终,我们可能必须接受这样的事实:机器似乎变得像人类一样智慧了。也许实用型人工智能与强人工智能殊途同归,但考虑到一切的复杂性,我们不会相信机器人是有自我意识的。
大数据是物联网、Web和信息系统发展的综合结果。大数据相关的技术紧紧围绕数据展开,包括数据的采集、整理、传输、存储、安全、分析、呈现和应用等。大数据的价值主要体现在分析和应用上,例如大数据场景分析等。
人工智能是典型的交叉学科,研究的内容集中在机器学习、自然语言处理、计算机视觉、机器人学、自动推理和知识表示六大方向。机器学习的应用范围比较广泛,例如自动驾驶、智慧医疗等领域都有广泛的应用。人工智能的核心在于“思考”和“决策”,如何进行合理的思考和合理的行动是人工智能研究的主流方向之一。
大数据和人工智能虽然关注点不同,但是却有密切的联系, 一方面人工智能需要大量的数据作为“思考”和“决策”的基础,另一方面大数据也需要人工智能技术进行数据价值化操作,例如机器学习就是数据分析的常用方式。在大数据价值的两个主要体现当中,数据应用的主要渠道之一就是智能体(人工智能产品),为智能体提供的数据量越大,智能体运行的效果就会越好,因为智能体通常需要大量的数据进行“训练”和“验证”,从而保障运行的可靠性和稳定性。
大数据相关技术已经趋于成熟,相关的理论体系逐步完善,而人工智能尚处在行业发展的初期,理论体系依然有巨大的发展空间。从学习的角度来说,从大数据开始是个不错的选择,从大数据过渡到人工智能也会相对比较容易。总的来说,两个技术之间并不存在孰优孰劣的问题,发展空间都非常大。