人工智能究竟是什么呢?相信第一次接触它的人都会提出这样的疑惑,那么今天就带领读者了解现在最热门的话题——人工智能。人工智能的概念主要由艾伦·图灵提出:机器会思考吗?如果一台机器能够与人类对话并不被识别出机器身份,那么这台机器拥有智能特征。在20世纪60年代,人工智能被人们认为是一台通用的机器人,它可以使用语言,并且具有对所有领域进行记忆、推理和解决问题的能力,也可用于解决人类社会存在的问题。到20世纪80年代,人们认为仅仅具有推理能力是远远不够的,机器要获得真正的智能,必须具有躯体,它需要感知、移动和生存,不停地与这个世界打交道。简而言之,机器是用来延伸和扩展人类智慧的。
在人工智能的发展中,经历三次热潮和两次寒冬,寒冬主要是受到计算机运算能力、性能问题及缺乏大量数据的影响。但是第三次热潮在摩尔定律的推动下,计算机性能不断提高,云计算、大数据、机器学习领域不断发展,为人工智能的发展带来一个前所未有的机会。
人工智能最具有代表性的实例,就是IBM(国际商业机器公司)的超级计算机“深蓝”在国际象棋领域和Google的AlphaGo在国际围棋领域都战胜了人类。可能读者觉得这两个实例都是博弈问题并没有什么区别,但其实象棋和围棋的难度完全不在一个级别,围棋走法千变万化,因此围棋困难程度更高。更重要的是,深蓝和AlphaGo本质的区别在于“深蓝”是程序人员将知识和经验加入程序,而AlphaGo的代码是自动更新的,知识和经验是自己训练的,是一种有着自我学习能力的人工智能系统。
人工智能是有所分类的,研究人员将人工智能分为强人工智能和弱人工智能。强人工智能是指可以超越人类水平的人造物,具有人类的意识和思想,可以根据自己的意图展开行动,并通过自我学习和从经验中学习对所有领域进行记忆、推理、思考和解决问题的一台“人造智能”机器。弱人工智能则希望可以借鉴人类的智慧,只专注于特定的领域解决特定的问题,例如,图像处理、语音识别、翻译,多数是通过统计数据从而归纳出实用模型,以便减轻人类智力和体力劳动,本质上体现的是“高级仿生学”的概念,是一种使用工具。人工智能现在所取得的成就主要是针对弱人工智能的,它们都是在考虑某种特定类型的智能行为。本章所谈及的人工智能都是针对弱人工智能的。
在如今大数据发展迅猛的时代,人工智能不可或缺。传统的人工智能研究方法以确定性作为基础,出现了以符号主义、联结主义和行为主义为主的学派,各学派的代表方法分别是功能模拟法、结构模拟法和行为模拟法。但是随着研究的深入和相关学科的发展,人们逐渐意识到只有将不确定因素和确定因素统一,才能有真正的人工智能。其中不确定因素的人工智能方法包括概率理论、模糊集、粗糙集和非单调逻辑等。因此,本节将从确定性和不确定性来探讨人工智能的研究方法。
确定性人工智能研究方法主要包括功能模拟法、结构模拟法和行为模拟法,其中功能模拟法和结构模拟法是人工智能比较成熟的方法。
功能模拟法比较成熟的方法是形式化方法,即建立一个可以进行推理和演绎的形式化系统。该系统主要包含符号表、语法、公式和推理规则4个部分:符号表是系统符号的规定;语法规定系统的书写规定;公式即系统使用的公理;推理规则是用于规定如何从一个公式或序列推出另一个公式或序列。
结构模拟法则主要是模拟人脑的神经系统,以神经元作为一种连接。但是这两种方法在人工智能的研究中都遇到了无法克服的困难。从功能模拟法上看,计算机在模拟人类智慧时,无法做到一种完全的形式化,以及形式化的问题不是完全可以计算的。再从结构模拟法上看,计算机从硬件上模拟人类大脑是基本无法实现的,因此就会涉及计算机的并行运算,但是计算机的并行运算就会带来形式化的计算问题。
再看行为模拟法,它主要是从人的感知和行为考虑的一种方法,但是现在的研究依然处于一种底层的智能行为。因此,面对这些困难,一些学者也开始展开思维科学的研究、采用多学科联合的方式,希望通过这些方法可以解决确定性人工智能研究方法的不足。
不确定性人工智能研究方法主要包括概率理论、模糊集、粗糙集和非单调逻辑。概率理论用于处理随机事件中的不确定性问题,包括必然性和偶然性。模糊集是一种模糊性对象集合的概念。粗糙集主要是通过不确定性本身提供的信息来研究不确定性,也就是说该方法的优势在于不需要先验数据,主要是通过学习已有的知识库去推断不确定的信息。非单调逻辑,是一种具有定义域的开放性和值域的不确定性的方法,这种方法的特点是新知识对原有知识的补充,但是在新知识和原有知识发生冲突的情况下,知识将被重新划分和学习。
然而,这些方法在使用过程中都有一定局限性:概率理论中存在Zipf定理;模糊集中存在隶属度问题;粗糙集方法用于大规模数据时,则会出现计算复杂的问题,这将可能引起组合爆炸;非单调逻辑则是偏向于思维层次的否定。虽然这些方法有一些不足之处,但依然是实现人工智能的有效方法。
人工智能应用范围极为广泛,从应用的角度看,人工智能主要包含专家系统、自然语言理解、机器学习、自动定理证明、自动程序设计、机器人技术、分布式人工智能、模式识别、博弈、计算机视觉、软计算、智能控制和智能规划等内容,下面将介绍几种在机器人学和智能机器人方面常用的人工智能技术。另外,智能接口、数据挖掘、主体及多主体系统也是人工智能当前研究的三个热点。
专家系统(Expert System, ES)是人工智能重要的研究领域之一,最早由斯坦福大学提出。这些系统主要侧重于示例性地在人类智能或专业知识的水平上解决特定领域中的复杂问题。专家系统具有高响应性、可靠性、准确性和高性能等特点。虽然在决策过程中它们无法取代人类,但它们是人类的顾问,可以帮助诊断、解释、预测、证明和推理。任何专家系统都包括3个核心组件:知识库、推理引擎和用户界面。专家系统已经在许多领域中大量使用,包括一些欺诈检测(金融领域中的可疑交易和股票市场内幕交易行为的识别)、关键疾病诊断和医疗领域中疾病根本原因的推断,以及通过监测来分析系统中潜在行为目前的状态与先前监测的状态的变化。
另外,本节为了方便大家更好地理解专家系统,给出一个普通的专家系统的结构图,如图4-1所示,它的基本系统结构通常由人机交互界面、知识库、综合数据库、推理机、解释器、知识获取6个部分构成。可以看出专家系统的本质是一段程序,是先把某一领域的专家知识及专家如何解决问题的经验输入知识库,然后根据推理机、解释器去模拟专家解决问题的过程。
图4-1 专家系统结构图
自然语言处理(Natural Language Processing, NLP)是计算机科学中的一个专业领域,即从自然语言或人类语言中分析和推导有意义的信息。在高层次上,这需要采用形式化技术,如标记化,在特定商业案例背景下的关系提取、单词分类和句子检测。对于语言,语法是指语言遵循的基本规则,语义是指其含义。自然语言处理的复杂性来自文本的含义可能含混不清并且可能随着上下文而改变。例如,单词“饱和度”与颜色一起使用时和与人类行为一起使用时可能具有不同的定义。
自然语言处理已经用于解决各学科的问题,例如,在各种搜索中,在更大的内容环境中识别文本的特定元素。在机器翻译中,机器文本从一种自然语言翻译成另一种语言。在命名实体识别中,从文本中提取位置、人员和事物的名称。在信息分组中,基于文本内容和上下文对文本进行分类。在情感分析中,通常用于感知并提供有关诸如书籍或电影等产品在市场中表现的反馈。语音识别中,自动分析和理解与人类对话的背景。虽然自然语言理解在很多领域都已经广泛应用,但是实现自然语言处理系统的通用和高质量两大特性依然是研究者们奋斗的目标。
机器学习是人工智能最基本的概念,也是人工智能的一个核心研究领域,主要是探索和研究从数据中学习并基于学习设计预测算法。机器学习是一种将智能融入机器的方式,因此它可以随着时间的推移学习并使用自己的经验。它的主要目的是让机器具有学习和推理的能力,随着可用数据越来越多,计算机程序的性能也将会提高。
另外,机器学习又被称为归纳学习,因为代码试图仅从数据中推断出结构。在机器学习过程中,通常分为学习和推理两大步骤。学习阶段的目标是描述数据,包括提取训练集和测试集的特征向量用于对齐训练集和测试集样本的分布,并将其汇总到模型中,而这个模型则是一种开放的解释性程序,数据量越多,对模型效果的增强作用越大;推理阶段则需要选取最优的目标函数,也是机器学习的关键。机器学习常见的分类有监督学习、无监督学习和强化学习,监督学习和无监督学习的区别在于是否利用测试集中的标签数据信息;强化学习通过观察环境如何对行动做出反应来训练收集的信息,换句话说,强化学习是一种机器学习,它与环境相互作用,发掘最有利结果的行动组合。虽然机器学习依然处在初级发展的阶段,但是机器学习的未来发展将会给人们的生活带来巨大的影响。只有不断地发展机器学习,人工智能才能有新的突破。
机器人技术是一门计算机科学学科,负责处理物理机器人或机器的设计、研究、编程和开发,这些机器人或机器是用于执行需要由人类完成的任务。机器人技术的采用最初是针对一些对人类健康有害的工作,如焊接、铆接、采矿、清洁有毒废物或消除炸弹等,或那些需要高精度的工作及不允许人为失误的工作,例如在医疗领域中的手术过程。
虽然机器人技术已经发展了几十年,但直到现在,机器人在日常生活中的使用还处于初步阶段。随着物联网和大数据的出现,大量流数据的分析和同化不再是一个挑战性问题。例如,如果查看自动驾驶汽车上的简单传感器,它会每毫秒或每秒处理数十万个数据点,以评估车辆能否安全准时到达目的地。
模式识别是人工智能研究的一个重要领域,是模拟人类对外界事物感知能力的智能识别系统。在建立模式识别模型的前期,需要对来自训练集和测试集的样本数据进行预处理。通常的预处理方法是归一化方法,再将归一化后的样本进行特征表示,希望能够学习到训练集和测试集相同或相似的特征表示,其目的是希望达到测试集和训练集的样本分布空间相似。样本空间度量准则中,常用的有Waserstein距离度量、最大均方差异和散度度量等度量准则,为了减小测试集和训练集的分布差异,选择合适的度量准则也是一个关键步骤。在将训练集和测试集的分布对齐后,则可以选取模式识别方法,常用的模式识别方法包括支持向量机、极限学习机、回归和分类等方法。不同的模式识别方法也会在测试集的样本识别精度上表现出不一样的效果。
现实生活中,在图像、声音、文字、语言和符号等很多领域都有模式识别的应用,可以说人类的生活环境已经不能离开模式识别技术,如指纹支付、人脸支付和搜索方式等,这些都是人们常见的模式识别技术应用。模式识别是一个不断发展的新科学,它的理论基础和研究范围也在不断发展。
计算机视觉,也称为视觉,是计算机科学中最前沿的领域,涉及计算机、设备或机器能够理解、解释或操纵所视内容。它是一个多学科领域,图4-2描述了计算机视觉与其他学科的关系。
计算机视觉技术实现了深度学习技术,并且在少数情况下还采用NLP技术作图像分析提取文本的步骤。随着深度学习的发展,对象分类、检测、跟踪和图像处理等技术变得更加简单和准确,从而开辟了探索更复杂的自主应用程序的道路,如自动驾驶汽车、人形机器人和无人机。另外计算机视觉研究的任务是图像理解,核心是分割技术,将图像进行像素级分割,然后标记和分类。在通过深度学习的方式处理图像时,可以消除图像的背景噪声并且突出显示焦点对象,也可将人物的特征叠加到另一张脸上或将图片转换为草图模式或水彩绘画模式,或者使用最颤抖的手也可以拍摄稳定的图像。在处理图像时可以估计物体的密度、结构、形状和纹理等特征,因此即使是不同的灯光或相机曝光,依然可以识别之前看见的物体。在计算机视觉中,让计算机“看”,其实是希望计算机能够处理数字视觉数据,其中包括用传统相机拍摄的图像、位置的图形表示、视频、热强度图等任何数据。计算机视觉在日常生活中无处不在,可以在视频或实时视频中找到对象,了解视频中的动作和模式,调整图像的大小、亮度或清晰度。因此发展计算视觉技术势在必行。
图4-2 计算机视觉与其他学科的关系
今日的人工智能到底能够做什么?人工智能已经开始深入人类的生活中,呈现出“人工智能+”的态势,接下来将通过几个例子介绍人工智能带给人类生活的影响及其发展趋势。
人工智能在医疗领域的代表应用是腾讯聚合了公司内部包括人工智能Lab(人工智能实验室)、优图实验室、架构平台部等多个顶尖人工智能团队的研究成果,并在此基础上推出医疗产品“腾讯觅影”。该产品已与国内100多家三甲医院达成合作,通过共建人工智能联合医学实验室的形式,推进人工智能在医疗领域的研究与应用。截至2018年7月,“腾讯觅影”已累计辅助医生阅读医学影像超1亿张,服务患者90余万人,提示风险病变13万例,开启了国内人工智能医学的“爆发元年”。
家庭是人类重要的社交生活场所之一,也是人工智能应用较为广泛和影响度较高的领域。通过语音控制设备,轻松调节家里的风扇、空调、空气净化器等家电,这样的场景如今已经实现。智能家居已经从生态之争发展到产品互联拓展的全平台之争了。所以,智能家居算是目前进展得比较顺利的人工智能应用了。
如今工业园区越来越多,实行园区信息化是提升园区管理效能的有效手段,因此在园区的管理中主要通过“互联网+”技术和智慧运维平台的搭建,融入物联网、人工智能等核心技术,为园区和入驻企业的产品与服务提供智能展示平台,实现园区的信息可视化,帮助企业打造营销策略,从而提高园区的管理能力和服务质量,为园区带来最大化经济价值。
人工智能在教育方面可以帮助人们实现个性化教育,帮助学习者对自身的学习、心理状况进行自我评价,还可以帮助老师节约更多的时间关心学生的个人情况,从而有效提升了教育的管理质量。
人工智能在这个领域的应用比较常见,如苹果Siri、微软小冰等,都是大家频繁接触的基础应用。随着聊天机器人日益发展成真正的智能助理,其可以帮助用户做很多事情,而人类赋予聊天机器人的自主权也面临诸多挑战。智能助理需要在确定的框架下运行,包括如何与人类交互、如何做出决定、如何理解并利用获取的信息。