人工智能基础最新章节_尹宏鹏著

1.3 人工智能的应用领域

1.3.1 智能感知

智能感知以视觉和听觉为主，研究使机器具有类似人的感知能力。智能感知包含模式识别、自然语言处理和计算机视觉等内容。

1）模式识别

模式识别是对表征事物以及现象的各种形式信息的处理分析，从而对事物及现象完成描述、辨认、分类和解释的过程。在对事物及现象观察时，通常是通过寻找与其他事物现象的异同，按照一定的标准将不完全相同的事物现象归纳为一类，从而形成“模式”这一概念。

模式识别主要研究感知对象，以及在指定任务下运用计算机实现模式识别这两大内容。研究模式识别的方法有感知机、统计决策方法、基于基元关系的句法识别方法和人工智能方法。

通常，在计算机上的模式识别系统由数据采集、数据处理和分类决策或模型匹配 3 个基础部分构成。上述任一模式识别方法均通过传感器将对象的物理变量转换为能被计算机识别的数值或符号集合。提取利于识别的有效信息，对这些数值或符号集合的处理包括消除噪声、排除不相干信号、与对象的性质和识别方法相关的特征计算及变换等。再通过特征选择提取或基元选择形成模式的特征空间，模式分类或模式匹配在此特征空间上进行，系统输出即对象分类类型，或者为模型数据库中最相似的模型编号。

早期的模式识别主要是对文字和二维图像的识别，但从 20 世纪 60 年代开始，机器视觉方向转为面向解释和描述更为复杂的三维景物。随后，模式识别对更复杂景物和复杂环境中寻找目标及室外景物分析深入研究。目前而言，研究工作集中在活动目标的识别和分析上，景物分析也随之研究实用化。

2）自然语言处理

自然语言通常是指人类的书面语言和口头形式的自然语言信息，故自然语言处理涉及语言学、数学和计算机多个学科的领域知识。学术界对自然语言处理的研究逐渐分为两种主流：一种面向机器翻译；另一种面向人机接口。两种主流的主要研究任务均为建立如文字自动识别系统、语音自动合成系统、机器翻译系统等自然语言处理系统。

自然语言理解是自然语言处理的基础，经历了 3 个时期的研究，早期是以关键词匹配技术为主流，中期则以句法-语义分析方法为主流，目前转向其实用化和工程开发。其间词法分析、句法分析、语境分析的技术得到了完善和发展，其中短语结构语法、基于格语法及基于合一的语法理论的提出，扩充了计算语言学、语料库语言学和计量语言学理论。

自 20 世纪 90 年代起，自然语言处理针对大规模的真实文本，引入了语料库的方法，其中涵盖了统计方法、基于实例的方法、语料库转化为语言知识库的语料加工方法。以能够处理任意输入的源语言的机器翻译系统为例，其实现方式分为三大类：直接方式、转换方式、中间语言方式。由于它们的共同点是机器翻译系统要求较大的规则库和词典，因此是基于规则的方法。目前基于实例，建立大规模双语对译语料库和最佳匹配检索技术调整机制的方法已成为研究热点。机器翻译系统在应用上，有人助机译、机助人译的形式，通常还要求译前编辑和译后编辑，所以机器翻译系统性能及译文质量评价的优化也是研究重点。

3）计算机视觉

计算机视觉是指计算机进行图像处理、分析和理解、识别不同模式的目标和对象的能力，旨在实现类似于人的视觉感知能力。借助计算机视觉技术，计算机运用由图像处理操作以及其他技术组成的序列来将图像分析任务分解成小块任务，例如，识别先从图像中检测到物体的边缘和纹理，再分类识别特征来获取物体的形状、类别、位置、物理特性，并在此基础上实现决策。

一般的计算机视觉实现过程如下：

①获取图像；

②提取图像边缘、周长、惯性矩等特征；

③在已知特征库给出特征匹配最优的结果。

在获取图像常见的灰度图中，物体首先经过透视投影形成光学图像，在取样和量化后生成各像元灰度值的二维阵列，也称为数字图像。激光或超声波测距装置得到的距离图像，以物体表面一组离散点深度信息的形式，同样能够作为提取图像。近年来，获取视觉信息逐渐转为传感器组实现的数据融合方法。在特征提取和匹配中，计算机视觉分为低层视觉和高层视觉。低层视觉实现有边缘检测、动态目标检测、纹理分析等的预处理功能；高层视觉理解处理后的形象。

近期计算机视觉的研究热点集中于实时并行处理、主动式定性视觉、动态和时变视觉、三维图像的建模与识别、实时图像压缩传输与复原、多光谱及彩色图像处理与解释。

计算机视觉广泛应用于多个领域，如二维码识别、指纹自动鉴定系统、医疗成像分析、安防监控系统、遥感图像自动解释系统、无损缺陷检测系统等。同时计算机视觉作为机器人的支撑技术，对无人驾驶的自动导航驻车、自主式机器人的功能实现也起到了关键作用。

1.3.2 智能推理

智能推理对通过感知得来的外部信息及机器内部的各种工作信息进行有目的的处理，是人工智能研究中最重要、最关键的部分。它使机器能够模拟人类的思维活动，同时具有逻辑思维和形象思维。针对不同的情况得出合适的结论，推理可以大致划分为演绎和归纳。在演绎推理中，前提的真理保证了结论的真理性；在归纳推理中，前提的真理仅支持结论，但不保证结论的真理性。由于归纳推理通过收集数据并建立试验模型来描述和预测未来行为，直到出现异常数据去修正模型，因此常用在科学中。由于定理的复杂结构由一些基础公理规则的组合构成，演绎推理较多出现在数学及逻辑学中。

逻辑是推理的理论基础，而人工智能中的逻辑主要是经典逻辑的谓词逻辑和由其拓展衍生的非经典逻辑。经典逻辑的谓词逻辑作为形式语言，其强大的表达能力给计算机的智能推理提供了可能，其中一阶谓词逻辑还实现了计算机的“自然演绎”和“归结反演”两种推理功能。而非经典逻辑囊括多值逻辑、多类逻辑、模糊逻辑、模态逻辑、时态逻辑、动态逻辑、非单调逻辑等一系列经典逻辑之外的逻辑，以弥补经典逻辑的不足。如模态逻辑，在经典逻辑的“二值”演算中引入“可能”与“必然”等模态算子，以克服经典逻辑非真即假的局限性。对非经典逻辑细分，又可分为多值逻辑、模糊逻辑一类的语义扩充逻辑，以及模态逻辑、时态逻辑一类的语构扩充逻辑。前者对经典逻辑的语义进行扩充，使用语言与经典逻辑一致，但部分定理不再成立，而是添加新的概念定理；后者对经典逻辑的语构进行扩充，沿用经典逻辑的定理，但对其语言和定理都作了一定程度的扩充，例如，模态逻辑的“可能”和“必然”算子对经典逻辑词汇的扩充。

1）问题求解

在智能推理中，问题求解的研究要求人工智能能够根据复杂问题的各种特点，将其划分成多个更为简单的子问题，例如，国际象棋中的规划问题和数学自动运算。这种人工智能的问题求解实际上包含了搜索和问题归约两个分支内容。在问题求解上，人工智能已实现解空间的搜索和求出较优解，但目前存在着两大障碍：对人类一些较为复杂的、难以用规则明确表达的能力，例如，对棋盘的洞察力，人工智能还缺乏相应的理论研究来模拟；对某一些求解问题，人工智能不能很好地理解其原概念，也是问题表示的选择。

2）定理证明

基于实时数据库，如果其中的事实均是以独立的数据结构表示的，那么人工智能的定理证明程序就能够证明这种事实得出的定理。人类在一个定理证明的过程中，通常是合理地给出某种假设，从而运用演绎甚至直觉能力，选择优先需要证明的引理，逐一解决分支子问题，从而实现主问题的求解，即完成其定理的证明。

3）专家系统及知识库

专家系统是一种模仿人类专家思维活动的计算机程序，以知识库中的专业领域知识为推理基础，运用推理和判断解决某一特定领域的问题。故专家系统主要包含：知识库，即知识集合，处理特定领域知识的各种知识组成的集合；推理程序，其中包含一般的求解问题使用的推理方法和控制策略的知识。

知识库具有数据库类似的组织、管理、维护及优化技术，由知识库管理系统支持知识库的运维。知识库要求知识在计算机中有专门的表示方法和形式，这涉及对知识物理结构和逻辑结构的研究，故知识库技术通常与知识表示技术相关。所以在专家系统及知识库的研究内容中，包含了知识的分类、知识的一般表示模式、模糊知识的表示、知识分布表示、知识库模型、知识库管理系统等。

首先需要对人类专家的求解思维作简要了解。人类专家拥有大量的专门知识，但更为重要的是，他们具有根据具体问题情况而选择知识和运用知识的能力，这种选择知识和运用知识的能力，在专家系统范畴中，分别称为推理方法和控制策略。所以，对专家系统的要求，应类比于人类专家，能够详细阐述求解问题的全过程，说明推理完成后定下结论的理由，以及不能得到期望结论的具体原因。

特定领域知识中经常出现的知识不确定性及不精确性，是由于专家系统知识库的获取也是现实进行的，专家系统的研究之一就是使专家系统能够将上述这些模糊知识用于推理判断过程，最终实现解释、预测、诊断、设计、规划、监督、排错、控制等功能。

专家系统的实现，目前已经形成了较为标准的流程：识别、概念化、形式化、实现与验证，上述 5 个实现阶段通常是通过专家系统开发工具进行的，这种专家系统开发工具既包含外壳之类的开发工具，也包括如LISP、Prolog的程序设计语言。

现在的专家系统逐渐顺应信息技术的发展浪潮，进一步研究适用于实际专家系统应用的方法技术，已经在并行分布、多专家协同、学习功能、知识表示、推理机制、智能接口和Web技术等方向取得实质进展，并由此派生出一系列改进的专家系统，包括模糊专家系统、神经网络专家系统、分布式专家系统、协同式专家系统、基于Web的专家系统等。

1.3.3 智能学习

智能学习研究使计算机具有类似于人的学习能力，使它通过学习能自动获取知识。智能学习一直是人工智能研究中最具挑战性的领域，大部分专家系统被问题求解策略的死板和涉及大量代码修改的烦琐所制约，而解决这一问题的最有效方法就是让程序去自我学习，机器学习是使计算机具有智能的根本途径。尽管智能学习是一个很难的领域，但大量相关研究表明是可行的。例如，被设计用于发现数学定理的AM系统，能在被赋予集合理论的概念和公理后，推导出诸如集合基数、算术整数等重要的数学概念。

学习是人类有特定目标的知识获取过程，其实质是将已提供的信息转换为能够被理解并应用的形式过程。机器学习模拟或实现人类的学习行为，计算机的学习单元利用外部信息源的信息改进知识库，执行单元运用知识库执行具体任务，任务执行信息再反馈给学习单元。目前机器学习已有归纳学习、类比学习、分析学习、连接学习和遗传学习等内容。

目前已有很多形式的学习被应用到人工智能上，其中最简单的形式就是反复试验的学习。例如，国际象棋的简单计算机程序会通过储存不同位置上的解决方案，从而在下一次遇到相同位置时能立即调用。对独立事务和流程的简单记忆，也就是“死记硬背”，容易在计算机上实现。更具挑战性的是概括，是能够将已有经验应用到相似的新情况上。

神经网络是目前人工智能对智能学习研究的主流内容，其具体运作原理不同于传统计算机的计算模式，是一种模拟人类大脑运作机制的计算模型。神经网络涉及的神经运算利用大量的计算单元，构成“神经网络”的模型结构来计算，与传统计算机的计算模型相比，神经网络计算具有更好的鲁棒性、适应性和并行性。同时神经网络计算自底向上，不要求利用先验知识，而是从数据直接学习训练，最终自动建立一个计算模型，整个运作过程是灵活的、通用的，且表现出学习能力。

神经网络研究神经计算的效率问题，从神经网络的计算过程可以看出，神经网络研究始终围绕学习的复杂性，其解决途径是寻找有效的神经网络学习方法。同时神经网络的另一个研究难点是，由于神经计算较少依靠先验知识，神经网络的结构是通过反复学习确立的，故其结构通常是不能预测的、难以理解的。

人工智能目前已衍生出前馈神经网络、反馈神经网络、RBF径向基函数网络、Hopfiled网络、RBM受限玻尔兹曼机、CNN卷积神经网络、Auto-encoder自编码器、RNN循环神经网络、LSTM长短时记忆网络等理论模型。

1.3.4 智能行动

1）智能检索

在科学技术发展的形势下，科技研究文献种类繁多、数量庞大，对其进行检索是人工检索方式和传统检索方式所无法实现的，故将智能检索系统作为智能行动的一项研究内容，涉及数据库系统的开发实现。数据库系统通常是指存储某一学科各种事实的计算机软件系统，能够对使用者提出的该学科问题进行解答，针对该系统的设计搭建是计算机科学的重要分支。

目前智能检索系统的研究存在以下几个问题：如何建立一个可以理解人类自然语言所描述的询问系统，如何根据已有的存储事实来演绎推理出询问问题的解答，在询问问题超出本学科领域数据库时如何处理。

2）智能调度指挥

调度指挥研究最佳调度或者组合的问题。一种较为典型的调度指挥问题是推销员的旅行问题，以一个城市为起点，要求只访问每个城市一次，最终回到起始点的城市，为推销员找到一条距离最短的旅行途径。在人工智能上，科学家们对若干问题的组合进行了最优解的研究，希望可以使“时间-问题大小”曲线变化尽可能地慢速增长。

智能调度指挥的研究已广泛应用于汽车的运输调度、火车的编组指挥、航空运输管制以及空军作战指挥等领域，尤其在军事领域，智能调度指挥增强了侦查、信息管理、信息作战的能力，同步提升了战场情报的感知水平和信息综合处理能力、交互作用能力。

3）智能控制

在驱动智能机器自动完成既定任务的过程中，需要运用智能控制技术。多数投入实际应用的智能机器，其系统是复杂的，难以建立有效的数学物理模型，或难以运用一般控制理论进行定量分析运算。而智能控制将传统的自动化控制与人工智能及系统科学分支相联系，是一种全新的、适用于各种复杂系统的控制理论技术。

智能控制的主要方法有专家控制、模糊控制、神经网络控制、分级递阶智能控制、拟人智能控制、集成智能控制、组合智能控制、小波理论方法等。借助智能控制方法，控制系统能够解决传统控制棘手的高度非线性、不确定性等控制难点问题，具有对新信息源进行识别、存储和学习的能力，且能利用已知知识反馈改善性能，增强系统的泛化能力，具有较强的容错性和鲁棒性。控制系统的传感器组具有自组织和自协调能力，能在指定任务下自主决策并执行。系统的实时性和人机协同性也得到了保证。

4）智能机器人

智能行动主要是指机器的表达能力，如“说”“写”“画”等。对于智能机器人而言，它还应具有类人的四肢功能。智能机器人至少应具备感觉要素、反应要素和思考要素这三大要素。智能机器人需要具备相当发达的“大脑”，中央处理器在“大脑”中发挥作用，该类计算机与操作它的人有直接的联系，计算机还能够按照目的来安排动作。智能机器人具备内部传感器和外部信息传感器，如视觉、听觉、触觉、嗅觉。除具有感受器外，它还具有效应器作为作用于周围环境的手段。人工智能技术把机器视觉、自动规划等认知技术以及各种传感器集成到机器人上，使机器人拥有判断决策的能力，在各种不同的环境中处理不同的任务。例如，RET聊天机器人，它能理解人的语言，并使用人类语言进行对话，用特定传感器采集、分析出现的情况并调整自己的动作达到特定目的。

5）分布式人工智能和Agent

分布式人工智能（Distributed AI）是分布式计算结合人工智能的新领域。分布式人工智能形成的系统以其鲁棒性和互操作性作为衡量控制系统的质量标准，要求控制系统应用于多种异构系统情况下，对快速变化的控制环境作信息交换和协同工作。

分布式人工智能的主要目标是设计一种可以描述自然系统和社会系统的精确概念模型。人工智能在分布式人工智能问题上，主要处理团体协作，即各个Agent之间的合作对话，因此又划分成了分布式问题与多Agent系统两个研究内容。前者是指对一个具体求解问题的过程进行划分，形成多个相互合作和知识共享的模块节点，而后者研究多个Agent之间的如规划、知识、技术和动作的智能行为协调。

习题

1.首次提出“人工智能”是在___年。

2.1956 年夏季，美国的一些年轻科学家在___大学召开了一个夏季讨论会，在该次会议上，第一次提出了___这一术语。

3.分别从学科和能力两个角度说明人工智能的定义。

4.列出并说明人工智能的研究方法。

5.人工智能的目的是让机器能够___，以实现某些脑力劳动的机械化。

6. AI研究的 3 条主要途径为___、___、___，简述它们的认知观。

7.简述人工智能的主要应用领域。

8.什么是物理符号系统？什么是物理符号假设？

9.给出机器学习的简单模型，并解释各环节的基本内容。

10.查阅相关文献，讨论下列任务是否可以通过计算机完成：

（1）国际象棋比赛中战胜国际特级选手；

（2）发现并证明全新的数学定理；

（3）自动发现程序Bug并修复。

11.讨论应从哪些层面上研究认知行为。

12.人工智能的主要研究和应用领域是什么？哪些是目前的研究热点问题？

13.未来人工智能可能在哪些方面有所进展？

习题答案