购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第2章
人工智能概论

本章介绍人工智能的定义,专家系统、机器学习、深度学习等人工智能相关的基本概念,以及人工智能的发展历史、应用和发展趋势。

2.1 人工智能的定义

如同工业时代的蒸汽机和发电机、信息时代的互联网和计算机,人工智能正成为推动人类社会进入智能时代的重要力量。能否抓住新一代人工智能的发展机遇,直接关系到我国能否在新一轮的科技和产业革命中抢占制高点。

要了解什么是人工智能,首先要了解一下智能的概念,英国科学家图灵1950年在其论文《计算机器与智能》中提出了著名的“图灵测试” 。把测试者和被测试者用帘子或其他东西隔开,然后通过键盘或其他工具,对被测试者进行若干次的提问,经过多次测试之后,如果测试者不能辨别出被测试者(机器)的身份,那么被测试者(机器)就被认为通过了测试,被测试者(机器)就被认为具有了类似人类的智能。

1956年夏天,麦卡锡、明斯基、罗切斯特、香农等科学家聚会在美国汉诺思小镇宁静的达特茅斯学院召开会议,现在被称为达特茅斯会议(Dartmouth Conference),研究“如何用机器模拟人类的智能”,虽然这次会议时间很短,也没产生什么具有影响力的研究成果,但这次会议上第一次提出了人工智能(AI)的概念,这个概念一直沿用至今,所以此次会议的召开年也就被认为是人工智能诞生的元年。1976年,拉斐尔把人工智能作为一门科学,这门科学让机器完成需要人类智能才能做的事情。2014年6月的一次测试中,测试者(人类)认为被测试者(计算机)是一个13岁的男孩,这是有史以来第一台通过图灵测试的机器,在人工智能发展史上具有重要的里程碑意义。

人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学,其本质是基于大数据根据特定的算法进行学习、训练、统计分析,并且能够模仿人类思维行为的科学。

2.2 专家系统

专家系统是人工智能研究中最广泛的领域之一。专家系统是一种交互式可靠的基于计算机的决策系统,计算机能够像人类的专家一样基于知识库系统,通过逻辑推理找到特定的规律,以此来解决某个特定领域的问题。专家系统的许多特性使得它非常适合人工智能的研究。

简单来说,专家系统就是加了“知识库”的“推理机”。知识库存储有关问题域的所有知识,其工作是系统搜集人类的相关知识,并对搜集到的所有知识进行系统化处理、模块化分类,从而使得计算机可以根据知识库存储的内容进行推论并解决问题。与传统数据库相比,知识库所存储的内容是经过系统分类处理过的可用于决策的知识,而传统数据库所存储的内容则是原始的数据。推理机是专家系统的大脑,由解决特定问题的规则与知识库内的相关内容进行推论,根据对应的问题来推断出正确的答案。

作为人工智能的一个重要分支,专家系统按其发展过程大致可分为三个阶段:即初创期(1971年前)、成熟期(1972—1977年)和发展期(1978年至今)

早期的专家系统是1965年斯坦福大学研制的DENRAL专家系统,建立该系统的目的是基于质谱图来鉴定未知的化合物结构,目的是为了对火星的土壤成分进行分析

中期最具代表性的是斯坦福大学的MYCIN系统,该系统被用于治疗传染性的血液疾病,该系统最重要的贡献是为基于知识库系统的应用树立了标杆,MYCIN系统建立了400多条规则。另一个很有代表性的专家系统是斯坦福大学的PROSPCTOR系统,用于矿物勘探,是第一个取得经济效益的专家系统。

20世纪80年代以来,在诊断、监测、规划、控制等领域出现了大量的可以商业化运行的专家系统,对社会各界产生了深远影响,社会效益和经济效益显著。其中最著名的是美国数字设备公司(Digital Equipment Corporation,简称DEC)与卡内基梅隆大学合作开发的XCON专家系统,配上了XCON之后的DEC公司的小型机给当时的电脑巨头万国商业机器公司(International Business Machines Corporation,简称IBM)以沉重打击,当客户订购DEC公司的生产的VAX系列电脑时,XCON可以根据用户需求自动配置零部件,大大节约了人力成本,从1980年投入使用到1986年,XCON一共处理了八万个订单,每年能节省2000万美元。1981年,商业化运作的专家系统给DEC公司带来了巨大的红利,并使得这家公司当时在整个电脑行业的排名仅次于IBM。

2.3 机器学习

机器学习尤其是“深度学习”给当前的人工智能技术带来广泛应用,近几年很热的“大数据”其实只是一种数据资源,如果要挖掘大数据的价值就必须有高效的数据挖掘和数据分析技术,这些技术当前主要依赖于机器学习。

机器学习的发展历史几乎与人工智能的发展历史相当。所谓“机器学习”,即让机器来模拟和实现人的学习功能,计算机根据人类的算法能够从数据中挖掘所需要的信息。

由于机器学习目前依赖于人类所能提供的算法以及所需要的数据,在目前的现实情况下,机器学习无论是在模型还是具体的方法上,都具有一定的局限性。首先数据本身就是瓶颈,机器学习需要海量的数据,目前看起来每天都在产生海量的数据,到处都是数据,但实际有用的能够被用来学习训练的数据却很少,因为机器学习需要的是标注过的数据。其次,算法模型会受到环境、样本数的多少以及应用场景的影响等。

“机器学习”算法一个非常重要的分支是神经网络算法。自从霍普菲尔德(Hopfield)提出一种新的类型神经网络后,由于这种神经网络结构可以解决很多模式识别方面的问题,除此以外,Hopfield神经网络还可以给出某些组合优化问题的近似解,由此神经网络算法迎来了复兴。1995年,瓦普尼克(Vapnik)和科尔特斯(Cortes)提出支持向量机(Support Vector Machines,简称SVM),该算法通过用一个分类超平面把样本分开从而达到分类的效果,这种监督式的学习方法,可广泛用于统计分析与回归分析,鉴于SVM强大的理论地位和实证效果,机器学习研究自此分为神经网络学派和SVM学派。

人脑识别物体并不是基于明确的规则,而是凭直觉判断。比如我们看到一只狗,我们很明确知道这是一只狗,但却无法说清楚为什么看到的是狗而不是狼或其他动物。事实上,相比于准确定义物体的特征,人脑识别更像是一种特征匹配,而这也是“神经网络学派”的最初思想。

到20世纪70年代,计算机科学家开始研究神经网络在推进人工智能上的可行性,但当时的主流学界普遍认为,神经网络在数学上有局限性,没有前途;因此神经网络学派一直到20世纪90年代都被视为边缘地带的“异类”。虽然神经网络存在各种短板,人们仍然一直不停地研究,2006年,辛顿(Geoffrey Hinton)等人在《科学》杂志上发表了一篇关于“深度信念网络”方面的文章,掀起了“深度学习”在人工智能领域研究和应用的浪潮。“深度学习”改进了传统的神经网络结构,能够挖掘大数据中的复杂结构,大幅提升学习效果。

2.4 深度学习

“深度学习”作为“机器学习”的一个子集,相比其他学习算法,使用了更多的参数,模型也更为复杂,从而使得模型对数据的理解更加深入,也就更加智能

近年来,随着深度学习的应用发展,人工智能再次掀起新的革命浪潮。2016年谷歌旗下的AlphaGo,在与韩国职业棋手李世石进行的人机大战中,以绝对优势获胜,2017年AlphaGo又以3比0的优势战胜了中国职业九段棋手柯洁,人们开始感受到了人工智能的力量。

2010年,斯坦福大学的人工智能专家李飞飞,组织了一个叫作ImageNet的机器学习图形识别比赛,以后每年举办一次。

这个比赛的有趣之处在于,它每年都为参赛者提供100万张图片作为训练素材,其中每一张图都由人工标记了图中有什么物体。

比赛规则是选手用这100万张训练图片练好自己的程序,然后让程序识别一些新的图片。每张新图片有一个事先设定的标准答案,而参赛的程序可以猜5个答案,只要其中有一个判断跟标准答案相符合,就算正确。

从2010到2011年的两年里,ImageNet比赛中最好成绩的判断错误率都在26%以上,但是到了2012年,错误率一下子下降到了16%,从此之后就是直线下降(图2-1)。

图2-1 识别结果对比

2017年,机器识别的错误率已经降到了2.3%——这个水平已经超过了人类。

在这个新模型中,只有一层卷积的结构被称为简单神经网络(图2-2),而具有多层卷积的神经网络,就叫作“深度学习”神经网络(图2-3)。

图2-2 简单神经网络

图2-3 深度学习神经网络

本轮人工智能浪潮更多的是基于大数据的深度学习繁荣算法的表现。2016年深度学习(深度神经网络)基本理论框架得到验证,从而使得人工智能开启了新一轮的繁荣

2.5 人工智能的演进

思维和智能的概念引发了对图灵测试的争论,也引发了学术界对人工智能的发展水平进行区分。人工智能通常可以根据智能水平的强弱分为不同的类型:弱人工智能、强人工智能和超人工智能。

弱人工智能侧重于解决特定的简单任务,只要程序能够正确执行,并且能够得到令人满意的执行结果,它们大都是基于大数据的统计分析,从中归纳出解决特定任务的具体模型。例如语音识别、翻译等。弱人工智能只会处理相对简单的单一的问题,其智能水平远远无法与人脑的思维相比,弱人工智能关注的是如何解决问题,而不是解决问题的方式,比如不必关注到底是否运用像人脑一样的思维方式去解决问题,所以弱人工智能多数情况下只是作为简单的工具使用。即使像谷歌公司的AlphaGo机器人,虽然能屡次战胜世界顶尖职业棋手,但它却只是个会下围棋的工具而已,根本不具备类似人脑的思维能力。还有微软能作诗歌的小冰机器人,已经协助超过上百万名诗歌爱好者创作诗歌,并且具有了一定的“情商”。这些机器人虽然某一方面的信息处理能力很优秀,但还是属于弱人工智能。

强人工智能属于高级别的人工智能,能够像人类一样独立思考、决策并解决问题,具有一定的抽象思维能力,处理各种事务都能够与人类一样轻车熟路。强人工智能系统包括缜密的逻辑推理、各种类型有计划的学习、有目标的创新、带有感情的认知活动等,能在独立的无人工干预的情况下处理各种未知的事务,并且能够与人类互动学习。例如使用等效的耳蜗、耳膜和耳朵的其他部件来成功地获得听觉,模仿人类的听觉系统。强人工智能关注的是凭借人工智能启发式的算法和知识,可以获得类似人类的意识和智能。创造强人工智能目前还比较困难,要比创造弱人工智能难很多。

超人工智能是人工智能发展到高级阶段的产物,超人工智能拥有超越人类的智慧,在几乎所有领域都要超越人类,包括社交、科学发明创造,甚至拥有超越人类的政治智慧。超人工智能在某些方面可能拥有类似“外星人”的智慧,地球上的人类已经无法想象其具有的智能水准。人类已经无法理解和想象超人工智能具有的智慧和思考的内容,超人工智能可能会对人类社会产生巨大威胁。

2019年世界人工智能大会上,马斯克与马云的“双马”对话中,马斯克有些悲观地认为“AI会超越人类,人类最后的工作就是写软件,之后人工智能可以自己写软件”,马云则表示,人们需要更多了解人工智能,他不觉得AI是一种威胁,不认为AI很恐怖,因为我们人类更聪明 。在这场“科学前沿”的人工智能论战中,人们普遍可以感觉到,人类智慧依然是人工智能发展的决定性因素,也正是因为越来越多“最强大脑”的加入,人工智能与人类社会的未来充满可能性。

2.6 人工智能标准体系建设

为加强人工智能领域标准化顶层设计,推动人工智能产业技术研发和标准制定,促进产业健康可持续发展,2020年7月,国家标准化管理委员会、中央网信办、国家发展改革委、科技部、工业和信息化部五部门联合印发《国家新一代人工智能标准体系建设指南》,推动人工智能技术在开源、开放的产业生态不断自我优化,充分发挥基础共性、伦理、安全隐私等方面标准的引领作用,指导人工智能国家标准、行业标准和团体标准等的制订修订和协调配套,形成标准引领人工智能产业全面规范化发展的新格局

人工智能标准体系建设指南的发布,是加快推进人工智能应用落地的催化剂,必将大力促进人工智能在各行各业的落地应用。

2.7 人工智能的应用

人工智能的应用场景包括:医疗、自动驾驶、教育、金融服务、艺术创作、合同诉讼等法律实践、社交以及服务业等 。自动化程度比较高的工作,比如自动驾驶、自动分拣货物等,现在已经越来越多地由人工智能所替代,而对于需要创造性思维的工作,人类对于自身的能力更为自信。

在医疗领域,可以使用机器人进行精准的手术治疗,2018年2月,上海长海医院使用达芬奇手术机器人对一名肾脏病患者实施了精准手术治疗,通过手术机器人的三维成像系统,主刀专家手握遥控机器人进行灵活自如的操控,患者术后各项指标均显示正常,这标志着长海医院在传统手术到机器人手术间实现了质的飞跃。达芬奇外科手术机器人的特点是操作时就像达芬奇画画一样手法非常精细,保证手术成功的同时,也将手术创伤降至最低点。此外,采用人工智能技术还可以进行疾病的远程诊断、远程治疗的指导,甚至是远程操控机器人进行手术,远程监测老年人在家里的心率等各项指标,在医院病房里可以甄别护士是否分发错了药,自动监测病人的生命体征并进行报警等。

在交通运输领域,无人驾驶汽车会逐步走向实用化,并会颠覆目前所有的驾车模式,所有汽车会通过5G网络实时交换行驶信息,能够提前感知前面的路况和前面车辆的突发故障等信息,面对突发事件,能够即时做出规避而不会影响其他车辆的安全,拥有了这些优势,未来的无人驾驶汽车将会突破人类感知的界限,未来世界各地的交通事故也会因此大幅度降低,甚至可以做到除了车辆故障以外,不会发生任何交通事故。

在教育领域,人工智能将会对教育教学和教育治理方式产生重大影响,人工智能是推进教育优质均衡的重要手段,会快速推动教育现代化的进程。《中国教育现代化2035》提出“互联网、人工智能等新技术的发展正在不断重塑教育形态,知识获取方式和传授方式、教和学关系正在发生深刻变革” 。人工智能将助力教育活动的个性化、精准化,智能教室、智慧校园如雨后春笋般诞生,智慧学习环境在个性化指导、智能化学习支持方面所扮演的角色日益重要。个性化教学的实现有赖于人工智能对教育提供技术支持;与教育相关的各要素的智能化,同样需要人工智能技术的加持。

目前世界各国企业和研究机构正大力研究新一代基于人工智能的智适应学习系统,覆盖学前教育至高中教育阶段(Kindergarten Through Twelfth Grade,简称K12)的学习范围。通过伴随式无感知地采集学生课堂行为数据,可以判断学生的学习状态以及对所学知识点的理解与掌握程度,可以对学生的学习行为进行数字画像。历年来上千万学生使用人工智能辅助教学系统,可以沉淀庞大的学习数据,通过对数据进行挖掘和分析,可以在此基础上研究出更好的教学策略。

人工智能在在线教育领域中的应用可以根据在线教育不同阶段的学习要求分成六类 :①智适应学习,结合智适应学习技术去打造出一个智能的虚拟老师,不仅能够渗透整个教学过程,并且支持个性化教学,提升学习效果。②根据智能源处理技术和搜索技术的人机对话。③运用图像识别技术的双师课堂。④基于智能语言处理和语音识别技术的语音测评。⑤基于语言处理技术的语言处理应用。⑥基于计算机视觉与图像识别技术的拍照搜题应用。

教育大脑。 教育大脑在整个教育教学与教育治理活动中发挥类似人脑的神经中枢的作用,类似于电脑的中央处理器(central processing unit,简称CPU)、列车的控制系统等,教育大脑的核心是人工智能和大数据。教育大脑作为人工智能在教育行业应用的承载,以多模态数据多元感知与模型建构为基础,构建学习者画像,与知识图谱和学生成长轨迹模型相匹配,为大规模因材施教提供智能决策支撑。教育大脑将沉淀教育智能化发展过程中形成的各类优质的符合人工智能治理法则和贴合教育实际应用场景的模型算法和关键技术。未来,教育行业上层的应用服务可依据教育大脑累积的成果快速建设和应用,以加速推进教育行业智能化发展速度。同时,教育大脑将把在学科层面的自适应学习、个体层面的智慧学习管理和区域层面的教育决策支持和预警等方面的应用作为核心应用场景,并通过优质数据集不断进化,成为未来教育智能化的核心基础。教育大脑的最终目标是利用教育数据资源,进行全局实时分析,自动调配公共资源,最终利用人工智能算法把数据变成学生学习、教师教学、课程实施、教育评价和学校管理的最重要的资源,以支撑学科教学、个体成长、区域教育治理和教育预警等应用场景的智能化服务,满足师生的智能化教育教学的需求。

2.8 人工智能的发展趋势

人工智能自1956年诞生以来,符号主义学派与连接主义学派一直在竞争的状态下发展。符号主义学派在早期的人工智能发展中占据主导地位,很长一段时间影响着人工智能的发展。连接主义学派直到20世纪90年代才逐步兴起。但这两种范式都具有很强的片面性,二者都是从不同的侧面去模仿人类的思维。人工智能的发展趋势是从当前的狭义上的人工智能向更宽广的广义人工智能方向发展,从目前基于大规模标准数据单任务学习的专用人工智能向通用人工智能方向发展,从目前的弱人工智能方面的研究逐步向强人工智能方向发展。未来需要加大算法、算力方面的研究,特别是在可解释和鲁棒性的人工智能理论创新方面加大研究,发展安全可靠、守伦理、高可信、可扩展的人工智能技术,即第三代人工智能。

从当前人工智能的研究领域看,人工智能主要包括机器人学、模式识别(图像识别、语音识别)、博弈学、自然语言处理、人工神经网络、专家系统等领域。以基于深度学习的人工神经网络的视觉处理为例,该网络与人类的视觉神经网络相比就过于简单,既没有反馈通路,又没有同层之间的横向连接,也没有稀疏放电、记忆和注意等机制,如果把这些机制引入人工神经网络,就会大幅提高人工视觉效果。目前,以大数据为支撑,基于强大算力的机器学习算法已经在各个领域取得革命性的进展,特别是在计算机视觉、自然语言处理等方面的应用取得突破,以深度学习为代表的人工智能应用已经逐步成熟。

海量的数据是人工智能发展的源泉,有关报告表明,目前全球数据总量已经超过40ZB,是10年以前数量总量的20多倍,最近几年,全球每年新产生的各种类型的数据量以每年58%的速度递增。

从本世纪初开始,由于计算机算力的快速发展,海量数据提供了丰富的数据来源,超级计算机和云计算提供了强大的软硬件环境,使得人工智能发展所需要的环境、资源等发生了革命性的变化。特别是2006年多伦多大学辛顿教授在前向神经网络的基础上提出的深度学习为人工智能的研究和应用提供了更加有效的学习模型。机器学习和深度学习成为最近一段时期的研究主流,并引发了新一轮的人工智能发展浪潮,国内以商汤科技和寒武纪为代表的人工智能企业异军突起,以机器学习和深度学习为代表的人工智能的发展进入一个崭新的阶段。

虽然人工智能还有很多的局限性,比如它只能完成某个狭窄领域的工作,但与人类相比,人工智能在记忆、计算、感知等方面可以超过人类,而人类的特长是可以做很多各种各样的不同事情,人类在沟通、情感、价值观、创造力等方面可以超过机器。尽管人工智能的发展会带来隐私、伦理等问题,但是人工智能依然会向前发展,例如,一种“联邦学习”的模式可以保证每个终端的数据都在不出本地的情况下,仅是通过加密模型,来使它的参数被传递到云端,在云端加以整合、更新,并且把通用、更新的模型再传递到终端。香港科技大学杨强教授认为“用这样的方法就能保护用户隐私,同时又能共享一个通用模型”。

未来的人工智能发展将会体现以下几个特征:①减少对大数据的依赖;②将以自主学习模式为主;③人工智能将从云端向边缘端发展;④人工智能的发展更加注重安全性和隐私保护;⑤人工智能逐步向自主智能系统与自主无人系统方向发展

由于人工智能的高度智能化与互联网的发展密切相关,人工智能对信息化数据系统有着重要的影响,人工智能的研究和应用直接关系到国家信息化体系的构建和发展。

2019年在上海召开的世界人工智能大会上,阿里巴巴创始人马云与特斯拉公司联合创始人马斯克就“人类与人工智能的未来”作了精彩的对话,马云认为,没有必要对人工智能的发展担忧,并不能因为机器人在下棋方面超越人类,就理所当然地认为人工智能一定会比人类强,人类试图在棋类方面与计算机进行博弈,就好比人类试图与100年前发明的汽车去赛跑一样,没有太多意义。人类有足够的智慧去驾驭人工智能,人类要更多关注人工智能如何让生活更美好,电脑只是人类创造的“聪明”的工具,人类还会创造更多比电脑聪明的工具 。而马斯克认为,人类能在很多方面创造出更加智慧的东西,例如,电脑可以在很多方面比我们更加智慧,电脑会在更多的领域超过人类,例如,如今的教育效率很低,交互缓慢,未来有可能通过神经连接,就可以把任何需要的知识直接输入大脑

未来,人工智能的应用将会与各行各业深度融合。在教育领域,人工智能将会对教师的教学和管理工作发挥重要的智能辅助作用,人工智能将会帮助教师更好地评估学生,实现对学生的个性化指导,将会促进教师角色的转化 。人工智能的治理以“科技向善”为引领,确保人工智能发展的可知、可控、可用、可靠 。走向人机融合的未来,人类社会将面临哪些变革,社会经济形态将会发生什么样颠覆性的变化,学校的人才培养如何应对这些变化,需要我们从不同的维度去深刻思考和行动。 7PrDGJtIXgZNAvYNsFPGEup6plE3FNgYMPkKGlhsdt8vlTnGnFBrkHDj0ZxJM0C4

点击中间区域
呼出菜单
上一章
目录
下一章
×