人工智能技术在经历了一段低谷期后,终于迎来了曙光。20世纪80年代中期,计算心理学逐步发展为认知科学,在加州大学圣迭戈分校PDP团队的倡导下,建立在人工神经网络模拟大脑神经元及其联结基础上的联结主义活跃起来,其中部分学者转而扛起人工神经网络的旗帜,推动神经网络学习在其后10余年掀起高潮。同时,停滞了20余年的行为主义在理查德·萨顿(Richard Sutton)等人的推动下,以强化学习(Reinforcement Learning)为主题,再现活力。
20世纪90年代中后期,人工神经网络的一些主要研究力量转向推动人工智能发展。学者们先以贝叶斯网络推理为主流,后又将神经网络学习研究进一步推广为研究各种机器学习方法,掀起了第三次人工智能浪潮。此次浪潮带动模式识别与机器视觉方向的研究再度趋热。而集成电路、无线通信、互联网、信息采集、传感控制、物联网等多种技术的积累,尤其是海量数据和超级计算能力的提升,为杰弗里·辛顿团队在2006年重新审视深度神经网络创造了条件,他们很快在认识上有了新突破,由此推动人工神经网络急速升温,促进了神经科学、认知科学的繁荣和相互融入。经过半个多世纪的发展,人工智能研究各分支再度大整合。AlphaGo系统进一步成功整合深度学习和强化学习,让人们再次关注到曾经至少风靡了60年的行为主义人工智能。
第三次浪潮与前两次浪潮的关系属于“创新”与“革旧”,既加入了更多创新的技术,又在原有技术上进行了优化与变革。第三次浪潮与前两次浪潮最为不同的是IBM、谷歌等科技龙头企业的加入,它们以雄厚资源和“大兵团作战”能力雄踞龙头,通过推出沃森(Watson)系统、AlphaGo系统等智能产品,持续推高第三次浪潮。从2006年开始,很多关于人工智能的应用逐渐深入人们生活的各个方面。这意味着针对超级复杂大系统的人工智能研究已从学者个人的“沙盘推演”转化为大规模的“团体作战”,这个转换是必然的。
为什么人工智能会再度兴起?人工智能已经发展到什么地步?人工智能将去向何方?这些问题都需要我们深思。
第三次人工智能浪潮中的核心点是大数据和深度学习。这一时期的人工智能技术将三者更好地结合起来,促进了人工智能与更多行业进行融合。
数据是现实世界映射构建虚拟世界的基本要素,人工智能的实现需要数据的支撑,数据与人工智能的关系就如同燃料与火车的关系。没有燃料,火车就不能前行;没有火车,燃料的应用也会大大减少。2006年,深度学习取得了重大突破,之后,图形处理器(GPU)、张量处理器(TPU)、现场可编程门阵列(FPGA)异构计算芯片及云计算等计算机硬件设施不断取得突破性进展,为人工智能提供了足够的计算力,得以支持复杂算法的运行。同时,随着大数据技术的不断发展,人工智能逐渐拥有了能够适应这些规模空前的训练数据的能力,这为技术与算法的迭代更新注入了强大的活力。架构新颖、性能强大的模型算法如雨后春笋般不断涌现,标志着人工智能进入了以大数据驱动的深度学习为主的第三次浪潮。
数据要素作为数字经济时代的核心要素,在智能制造应用需求和新一代人工智能的融合推动下正显现巨大价值。数据驱动的工业智能,尤其是以深度学习为代表的工业人工智能研究前沿,成为学术界和产业界关注的焦点。
深度学习是人工智能第三次浪潮的引擎,其理念来自早期人工神经网络的相关研究,属于机器学习,拥有极为强大的学习能力。深度学习最突出的特性就是对大数据的学习与使用。通过从输入的数据中提取关键概念要素并进行训练与学习,模型能够对不存在于训练集中的数据进行处理,因此,深度学习模型并不是单纯的一种算法或分析模型。
以数据为驱动的深度学习应用十分广泛。在对数据进行预处理时,基于深度学习的工业数据预处理技术,将跨域异构、低质高噪的工业数据自适应、智能化地表征为易于被数据分析模型处理的模式,以便其隐藏的工业知识被数据分析模型有效地挖掘。对于非均衡数据样本,如小样本或样本缺失问题,深度学习可对数据样本进行智能化增强处理。对数据进行建模时,深度学习可对传统模型进行优化与改进,以便更好地提取数据的各种核心特征。
目前,全球人工智能发展趋势都处于上升阶段,在各个方面都表现出巨大的发展潜力。
(1)学术界
越来越多国家的学者开始重视人工智能,据微软学术图表(Microsoft Academic Graph,MAG)统计,2000—2020年,通过各种途径发表的人工智能论文数量从不到4.8万篇增加至23万篇,提升了4倍多,占所有论文的比例从不足2%提高至3%,其中,2020年期刊发表的人工智能论文数量接近8万篇,是2000年的5.4倍,增速明显。此外,2000—2019年,通过人工智能相关学术会议发表的文章总量增加了4倍。这些数据都表明,越来越多的研究者进入人工智能领域,人工智能的发展势头不容小觑。全球人工智能论文数量变化趋势如图2-6所示。
图2-6 全球人工智能论文数量变化趋势
(2)科技界
人工智能的技术创新是促使其取得发展的关键,从第一次浪潮到第二次浪潮,再到现在的第三次浪潮,其产生和起伏都来自新技术的产生。近年来,高强度的人工智能研发产生了大量的科研成果。全球人工智能新增专利数量变化趋势如图2-7所示,人工智能新增专利数量自2000年以来,总体呈快速增加的趋势。同时,由于技术的成熟,相关人工智能模型的训练时间和训练成本明显降低,人工智能技术已逐步走向产业化,在交通、金融、农业、军事等领域得到应用。特别是2021—2023年,随着机器学习技术的普及,医疗保健和生物医药行业的格局发生了实质性的变化,人工智能大大简化了原有的化合物结构设计技术。此外,人工智能相关投资明显增加。2020年全球人工智能领域社会总投资(包括私人投资、公开募股、并购和少数股权等)较2019年全球人工智能领域社会总投资增长了40%,达到679亿美元(约合人民币4627亿元)。
(3)教育界
第三次人工智能浪潮中,人工智能的发展现状不仅仅体现在学术界和科技界,随着人工智能的落地应用与日俱增,教育界也认识到人工智能的长久发展需要不断培养和注入新鲜血液,因此,在本科生、研究生,甚至中小学生课程里增设了关于人工智能的专业和学科。根据相关数据显示,世界顶尖大学纷纷加大人工智能教育投入,2017—2020年,本科生人工智能相关课程数量增加了102.9%,研究生人工智能相关课程数量则增加了41.7%。
图2-7 全球人工智能新增专利数量变化趋势
当前,大数据驱动的以深度学习为主要方向的人工智能技术已经深入人们的生活。但是,对于人工智能的发展,人们仍然会存在些许疑虑,这些疑虑涉及人权伦理、责任伦理和道德伦理。如何面对这些伦理问题将在很大程度上决定人工智能未来的发展,甚至会限制其应用的落地,致使第三次浪潮也像前两次浪潮一样走向下一个低谷期。
要想解决由人工智能产生的伦理问题,维持第三次浪潮的发展动力需要多方面努力。一方面,应促进人工智能相关知识的普及,提高公众的文化素养,增强公众伦理观念。另一方面,应该正确把握技术的发展方向,即人为控制人工智能的发展,使人工智能向着我们认可的方面进步。此外,还需要建立一套能够和人工智能发展水平相适应的立法规则和准则。
未来,人工智能的发展将面临诸多挑战,基础研究是人工智能进步的支柱。如果计算硬件、算法和数据不能与时俱进地发展,那么,人工智能的第三次浪潮就会像前两次浪潮一样,最终走向衰弱。如何将人工智能的学术研究和产业应用更好地结合起来,仍然需要我们思考和探讨。