购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第一章
人工智能在管理中的应用

人工智能概述

人工智能在近些年取得了长足的发展。从各式各样的智能音箱到回答问题的聊天机器人,从工厂机器人到自动驾驶汽车,从人工智能生成的音乐、艺术和香水到游戏人工智能和辩论系统……我们已经见证了人工智能从一门偏重理论的学科向一个赋能海量全新应用的实用工具的转型。有些人认为“人工智能就是信息技术的未来”,支撑这种说法的证据存在于各行各业:在大学里,机器学习和其他人工智能基础学科的入学率屡创新高;在行业中,人工智能赋能的工具现在已经可以协助医生发现黑色素瘤、帮助招聘人员寻找合适的候选人,以及辅助银行决定向哪些客户发放贷款。算法正在赋能产品推荐、精准广告、论文评分、员工晋升和留存、风险评级、图像标记、欺诈监测、网络安全防御等大量应用。

基于算法的决策的爆发式增长和广泛使用激起了人们的广泛兴趣,并引发了各种连锁反应(当然,其中还有各式各样的炒作)——从期待人工智能如何辅助人类决策、提高商业绩效,到质疑其公平和伦理,再到惧怕其取代工作岗位、加大贫富差距,乃至于忧心人工智能会威胁人类生存发展。“人工智能”一词本身也在不断演变,这一术语对不同的人有着不同的含义。人工智能不仅包括机器学习、神经网络和深度学习这些技术领域,它已成为许多与数据和分析相关的学科的一个概括和总称。这也是“人工智能就是信息技术的未来”这一现象的一种体现。

本章旨在对人工智能进行简要介绍,描述人工智能的发展和变化过程,如何从当前的“狭义人工智能”阶段发展到能力更强、更先进的“广义人工智能”阶段,再到未来的“通用人工智能”(General AI/AGI)阶段。在本章,我们同时探讨组织和管理上的考虑因素,包括人工智能在诸如战略规划、市场营销、产品设计和客户支持等商业运营任务中发挥的作用。最后,我们还将详细论述组织确定全面的人工智能策略的要求和先决条件,基于理解人工智能对组织的价值,关注数据、技能等实际需求,适当地实施人工智能战略。

人工智能的定义

正如理查德·格雷戈里(Richard Gregory)在他的《牛津心智指南》 The Oxford Companion to the Mind )一书中所述:“从狭义的视角来看,有多少位专家,就有多少种对智能的定义。”另一项研究成果显示,关于智能,有超过70种不同的定义。广义上说,人工智能是计算机科学大类下的一个研究领域,其研究重点是如何使机器的行动更加智能。人工智能的功能有很多,包括但不限于:

学习, 以及从数据中学习模式的方法和途径。人工智能的学习包括无监督学习和有监督学习两种。在无监督学习中,计算机直接处理原生数据样本并建立模型;而在有监督学习中,计算机处理的是预先由人类打好标签(label)的训练样本,从而实现对训练样本之外的数据的分类和预测。深度学习是一种基于人工生成的神经网络的特殊的有监督学习;

理解, 包括对例如医学、会计、法律等特定领域任务所需的知识表示技术;

推理, 其中包括几种不同的推理类型,如演绎推理、归纳推理、时序推理、概率推理以及定量推理;

互动, 与人类或其他机器协作完成任务,或与环境完成交互。

人工智能简史

虽然人工智能在近些年得到了极大的关注,但它并不是一个新的概念。创造一个“会思考”的机器的想法早在现代计算机出现之前就已存在。举例来说,对形式推理的研究可以追溯到古代哲学家亚里士多德和欧几里得。计算机器(calculating machine)的制作始于古人,历史上的众多数学家都对原有的计算机器加以改进过。17世纪,莱布尼茨(Leibniz)、霍布斯(Hobbes)和笛卡儿(Descartes)探索了将所有理性思维像代数或几何一样系统化的可能性。人工神经网络的历史虽不如计算机器一样久远,却也不是最近才出现的新鲜事物。1943年,神经科学家沃伦·麦卡洛克(Warren S. McCulloch)和逻辑学家沃尔特·皮茨(Walter Pitts)尝试通过研究大量基础细胞,也就是神经元(neurons),根据逻辑构建大脑模型,揭示人类大脑如何产生高度复杂的模式,并提出极为简化的神经元计算模型。这项工作为人工神经网络的发展做出了重要贡献,而人工神经网络是当前许多人工智能系统的基础。另一项重要贡献则来自加拿大心理学家唐纳德·赫布(Donald Hebb)。赫布认为,神经通路在每次持续使用后都会得到强化,尤其是倾向于在同一时间内发射的神经元之间的通路。这一理论成为赫布学习(Hebbian Learning)的基础,也对人工神经网络中如何设置和学习神经网络模型不同神经元之间的权重具有重要意义。

1950年,阿兰·图灵(Alan Turing)发表了他举世闻名的论文《计算机器与智能》( Computing Machinery and Intelligence )。在这篇论文中,图灵提出了智能计算机器的评价标准,这些标准被后人称为“图灵测试”。“人工智能”的概念则是由约翰·麦卡锡(John McCarthy)在1955年创造并提出的。麦卡锡当时是达特茅斯学院一位年轻的数学助理教授,对机器智能领域具有浓厚兴趣。他联合了几位科学家共同发起了一个名为达特茅斯项目的研究,目的是梳理和研究关于思维机的观点和想法。1956年夏,在达特茅斯学院举办的人工智能研讨会上,“人工智能”概念被正式提出,从此作为一个学科存在。三年之后,即1959年,国际商业机器公司(International Business Machine,简称IBM公司)的科学家亚瑟·塞缪尔(Arthur Samuel)提出“机器学习”概念。他将其定义为通过从样本输入建立模型以学习和预测数据,而不是遵循一套静态指令的计算机算法。机器学习技术是塞缪尔跳棋程序的核心思想。塞缪尔的跳棋程序可以通过观察棋子的走位来构建新的模型,提高自己的下棋技巧。它也是第一个达到足以挑战世界冠军水平的游戏程序。接下来的几十年里,游戏继续成为挑战人工智能以及衡量和评价其进展的一种方式。现在,人工智能已经被用于跳棋、国际象棋、双陆棋和围棋等各种棋类游戏。

1956年到1974年的这段时间被称为“人工智能的黄金年代”。许多知名科学家认为人工智能的突破即将到来,政府和工业界也为人工智能研究提供了大量资金支持。

在快速发展和炒作之后,人工智能领域很快经历了投资和兴趣的下降,这也被称作“人工智能的寒冬”。第一个人工智能的寒冬出现在20世纪70年代,原因是人工智能的研究者们低估了他们尝试解决的问题的难度。由于人工智能未能实现突破,政府和其他来源的资金也随之枯竭。在人工智能的寒冬中,研究项目不得不使用不同的名字,如“模式识别”“信息学”“基于知识的系统”等,来伪装他们的研究,以便继续获得资金支持。

从20世纪70年代中期开始,通过关注知识表示方法,研究人员开始搭建实际可用的系统。人工智能重新以 专家系统 的形式回到了人们的视野之中——专家系统可以回答问题或解决特定具体领域的问题,使用封装的逻辑规则表达特定主题和领域专家的知识。例如,1980年,美国数字设备公司(Digital Equipment Corporation,简称DEC)部署了R1系统,可以根据客户的要求自动选择组件,协助完成美国数字设备公司的虚拟地址扩展(virtual address extension,简称VAX)计算机系统 订购。1986年,R1拥有大约2500条规则,年处理80000条订单,达到95%~98%的准确率;系统减少了由于技术人员失误为客户提供的免费组件,加快了装配过程,提高了客户满意度,每年为公司节省了4000万美元。

20世纪80年代诞生的还有Cyc项目。Cyc项目是人类历史上首次尝试创建的包含大多数人应具备的一般知识的数据库,其目的是使人工智能应用程序能够进行类似人类的推理。在Cycorp的支持下,Cyc项目一直持续到今天。项目启动的前10年内,条目数增长到了约10万。到2017年时,项目已包含约150万个术语。

1989年,由卡内基梅隆大学开发的象棋程序HiTech和“深思”(Deep Thought)击败了国际象棋大师。它们为IBM公司开发的象棋系统“深蓝”(Deep Blue)铺平了道路。“深蓝”是第一台与世界冠军对战且获得胜利的计算机象棋程序。

机器学习和神经网络的崛起

人工神经网络的灵感来源于人脑结构。它包含许多相互连接的处理单元,即与大脑中的生物神经元类似的人工神经元。神经元接收外界输入的信号,并以某种方式对其进行处理。通常情况下,神经元按照不同层级的方式组织。不同层可以对输入进行不同类型的操作,使神经元之间的连接包含权重来模仿赫布学习。

在大约30年里,符号人工智能(symbolic AI)在人工智能的研究和商业应用中占据了主导地位。尽管人工神经网络和其他机器学习算法也得到了积极的研究,但由于可供学习的数字化数据的缺乏和计算能力的不足,它们的实际应用存在诸多障碍。到20世纪80年代中期,对一个既有概念的重新探索才将神经网络重新带入人工智能研究的主流。这一概念就是反向传播(backpropagation),由研究人员在20世纪60年代设计,用以训练神经网络。鲁梅尔哈特(Rumelhart)、欣顿(Hinton)和威廉姆斯(Williams)重新审视了反向传播并发表论文,清晰和简洁的表达概述了这一技术,帮助其重新进入机器学习研究的主流。训练实用神经网络的能力,计算机科学和统计学的融合,再加上迅速增强的计算能力,共同转变了在研究中占据主导地位的人工智能范式,将其从符号人工智能和知识驱动进路转向机器学习和数据驱动进路。科学家开始建立能够分析和学习大量标记数据的系统,将其应用于不同的领域,如数据挖掘、语音识别、光学字符识别、图像处理和计算机视觉等。

21世纪的前20年,数字数据呈爆炸性增长。处理速度和运算能力的提升,以及图形处理器(GPU)等专门运算设备的出现,最终与人类收集、标记的足够大的数据集相互叠加,使得研究人员能够建立深度学习网络(deep learning network)。深度学习网络是一种规模更大的神经网络,能够非常准确地执行复杂的、类似人类的任务,在许多情况下能够实现超出人类的表现。现在,深度学习正在赋能各种不同应用,范围涵盖计算机视觉、语音识别、机器翻译、基于社交网络分析的好友推荐、玩桌游和电子游戏、智能家庭助手、对话设备和聊天机器人、医疗诊断、自动驾驶汽车和操作机器人等。

人工智能的演变:从“狭义”到“广义”,再到“通用”

近年来,机器在许多认知任务上达到或超过了人类的表现,人工智能领域一些长期存在的挑战也得到了攻克。现在已有能够解决问题、玩游戏、识别模式、证明数学定理、在环境中导航、理解和使用人类语言的机器,但它们是真正的智能吗?它们能否达到或超过人类的能力?人类在这一演变中处于什么位置?

人工智能从业者群体一致认为,今天人工智能的实际应用属于所谓的“狭义”或“弱”人工智能。狭义人工智能指的是擅长在单一应用领域执行特定任务的计算机系统。举例来说,苹果公司的虚拟助手Siri能够解释语音命令,但Siri背后的算法不能驾驶汽车、预测天气模式或分析医疗记录。其他系统也是如此。工厂机器人、个人数字助理和医疗决策支持系统等的设计目标是执行某一项狭义的任务,如组装产品、提供天气预报、提交购买订单、帮助影像医师解释X光片。在部署后,它们的学习是在该狭义任务的背景下进行的,它们没有能力自行学习其他任务,也不能被用于其他领域。

相比之下,“强”人工智能,也称通用人工智能,是一种假想的人工智能类型。它可以达到人类的智力水平,用这种能力解决任何类型的问题,就像同一个人的大脑可以轻松学会如何驾驶汽车、烹饪食物和编写代码一样。强人工智能包括一个具有综合知识和认知能力的系统,其性能与人类无异。通用人工智能目前尚未实现,而专家们对于它是否有可能实现、可能何时出现以及实现的进路持不同意见。

狭义人工智能和通用人工智能是人工智能演变进程的两端,实现二者之间的演化可能需要数年或数十年的发展。这种演变和中间状态称为广义人工智能,我们将在此概述推动该领域发展的几个关键挑战。

用更少的数据进行学习

最近,人工智能的大部分进展都来源于有监督的机器学习,特别是深度学习的进步。在有监督的机器学习中,系统从输入的案例中学习,识别模式并执行任务,例如对图像进行分类、识别语音或翻译文本。在训练期间,人类以有标记数据的形式向系统输入案例。但是,深度学习网络的一个明显缺陷是,为了达到理想的准确性和性能,它们需要大量的数据来学习。例如,用于视觉物体识别任务的数据库ImageNet包含超过1400万个图片的链接。数据库中的图片带有人工注释,对图片中的物体进行标识。收集这类数据集的标准方法之一就是众包,许多开发者和技术供应商通过众包来收集和创建训练模型所需的大量标记数据集。但是对于许多问题,尤其是企业应用和商业决策方面的问题,众包并不可行,原因或是不存在相应数据,或是问题领域太复杂、不容易标注,或是数据为专有或敏感数据等。

当可用的训练数据量有限,或是测试集与训练集差别很大,或是案例空间太过广泛且前所未见时,深度学习系统的效用就不太理想。因此,系统性能可能随操作环境的微小变化而严重下降。例如,同一个图像识别服务应用在不同的照明条件或视角下收集的图像数据时,它的性能会直线下降;语音识别系统在遇到新的方言或发音时往往会崩溃。

就另一方面而言,人类的学习方式与机器不同。一个孩子只用几个例子就能学会识别一种新的物体或动物,然后把他所看到的东西应用到其他环境中。因此机器学习研究人员普遍认为需要使用更少的数据或无标签的新技术来推动该领域发展,超越狭义人工智能的界限。

学习和推理的互动

自该领域确立以来,人工智能研究人员在学习和推理两种能力的研发方面都取得了巨大进展。然而,这两个领域各自独立发展,生产级的人工智能应用以孤岛的形式完成部署。例子是一个基于规则的客户管理系统与一个深度学习驱动的客户聊天机器人。人工智能领域离通用人工智能还相当遥远的原因之一就是我们无法建立可以互换使用这些机制的系统。先进的学习系统可以很好地从他们输入的数据中学习,但是并不能很好地与先前的知识结合。因此,它们无法处理那些与分类关系不大而与常识性推理关系较大的问题。举例来说,人类不需要任何直接训练就能轻易回答的推论,如“威廉王子和他的小儿子乔治王子谁的身高更高?”“如果你把针插进胡萝卜,洞是在胡萝卜上还是在针上?”这些无法用深度学习回答。这些看似简单的问题需要人类整合来自不同领域的知识,它超过了目前机器深度学习的能力。这表明若要使人工智能达到人类水平的认知灵活性,就需要新型的方法,将机器学习和机器推理相互结合。

人工智能的伦理与信任

今天,由人工智能驱动的系统经常被用来在众多应用中支持人类决策。然而人工智能系统的广泛采用并不仅仅来源于它们的特点和优势。许多扩展的人工智能应用可能会对人、社区或组织产生重大影响,因此我们对人工智能输出的信任至关重要。要信任人工智能系统的决定,我们不只需要知道它能够高度准确地完成一项任务,还需要确信决定足够可靠、公平、可以信赖,且不会造成伤害。用户需要确保决策不会被篡改,且系统本身足够安全。随着我们不断提升人工智能的能力,可靠性、公平性、可解释性和安全性的问题将变得尤为重要。

想要负责任地获得人工智能的助益,我们必须确保创建的模型不会盲目地接受我们自身的偏见和不一致,并通过自动化手段更广泛地将其扩展。在了解偏见如何影响人工智能决策方面,研究界已经取得进展,正在创建方法,以检测并减轻人工智能应用的整个生命周期中的偏见:训练模型、检查数据、算法和服务是否有偏见;如果检测到偏见,则对其进行处理。虽然还需要很多努力,但是我们可以开始在设计、测试、评估和部署人工智能解决方案时将检查和缓解偏见的原则纳入考量。

最近讨论的另一个问题是,人们担心机器学习系统是一种“黑箱”,担心许多最先进的算法产生的决定难以得到解释。大量新的研究提出了一些技术,在不影响“黑箱”模型准确性的情况下为其提供可解释的说明。这些技术包括模型及其预测的局部和全局可解释性、神经网络信息流的可视化,甚至是教学说明。我们必须将这些技术纳入人工智能模型开发工作流程,为开发者、企业工程师、用户和领域专家提供多样化的解释。

事实表明,深度学习模型很容易被愚弄。添加少量的噪声可以使人工智能做出令人尴尬和不正确的决定,而人类往往无法察觉。暴露和修复软件系统的漏洞是技术界的一项重要工作,这项工作也延续到了人工智能领域。最近,这一领域的研究出现了爆炸性增长:人们正在不断发明新的攻防手段,开发新的对抗性训练方法以加强对攻击的防范,以及评估鲁棒性的新指标。我们正在不断接近一个临界点,可以开始将它们整合到通用的人工智能DevOps 流程中,形成以保护和保障依赖神经网络的生产级应用程序。

人类对技术的信任来源于对其工作方式的理解以及对其安全性和可靠性的评估。我们驾驶汽车,是因为我们相信踩下刹车踏板会起作用。我们接受眼科激光手术,是因为我们相信系统会做出正确的决定。在这两种情况下,信任来自对系统不会犯错的信心,而信心来源于广泛的培训、详尽的测试、经验、安全措施、标准、最佳实践和对消费者的教育。这些安全设计原则中有许多适用于人工智能系统的设计;有些必须加以调整,而新的原则必须加以定义。例如,我们可以设计人工智能,使其在复杂环境中遇到全新的情况时需要人类干预。而且就像我们阅读药品和食品的安全标签或计算机硬件的安全说明一样,未来我们可能也会通过类似的方法就人工智能服务或解决方案的能力和限制进行沟通。最后,值得强调的是,决定信任谁将负责训练人工智能系统将是我们在所有人工智能项目中做出的最重要的决定。

人工智能在管理中的应用

人工智能将在包括战略规划、兼并和收购、营销和产品设计等各个商业环节中发挥越来越重要的作用。随着人工智能的不断进步,在企业和行业中的应用愈加广泛,其在战略规划方面的应用也将变得更加普遍。战略规划是一种组织管理活动,其目的是确定优先事项、集中资源、加强运营,并根据需要评估和调整战略方向。人类决策并不完美,可能会受到认知偏差和理性差距的影响,从而导致做出并非最优的决策。人工智能可以在多智能体系统内使用,在决策中增强个人或群体的认知。这些系统使人类智能体团队能够共同、更好地完成人类或软件智能单独完成的认知任务,尤其是在高风险的决策领域。这方面的一个例子是IBM公司的认知房间(cognitive room),能够支持并购决策。该人工智能系统允许决策者群体利用语音、手势和数据可视化技术与大量信息进行有效互动,协助评估并购方案的处理。

在产品营销领域,人工智能技术已经获得了巨大的吸引力。人工智能赋能的营销方法寻求利用人工智能提高营销效率和产出。例如,人工智能可以用于评估客户情绪、跟踪购买习惯,从而助力销售和营销。品牌和广告商可以利用这些信息使电子商务更加直观,或将其用于有针对性的促销活动。人工智能还可以用来创造与潜在客户更个性化的沟通。人工智能可用于通过聊天机器人改进与客户的互动,或更好地了解如何将内容与目标用户匹配。人工智能也将在创意产品设计中发挥重要作用。深度学习中的新技术,如生成对抗网络(GANs),不仅能够分析数据,而且可以综合数据。因此我们可以对已有产品进行学习,获得新的创意和想法。今天,这种人工智能能力正被用于创造数字作品,如艺术图片或营销活动的内容。在香水设计等变化多元的领域中,初步成果正在显现。将人工智能应用于生成性任务的趋势还将继续下去,作为一种自动化能力或协助人类创造力的工具,人工智能对于组织十分重要。人工智能还把劳动力管理应用扩展到了招聘和雇用、管理员工流失、确保员工的成长和满意度。人工智能模型还能够挖掘组织内部的数据,指导员工技能提升,寻求在公司内部发展的机会。

人力资源、招聘和决策支持系统等一些关键的管理职能已经受益于人工智能技术的应用。举例来说,IBM公司的沃森(Watson)解决方案已经被部署为允许人类更深入参与的人才解决方案,支持认知过程和认知操作、完成智能探索和发现、承担员工和管理助理职能。它从企业庞大的知识网络中得出关键的见解,为管理层和员工提供支持。沃森还被应用于大量案例,其人工智能技术在为用户提供洞察力方面发挥了关键作用。澳大利亚最大的能源公司伍德塞德公司(Woodside)使用IBM公司沃森留存公司高级专家的知识,使员工能够轻松地找到、分析和学习这些知识。超过80%的员工采用沃森进行日常工作,减轻了高级专家和管理层的负担。员工报告称,之前他们超过四分之三的工作时间都用于研究问题和寻求专家的帮助,而只有不到四分之一的时间用于实际解决问题。沃森已经帮助伍德赛德扭转了这种局面。此外,IBM公司沃森招聘解决方案已被用于帮助管理层评估申请人,预测其在任何特定职位成功的可能性。一家匈牙利初创公司Indivizo一直在帮助企业快速、高效地确定最适合某个职位角色的申请人。它已经成功部署了IBM公司沃森解决方案,以帮助管理层磨炼具有成功技能的合适候选人。

这些只是使用人工智能技术解决特定业务需求的部分案例。随着越来越多的公司采用人工智能技术提升商业价值,更多的案例还将陆续出现,受益于人工智能的业务职能范围也将继续扩大。

数据、人工智能和技能战略

随着企业开始在业务流程中部署人工智能技术,企业面临着各种各样的抉择:投资哪些能力,内部开发还是外部获取,使用哪个平台和工具,以及如何寻找或培养人工智能人才和技能。做好这一点的第一步是制定一个全面的数据和人工智能战略。

数据是实现今天的人工智能解决方案的核心要素。机器学习的吸引力的一个重要部分是它能够根据数据训练更准确的模型,而不是手工编写规则、明确定义应用程序行为方式的传统模式。数据继续以指数级的速度增长,每两年翻一番,预计到2025年将达到175泽字节 。企业数据的多样性也在增长。过去局限于关系数据库和数据仓库形式的传统结构化数据,现在已经被文本、音频、视频和传感器数据等形式的非结构化数据所取代。数量和种类的增长将继续得到组织对抓取和使用非结构化数据的持续需求的驱动。这些非结构化的数据涉及其业务的各个方面,包括供应链、客户数据、社交媒体互动等。企业正在不断意识到这些数据的价值,需要在抓取、存储和利用各种数据方面十分重视,并将其作为业务的一部分。

数据量和重要性的增长为人工智能对商业的下一轮重大影响创造了条件。人工智能可以基于非结构化数据训练模型做出更准确的预测,推动更好的决策并改变商业流程。企业将能够使用训练的人工智能模型提高运营效率,做出更明智的决策,加快创新的速度,来创造新的产品和服务。有效的人工智能战略始于数据,但也需要投入数据科学,将人工智能模型与企业目标相互联系。

人工智能领域最重要的进展来自监督环境下的数据驱动学习技术。这意味着数据被打上了标签。例如,汽车保险公司可以在索赔处理过程中根据车辆照片描述的损坏情况为数据分配标签。电信运营商可能需要根据更换的原因标记客户的流失。对数据进行标记需要投资,但投资也创造了附加价值,并且能够支持构建更强的人工智能预测能力。上述案例的意义在于标记的数据可以用来训练人工神经网络模型,从而改善甚至改变业务流程。在保险索赔的案例中,人工智能可以通过自动检测和评估损失协助索赔过程;在客户流失的案例中,人工智能模型可以对更换运营商做出更早、更准确的预测。

在不可能或无法有效投资创建标签数据的情况下,抓取和使用无标签的数据可能仍有价值。例如,电信运营商这种企业可能保有大量人与人的聊天记录。这种原始数据可以被抓取和存储。如果对该数据进行标记,则可能有助于使用监督学习训练人工智能对话模型,可以自动处理其中的一些聊天会话。如果没有标记,它仍然可以帮助建立人工智能系统,自动搜索和检索文件或先前的聊天会话以帮助人类智能。

企业人工智能战略的一个重要内容是认识到人工智能并不是一个单纯的技术或解决方案。若要开始实施人工智能战略,企业领导者需要增加自己对人工智能的认识,了解人工智能技术的范围,具体的解决方案如何整合到企业的日常运营以创造价值,以及如何适合现有的技术栈 和工作流程。构建成功的人工智能战略的一个关键步骤是明确企业的哪些业务流程可以被重构为有监督机器学习驱动的工作流程。这一进路代表着在最近的机器人流程自动化(Robot Process Automation,RPA)取得的进展基础上的下一个生产力前沿。

组织领导者可以选择与第三方公司合作来获得人工智能能力或订购人工智能服务,或是组建具有人工智能技能的内部团队直接开发相应能力,还可以设计一个组合战略,从外部引进部分能力,其他能力则在内部开发。任何一种选择都需要拥有强大的人工智能专业知识的人员进行支撑。在企业内部有效地利用人工智能,需要拥有多样化的技能体系,包括数据工程师(负责数据处理、整合和准备),数据科学家,人工智能研究员和工程师(开发和维护底层的核心人工智能功能),用户界面或人机交互专家(指导技术设计,将其置于业务和工作流程环境下),以及软件工程师(实施、部署和维护由此生成的业务应用程序)。目前,拥有构建人工智能系统的必要专业知识的人员严重短缺。最近的报告估计拥有开发人工智能系统的专业知识的人数可能低至22000人;而不太保守的报告估计全球有20万至30万人。据猜测,目前总计约有数百万人工智能和数据科学岗位空缺,对人工智能技能的需求继续急剧上升,许多大公司正在进行人工智能人才的“抢人大战”。

这也就涉及了企业人工智能战略的另一个关键组成部分,即确定如何吸引和留存拥有人工智能技能的人才。技能教育和培训必须与在人工智能方面取得进展、创造新的解决方案以及与人工智能系统相互协作所需的实际技能相匹配。近期的一份报告列出了企业采用人工智能的一些阻碍因素,包括数据挑战、企业文化、硬件和其他资源等,但人工智能技能差距被列为头号阻碍。

为了解决对人工智能技能的需求,公司可能会尝试传统途径,即公开发布招聘信息以及直接雇用应届大学毕业生或人工智能领域经验丰富的专业人士。由于大学里拥有大量学习和从事人工智能研究的学生和学者,教育已经成为专业技能和知识发展的一个关键渠道。正如我们所观察的,行业对专业知识发展的高度关注使很多知名在线学习平台都提供了由知名大学教授讲授的人工智能、机器学习和其他学科的在线课程。部分公司采取了更极端的策略,雇用大量的教师和学生,或收编一所大学的整个院系为其人工智能团队配备人员。

另一个策略是制订计划,对现有员工进行再培训和技能训练。一些大型企业已经设立了人工智能学院或人工智能大学等机构,由IBM公司和亚马逊等公司提供培训和技术支持。在企业内部获取或培训人工智能人才的特定方法也是企业人工智能战略的关键组成部分之一。

人工智能领域正在持续快速发展。因此,企业需要雇用具有高级技能的人工智能研究人员以保持与先进技术同步。最低标准是这些人工智能研究人员至少需要能够阅读最新的科学文献,使用最新的人工智能开源工具,识别和主持最新的神经网络设计、学习算法和模型,将它们与企业应用连接起来。更进一步的情况下,这些人工智能研究人员需要设计新的神经网络,创造新的学习算法,开发新的方法训练人工智能模型。人工智能研究人员需要掌握在机器学习、自然语言处理、计算机视觉、语音处理和机器人学等领域的高级技能。

人工智能研究人员与人工智能工程师协作,他们负责开发和实施人工智能系统。人工智能工程师将最新的神经网络、学习算法和模型整合到企业应用中,需要解决这些应用程序在构建时和运行时两方面的问题。构建时要求对包括神经网络模型的训练,以及确保信任、公平、可解释性和其他方面的稳健性。这些任务并不局限于一次性的构建,因为在实践中训练需要持续进行。运行时要求需要满足以支持必要的数据传输速率和数据量,在应用中部署人工智能模型。人工智能工程师需要掌握Python/C++/R/ Java等编程语言技能,拥有分布式计算、机器学习算法和高级信号处理的经验,与负责训练特定模型的数据科学家进行协作。

数据科学家需要主持和整理数据集,用于训练、验证和测试人工智能模型。这些数据科学家需要掌握概率和统计学知识,拥有数据建模和可视化能力,具备相关深度学习框架和数据管理工具(如Hadoop和Spark)的经验。数据科学家需要与领域专家合作,将应用要求转化为机器学习的具体任务,以训练所需的人工智能模型。当应用需求发生变化、数据分布出现变化或转移,部署的模型中检测或反馈错误时,数据科学家需要不断重新训练或完善部署人工智能模型。

小结

人工智能在过去的几年中出现了长足进步。人工智能开始从“狭义”状态——专注于单一领域的单一任务走向“广义”时代的边缘,即技术可以被应用于多个领域或问题集的任务。人工智能在帮助企业完成战略规划、产品设计、市场营销和客户支持等关键业务流程中具有巨大的潜力。企业领导者越来越多地计划在组织内开发和部署更多的人工智能,而关键的第一步就是确定人工智能的具体运用计划,满足其业务目标,制定全面的人工智能战略。人工智能战略的关键组成部分包括通过外部采购还是内部开发的形式获得必要人工智能能力的计划、集合人工智能人才的方法以及训练人工智能模型所需的适当的标签数据的可获得性和获取。我们希望所有领导者都能充分了解和意识到这些具体内容,以支持在其业务中成功部署人工智能。

本章作者

达里奥·吉尔,斯泰西·霍布森(Stacy Hobson),

亚历山德拉·莫西洛维奇(Aleksandra Mojsilović),

鲁奇尔·普瑞(Ruchir Puri),约翰·史密斯(John R. Smith) micRoNVJAjdQuYINYT5xf1lWGh9Obv/QtZwYBUV8V6jk+70Qxmgse3SE5Gmud1bK

点击中间区域
呼出菜单
上一章
目录
下一章
×