



本节将介绍强化学习和NLP的基本概念,这些都是人工智能领域中非常重要的话题。它们通常是使用深度网络来实现的。因此,了解它们的原理至关重要。
强化学习(reinforcement learning)是机器学习的一个分支,它使用代理(agent)在给定环境中执行一组可能的操作,以最大化奖励。
在人工智能领域,代理通常是指驻留在某一环境下,能持续自主地发挥作用,具备驻留性、反应性、社会性和主动性等特征的计算实体。代理既可以是软件实体,也可以是硬件实体,所以可以这样理解:代理是人在AI环境中的代理,是完成各种任务的载体。
机器学习的另外两个分支——有监督机器学习和无监督机器学习——通常以表格的形式对数据集进行学习,而强化学习代理则主要使用在任何给定情况下生成的决策树进行学习,这样决策树最终将导致具有最大奖励的叶子。
例如,考虑一个希望学习走路的人形机器人(代理)。它可能先尝试的是两条腿同时向前,在这种情况下它会摔倒,这样它获得的奖励为0(可以表示为人形机器人走过的距离)。然后它会尝试,在迈出一条腿之后停留一会儿,然后再迈出另一条腿,由于这种一定程度的延迟,机器人能够走×1步,然后在再次同时迈出双腿时又一次摔倒。
强化学习体现了探索(exploration)的概念,这意味着寻找更好的解决方案,并加以利用(exploitation),即使用先前获得的知识。仍以机器人学习走路为例,由于×1的奖励大于0,因此,算法会放弃同时迈出双腿的做法,而学习到在步幅之间放置大致相同的特定延迟量。随着时间的推移,在开发和探索的共同作用下,强化学习算法将变得非常强大,在这种情况下,类人机器人不仅可以学习如何走路,还可以学会跑步。
自然语言处理(natural language processing,NLP)是人工智能的一个广阔领域,它通过使用计算机算法处理和理解人类语言。
NLP包含多种方法和技术,每种方法和技术都针对人类语言理解的不同部分,例如基于两个文本提取特征的相似性理解含义、生成人类语言响应、理解用人类语言提出的问题或指令,以及将文字从一种语言翻译为另一种语言等。
NLP在当前的技术世界中得到了广泛应用,多家顶级科技公司都在该领域不断相互追赶。目前已经有多种基于语音的用户助手,例如Apple Siri、Microsoft Cortana(小娜)、百度的小度、小米的小爱同学和Google Assistant,它们都依赖于准确的NLP技术才能正确执行其功能。
NLP还可用于自动客户支持平台,该平台可以回答常见查询,而无须人工客服来回答。这些基于NLP的客户支持系统还可以从真正的人工客服在与客户互动时做出的反应中学习。例如,在新加坡开发银行(Development Bank of Singapore,DBS)创建的DBS DigiBank应用程序中就可以找到这样的系统。
该领域仍在进行广泛的研究,预计未来它将在人工智能中占据领导地位。
在下一节中,我们将讨论深度学习与移动应用程序集成的方法。