购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第1节
AI:机器学习与深度学习

本节中,我们将介绍AI、机器学习和深度学习的概念,它们是理解后续技术的基础。

一、什么是AI?

AI(Artificial Intelligence),即人工智能,是指一种模拟人类智能的计算机系统。这种系统通常需要拥有一定的学习和推理能力,以便能够自主地完成各种任务。为了搭建AI,从古至今的学者进行了许许多多的探索。大家首先遇到的问题就是:怎样的一个系统,才能叫作拥有“智能”?正如1950年,艾伦·图灵(Alan Turing)发表的划时代论文《计算机与智能》(Computing Machinery and Intelligence)在开篇抛出的问题:“机器能思考吗?”该问题虽然在科幻小说中时有提及,但在图灵之前,鲜有严肃论文对其下过定义。而图灵在论文里也没有马上直接解答,而是提出了现在颇为有名的一个思想实验——“图灵测试”。

简单来说,“图灵测试”是将一台计算机与一个人进行对话,如果这个人不能确定自己正在与机器对话,那么这台计算机就可以被认为是具有智能的。虽然“图灵测试”比较简易,具有很多缺陷,但它确实让人们能够直观地想象出AI,或者说具备智能的机器是什么样子的,同时也为后世研究AI提供了指导性的方向。

当然,说“图灵测试”简易且有缺陷是有原因的:一方面,AI不应该局限于对话(事实上,AI绘画在做的就是画画,而不是对话);另一方面,AI应该除了能做某个具体的“任务”,还能做更抽象的事情,比如自主学习、自主推理、自主决策等。因此,随着AI学科的发展,人们又陆续提出了更具体的测试方法,如功能测试、性能测试、可靠性测试等。这些测试方法的目的都是为了评估人工智能系统在具体业务场景的能力和性能,以便更好地指导人工智能技术的发展和应用。

二、AI的三种流派

在了解了AI的定义后,我们就需要研究如何实现AI。由于人类本身就是很强的智能体,无论是科幻小说、科研论文还是刚刚说到的“图灵测试”,往往都会以“人”作为终极目标。为了让AI拥有“人”的能力,学者们陆续提出了符号主义、联结主义和行为主义这三种研究方向。

符号主义是指一种利用符号和规则来表达人类知识和推理方式的方法,被认为是人工智能研究的开端。符号主义的核心思想是将人类的知识和推理方式用一些规则和公式表达出来,然后让计算机系统根据这些规则和公式进行推理和决策。虽然符号主义在一些领域表现出了很好的能力,但是它的应用范围通常比较有限,而且需要人工来编写规则和公式,工作量很大。

联结主义是指一种利用神经网络来进行学习和预测的方法,是一种基于仿生学的思想。联结主义的核心——神经网络模型通常由多个神经元和多个层次组成,每一层都对输入数据进行一定的处理和转换,最终得到一个输出结果。事实上,我们后面会介绍到的深度学习,本质上就是“使用很深的神经网络进行机器学习”。目前,神经网络已经被广泛应用于图像识别、语音识别、自然语言处理等领域,尤其在图像生成——也就是本书的主题:AI绘画——方面,表现出了出色的能力。

图2-1 神经网络结构的示意图

行为主义则是指一种从行为和反馈出发来进行学习和预测的方法,是一种基于心理学的思想。行为主义的核心思想是通过观察行为和反馈来进行学习和预测,而不需要考虑人类知识和推理方式。行为主义被广泛应用于机器人、自动驾驶等领域,也具有很好的实用性和应用前景。

总的来说,符号主义、联结主义和行为主义都是人工智能发展的重要方向,不同的方法和模型适用于不同的领域和场景,学者们需要根据具体应用来选择和发展适合的人工智能模型和算法。

三、机器学习与深度学习

比起上一小节叙述的各种“主义”,“机器学习”这个词仅仅从字面上便能吸引更多的人。机器学习从直观上来说,是比较“大力出奇迹”的方法:通过让计算机“学习”大量的数据,让计算机找到这些数据中的“规律”,从而让计算机拥有预测和决策能力,也就是变成了AI。在机器学习的语境下,我们可以快速地举一些例子:为什么AI能判断一张图片是猫猫还是狗狗?因为它见过足够多猫猫狗狗的图片,并找到了猫与狗之间差异的规律。为什么AI能在任何问题下都对答如流?因为它见过足够多的文本,知道各种问题对应的文本后面,一般都会接上怎样的回答。

图2-2 AI能图像判别示意案例

当然,这只是一种非常笼统的概括。在实际操作时,会遇到很多具体的、细节的技术性问题,比如:怎样拿到机器能够“理解”的数据?怎样处理数据来让机器更好地“理解”?怎样才能让机器具有“学习”的能力?我们怎样才知道机器已经学习“到位”了?这四个问题恰恰对应着机器学习的四大步骤——数据获取、特征工程、模型训练与结果评估。这四大步骤的每一步都可以展开成一本专业的书籍,所以这里就不展开太多,而仅仅是给出纲领式的叙述。

数据获取: 研发人员常常会从公共数据库、公司内部数据库、网络爬虫等多种数据来源,收集到机器所需的“原始数据”。在数据获取的过程中,需要注意数据的质量和规模,以及数据的合法性和隐私保护。

特征工程: 研发人员需要在第一步获取的原始数据的基础上,提取出有意义的特征,以便机器能够更好地“理解”它们。特征工程通常包括特征提取、特征选择、特征变换等步骤,同时也需要根据具体的应用场景来选择和优化特征。

模型训练: 研发人员需要选择具体的模型并为该模型设计合适的算法,目的是通过对数据进行学习来得到一个能够预测和决策的模型。常见的模型有线性回归、逻辑回归、决策树、梯度提升树、支持向量机和神经网络等,常见的算法则有求解解析解、信息增益算法、SMO算法、梯度下降等。

结果评估: 研发人员需要对训练所得的模型进行评估,从而知道机器是否已经学习“到位”。常见的评估指标有准确率、精度、召回率等,也是需要根据具体的应用场景来选择和优化评估指标。

总的来说,机器学习的这四大步骤都是相互依存、相互作用的,需要进行综合考虑和优化。学者们需要根据具体的应用场景来选择和发展适合的机器学习模型和算法,以便更好地应用于实际场景。

如果能理解机器学习的思想,即让机器看很多数据并尝试让它找到规律,那么深度学习是很好理解的。事实上前文已有提及:深度学习就是机器学习的一种特殊形式,它的模型选用了非常“深”的“神经网络”模型,而相应算法则通常是随机梯度下降算法或衍生算法。深度学习在这几年的AI研究中占据了绝对的主流,它的成功得益于计算机技术的不断进步和大数据的出现。随着计算机硬件的不断升级和算法的不断改进,深度学习不仅在诸多领域都取得了重大突破,而且它的运算速度也在不断增强,使得在越来越多的实际场景中都用到了深度学习模型。

而最新的、举世瞩目的AI技术之一——AI绘画,正是深度学习的又一成功案例。正如上一章所描述的,AI绘画本身经历了若干阶段,每个阶段都有一些代表性的深度学习模型,在接下来几节里,我们将对这些模型做一个简单的介绍,以便让读者对AI绘画的技术演进有较为全面、直观的认知。 qYbKzzKgn6+6zT4lWbT5hhr9/l7SJg6wJBIgwDJfZAdDWx1yxs2gYT+EGCAdL2jr

点击中间区域
呼出菜单
上一章
目录
下一章
×