真正的问题并不是智能机器能否产生情感,而是机器是否能够在没有情感基础的前提下产生智能。
——马文·明斯基 ( Marvin Minsky ),1969年图灵奖得主
正如上一章所提及的,AI绘画,顾名思义,就是用 AI算法来完成绘画的过程。目前来说,表现优秀的 AI绘画算法都是利用深度学习(Deep Learning)技术来生成各种各样的图像,比如手写数字、人脸、风景、动物等。与人类画家需要一笔一笔地完成绘画稍有不同的是,AI绘画往往会更“直接地”生成一幅作品。我们会在以下各个小节中具体叙述什么叫更“直接地”生成——事实上,不同AI绘画技术的“直接地”生成的过程,也都是会有细微差别的!
在阐述AI绘画的能力、应用等方面之前,如果能对AI绘画底层的技术有所涉猎,届时就可以更好地去理解相应概念,并对场景进行举一反三。因此,本章将会对AI绘画涉及的技术做一个梳理,以便让读者对AI绘画的定义、历史、发展与最新成果有一个全面的了解。首先,我们会简要介绍AI、机器学习和深度学习的概念,使读者能够更好地理解后面的内容。然后,我们会介绍GAN模型,它是一种能够在自我对抗中不断成长的生成模型,也是在Diffusion模型出来之前,AI绘画最重要的技术之一。接下来,我们会介绍CLIP模型,它是连接不同数据的桥梁,可以帮助AI更好地理解图像和语言之间的关系。最后,我们会介绍Diffusion模型,它是现代AI绘画的基石之一,可以用来生成高质量的图像。当CLIP模型与Diffusion模型相结合时,AI就同时拥有了理解图像和语言关系的能力,以及生成高质量图像的能力。此时,我们给AI说一段话,它就能理解我们想要的图像,并把相应的高质量结果生成出来。这正是当前最先进的AI绘画模型——Stable Diffusion模型大致的底层原理。