随着诸如ChatGPT语言模型的发展,AI绘图应用也能够更好地理解提示内容,并绘制出质量更高、更符合要求的图片。在本节中,我们将介绍两款AI绘图模型,即DALL·E和Stable Diffusion,并演示如何通过基于提示内容的方式进行绘图。
DALL·E是由OpenAI研发的一个图像生成模型,它可以接受文本描述作为输入,并生成对应的图像。这个模型是基于GPT-3语言模型技术进行构建的,能够生成多样化、高质量的图像。
提示的内容如下(使用DALL·E模型)。
画一幅阳光灿烂,天空蔚蓝,有金黄色沙滩的油画
图2-4所示为DALL·E基于提示内容绘制的图像。
图2-4 DALL·E基于提示生成图像
Stable Diffusion是开源AI绘图模型,可以根据文本输入生成图像。目前Stable Diffusion只支持英文输入,将提示“画一幅阳光灿烂,天空蔚蓝,有金黄色沙滩的油画”翻译成英文后,提示的内容如下。
提示的内容如下(使用Stable Diffusion模型)。
Paint an oil painting with bright sunshine, blue sky, and golden beaches
图2-5所示为Stable Diffusion基于提示内容绘制的图像。
图2-5 Stable Diffusion基于提示生成图像