购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

3.2.1 txt2img

txt2img是AIGC中常用的功能之一,它能够根据输入的文字直接生成对应的图片,也就是常说的“以文生图”。这个过程中AI具有较大的自由发挥空间,但生成的结果完全取决于提示词(prompt)的详细程度和质量。txt2img是Stable Diffusion软件的默认页面,打开软件后将优先展示该界面。接下来,将从上到下依次介绍该界面。

Prompt(提示词)是需要输入的文字。它仅支持英文输入,输入的词应以逗号隔开。输入的文字可以是完整的句子,例如“a man is riding a bike”,也可以是多个形容词,例如“a man, riding a bike”。

Negative prompt(负面提示词)即不希望出现的一些效果。例如,在Negative prompt中输入“bad quality”可以有效降低生成低质量图片。如果想要生成男生,但模型总是生成女生,也可以在Negative prompt中加入girl、woman等词语,对模型进行纠错。

Generate(生成按钮)用于在将一切设置妥当后,生成对应的图片。生成的图片将会展示在下方的空白框体中。

Sampling method(采样方法)默认设置为Euler a,指的是Stable Diffusion算法在生成图像时所采用的采样方式,不同的采样方式生成的效果存在显著差异。Sampling是Stable Diffusion中十分重要的一个概念,是Stable Diffusion产生的。读者可根据他人经验或自行尝试,选择符合自己需求的采样方式。对于新手来说,可以不作太多调整。

Sampling steps指的是算法在生成图像时所执行的采样步数,默认为20步。从理论上来讲,采样步数越多,生成的图像细节越精细,但耗时也会越长。但在实际操作中,过多的细节并不一定会带来更高的质量,建议设置为10~50。

Width&Height用于设置生成图像的宽和高,默认为512×512。提高分辨率将显著提高计算代价、GPU显存和耗时。如果想要直接生成较高分辨率的图片,例如1920×1024,建议将Stable Diffusion部署在服务器上,并采用V100等显存较大的专业GPU。

Batch count指连续执行的批次数量,默认为1。当设置为N时,会同时输出N张图片。如果读者想要一次性生成多张图片,可以提高Batch count数,Stable Diffusion将依次执行N次,并且将多张图片同时展示在下面的显示框中。当然,所消耗的时间与Batch count呈线性关系。例如,当Batch count设置为5时,就需要消耗5倍的时间来生成5张图片。

Batch size指每次同时生成的图片数,默认为1。当设置为N时,会同时输出N张图片。Batch size和Batch count之间的区别在于,Batch size是并行生成,而Batch count是串行生成。Stable Diffusion会一次性生成N张图片,因此显存要求也会提高。建议配置较低的读者将Batch size设置为1。

CFG Scale是Classifier Free Guidance Scale的缩写,默认为7,用于控制生成的图像对prompt的符合程度,CFG Scale越高,生成的图像越符合prompt,但色彩饱和度越高,CFG低扩散(diffusion)的自由度越高、越模糊,根据经验,设置为5~15比较好。

Seed(随机种子)默认为-1。Stable Diffusion会通过Seed产生一个初始的随机噪声,在随机噪声的基础上不断采样,直至得到最终的绘画结果。相同的Seed产生的随机噪声是完全相同的,这意味着生成的过程实际上是完全可重复的,假设所有的prompt和参数包括Seed也一致,可以得到完全相同的图片。如果对当前生成的图片不满意,可以通过调整不同Seed,选择合适的结果。另一方面,Seed对于保持图像一致性有着十分重要的作用,如果想要生成的图片之间保持相似,则需要将他们的Seed设置为相同的数值。 lsDjGzAcTlon1vl+YEM0O09bXc21zqQk3rx1upbChUPU56tr2vbw7oD41bihBiqa

点击中间区域
呼出菜单
上一章
目录
下一章
×