Midjourney+Stable Diffusion+Photoshop平面设计从新手到高手最新章节_李楠楠著

3.2.1 txt2img

txt2img是AIGC中常用的功能之一，它能够根据输入的文字直接生成对应的图片，也就是常说的“以文生图”。这个过程中AI具有较大的自由发挥空间，但生成的结果完全取决于提示词（prompt）的详细程度和质量。txt2img是Stable Diffusion软件的默认页面，打开软件后将优先展示该界面。接下来，将从上到下依次介绍该界面。

Prompt（提示词）是需要输入的文字。它仅支持英文输入，输入的词应以逗号隔开。输入的文字可以是完整的句子，例如“a man is riding a bike”，也可以是多个形容词，例如“a man, riding a bike”。

Negative prompt（负面提示词）即不希望出现的一些效果。例如，在Negative prompt中输入“bad quality”可以有效降低生成低质量图片。如果想要生成男生，但模型总是生成女生，也可以在Negative prompt中加入girl、woman等词语，对模型进行纠错。

Generate（生成按钮）用于在将一切设置妥当后，生成对应的图片。生成的图片将会展示在下方的空白框体中。

Sampling method（采样方法）默认设置为Euler a，指的是Stable Diffusion算法在生成图像时所采用的采样方式，不同的采样方式生成的效果存在显著差异。Sampling是Stable Diffusion中十分重要的一个概念，是Stable Diffusion产生的。读者可根据他人经验或自行尝试，选择符合自己需求的采样方式。对于新手来说，可以不作太多调整。

Sampling steps指的是算法在生成图像时所执行的采样步数，默认为20步。从理论上来讲，采样步数越多，生成的图像细节越精细，但耗时也会越长。但在实际操作中，过多的细节并不一定会带来更高的质量，建议设置为10～50。

Width&Height用于设置生成图像的宽和高，默认为512×512。提高分辨率将显著提高计算代价、GPU显存和耗时。如果想要直接生成较高分辨率的图片，例如1920×1024，建议将Stable Diffusion部署在服务器上，并采用V100等显存较大的专业GPU。

Batch count指连续执行的批次数量，默认为1。当设置为N时，会同时输出N张图片。如果读者想要一次性生成多张图片，可以提高Batch count数，Stable Diffusion将依次执行N次，并且将多张图片同时展示在下面的显示框中。当然，所消耗的时间与Batch count呈线性关系。例如，当Batch count设置为5时，就需要消耗5倍的时间来生成5张图片。

Batch size指每次同时生成的图片数，默认为1。当设置为N时，会同时输出N张图片。Batch size和Batch count之间的区别在于，Batch size是并行生成，而Batch count是串行生成。Stable Diffusion会一次性生成N张图片，因此显存要求也会提高。建议配置较低的读者将Batch size设置为1。

CFG Scale是Classifier Free Guidance Scale的缩写，默认为7，用于控制生成的图像对prompt的符合程度，CFG Scale越高，生成的图像越符合prompt，但色彩饱和度越高，CFG低扩散（diffusion）的自由度越高、越模糊，根据经验，设置为5～15比较好。

Seed（随机种子）默认为-1。Stable Diffusion会通过Seed产生一个初始的随机噪声，在随机噪声的基础上不断采样，直至得到最终的绘画结果。相同的Seed产生的随机噪声是完全相同的，这意味着生成的过程实际上是完全可重复的，假设所有的prompt和参数包括Seed也一致，可以得到完全相同的图片。如果对当前生成的图片不满意，可以通过调整不同Seed，选择合适的结果。另一方面，Seed对于保持图像一致性有着十分重要的作用，如果想要生成的图片之间保持相似，则需要将他们的Seed设置为相同的数值。