Midjourney通过识别关键词来生成图像,如果只用某些词或者一句话生成,则照片会很难符合要求,为了使生成的照片更加符合需求,需要学习Midjourney描述词的语法结构。
Midjourney的语法结构如下:参考图链接(可以没有)+文字描述关键词(必须有)+后缀参数设置(可以没有),如图3.30所示。
图3.30
切记不同部分之间要输入一个空格,以防止系统无法识别命令。
(1)直接将参考图拖入输入框中(或者按住Shift键的同时拖入参考图),按Enter键发送,如图3.31所示。
(2)右击图片,在弹出的快捷菜单中选择“复制链接”命令,如图3.32所示。
图3.31
图3.32
(3)在输入框中输入/imagine,在蓝色框中粘贴刚才复制的图像链接,然后按空格键,再输入By the river(在河边),按Enter键,系统自动生成四格图像,如图3.33所示。这里的--iw数值是参考图权重,该数值必须为0~2,iw值越高,参考图片符合程度越高。
(4)单击 按钮,将第一幅图放大,这就是用参考图生成的卡通图,图中人物保持了参考图的色调和人物姿态,并符合英文关键词,如图3.34所示。
图3.33
图3.34
文本描述关键词的常用结构如下:主要元素(主题、角色、环境、关键特点)+风格元素(构图、灯光、镜头、材质、艺术风格)。我们可以充分发挥想象力来写文字描述,不同的段落由英文的逗号或者句号隔开,用+号融合需要融合的元素。
模仿别人的关键词可以让我们更快上手Midjourney绘画。在不同的关键词中有影响出图权重更高的关键词,只有通过控制少量关键词变化的实际测试,才可以更好地理解Midjourney对各种关键词的出图效果。下面测试关键词是如何生成AI图像的。
(1)在输入框中输入/imagine,在蓝色框中输入Couple sitting together, eating a big bucket of popcorn(一对情侣坐在一起,吃着一大桶爆米花),按Enter键,系统自动生成四格图像。注意:英文后面括号内是作者的中文注释,Midjourney目前仅识别英文描述词,如图3.35所示。
(2)第二幅图比较符合预期,如果没有满意的图可单击 按钮继续生成,单击 按钮,将第一幅图放大,如图3.36所示。
图3.35
图3.36
(3)右击放大的图像,在弹出的快捷菜单中选择“复制链接”命令,将该图像的链接复制,如图3.37所示。
(4)在输入框中输入/imagine,按Enter键,在蓝色框中粘贴刚才复制的图像链接,然后按空格键,再输入Couple sitting together, eating a big bucket of popcorn, In the cinema(一对情侣坐在一起,吃着一大桶爆米花,在电影院里),按Enter键,系统自动生成四格图像,如图3.38所示。
图3.37
图3.38
(5)如果不满意可单击 按钮继续生成图像,直到满意为止,如图3.39所示。
图3.39
后缀参数设置是指图像生成的宽高比构图、风格、尺寸、细节等常用后缀参数,这些参数间接或直接影响图片的生成效果。常用的参数有下面8组:
1.宽高比“--ar w∶h”或“-aspect w∶h”(w是宽,h是高)
例如,--ar 9∶16,就可以生成宽高比为9∶16的图片。注意:冒号必须使用英文的冒号,ar后面必须输入空格再输入比例。
下面使用宽高比后缀参数作图。
(1)在输入框中输入/imagine,按Enter键,然后在蓝色框中输入full-body shooting, a 6-month-old Chinese girl wearing a sparkling princess dress, emitting a luminous effect. She walked by the sea(全身拍摄,一个6个月大的中国女孩穿着闪闪发光的公主裙,发出明亮的效果。她走在海边),按Enter键,系统自动生成四格正方形图像,如图3.40所示。
(2)重新输入原文基础上加--ar 9∶16,按Enter键,系统将生成比例为9∶16的四格图像,如图3.41所示。
图3.40
图3.41
2.风格化图像“--stylize数值”或“--s数值”
数值的范围是0~1000,设置的数值越高,生成的图像越具风格化。Midjourney经过训练,偏向于生成有艺术形式的图片。stylize可调节风格化的程度。低stylize值生成的图片与提示词会非常匹配,但艺术性不高。高stylize值生成的图片非常具有艺术性,但与提示词的关联较少。
(1)在提示词中输入Claude Monet, water lilies, ponds --ar 3∶2 --s 1000(莫奈,睡莲,池塘),按Enter键,生成图3.42所示的图片。可以看到系统生成了有创意的莫奈风格的画面。
图3.42
(2)在提示词中输入Claude Monet, water lilies, ponds --ar 3∶2 --s 10(莫奈,睡莲,池塘),按Enter键,生成图3.43所示的图片。可以看到,图片完全是莫奈的绘画作品《睡莲》,没有加入太多创意。
图3.43
3.风格差异“--chaos数值”或“--c数值”
用“--chaos数值”或“--c数值”来表示生成的四张图的风格差异,数值的范围是0~100,默认值是0,该值设置越高生成的图像之间的风格差距越大。下面来做一个练习。
(1)用提示词a cat生成四格图像,如图3.44所示。此时--chaos默认为0,发现四幅图的风格较为接近。
(2)重新用相同的提示词a cat,后面加上--c 100,生成四格图像,如图3.45所示。此时由于--chaos为100,所以,四幅图的风格发生了较大的差异。
图3.44
图3.45
4.参考图权重“--iw数值”
当用参考图来生成新图时,--iw数值能够控制新图是否像参考图,该数值的范围为0~2(默认值为1),--iw值越高,与参考图片的吻合度越高。下面来做几个练习。
(1)从资源浏览器中拖入一幅图片到提示词输入框中,按Enter键发送。右击该图片,在弹出的快捷菜单中选择“复制链接”命令。
(2)在输入框中输入/imagine,在蓝色框中按Ctrl+V组合键粘贴图片链接,后缀输入--iw .25,按Enter键发送,生成的效果如图3.46所示。由于权重值很低,所以,生成的关联度不大。
图3.46
(3)将后缀改为--iw .5和1的效果如图3.47所示,可以看出,权重值越大,生成的图像关联度越高。
图3.47
(4)将后缀改为最大值--iw 2后,生成的效果已经与参考图非常接近了,如图3.48所示。
图3.48
5.出图质量“--quality数值”或“--q数值”
--quality的范围是0.25~5,默认值为1。较高的值会使用更多订阅的GPU时间。--quality仅影响初始图片生成。下面做几个练习。
(1)用提示词tasty cake in bright aesthetic lighting --ar 3∶2 --q .25生成四格图像,如图3.49所示。可以看出,--quality为0.25时画面的质量较低。
图3.49
(2)重新设置--quality为5,生成的效果如图3.50所示,图中元素较为丰富,画面质量较高,细节较好(生成时间也更长了)。
图3.50
6.用大括号可一次生成多图
Midjourney默认一次出图4格,可以用大括号来增加出图效率。下面做几个练习。
(1)用提示词a playful cat --ar {3∶2,4∶5,5∶6,6∶7}生成图片,注意花括号中用逗号隔开了4组不同的--ar参数,按Enter键发送,此时系统会弹出提示,单击 按钮,如图3.51所示。
图3.51
(2)此时会陆续生成我们需要的4组不同比例的图像,如图3.52所示。这种方法可以生成不同变量参数的图,大大提高了工作效率。
图3.52
7.排除“--no词汇”
输入后缀词--on指令可以屏蔽一些不想要的东西,如一堆糖果中不想出现红色,可以用--no red后缀来屏蔽红色糖果。
(1)输入提示词There are many candies on the table(桌子上有很多糖果),生成图3.53所示的图片。单击U按钮放大。
图3.53
(2)单击 按钮,打开修改对话框,框选红色的糖果,并在下方提示词中输入--no red,如图3.54所示,单击 按钮发送,得到图3.55所示的效果,红色的糖果被屏蔽了。
图3.54
图3.55
8.双冒号“::权重”
可以通过为每个提示词分配权重值(如::10)来调整混合效果的工作方式。双冒号::提示词默认值为1,较低的数值表示提示词对最终输出效果的影响较小;较高的数值表示提示词对最终输出效果的影响较大。
(1)在提示词中输入Animals in the forest, lions, tigers, elephants, sheep, monkeys, giraffes, crocodiles, dogs, cats(森林里的动物,狮子,老虎,大象,绵羊,猴子,长颈鹿,鳄鱼,狗,猫),按Enter键,生成的画面如图3.56所示。画面中所有动物的分布数量都很平均。
图3.56
(2)下面使用双冒号::权重,单击 按钮,在提示词tigers后面加上::10,单击“提交”按钮,生成的画面如图3.57所示。看到老虎的出现概率增加了很多。该参数默认值为1,如果给老虎单独增加10,则老虎的权重就增加了10倍。
图3.57
(3)下面重新做一个实验,如果不使用 按钮微调,可直接用上一步的提示词重新生成图片,在tigers后面分别加上::0.1、::2、::5、::10,重新计算,则会出现图3.58所示的效果,参数越大,权重越高。
图3.58