在从2022年至2023年12月的一年半时间里,Midjourney成功完成了3次重大版本更新。图像的生成质量愈发接近专业生产工具的水准,其功能定位也逐步由生产辅助工具向独立技能转变。
为了更直观地展示各版本之间的差异,笔者以a pretty boy, stunning conte crayon drawing in the style of Jim Lee为提示语生成图像,并分别使用了--v 4、--v 5、--v 5.1、--v 5.2和--v 6.0参数,得到了如下从左到右排列的5张图像。通过逐一对比这些图像,我们可以清晰地观察到模型升级所带来的画面质感变化。最左侧的v4版本图像在画面细节上相对简单,而到了v5版本,图像已经非常接近提示语所描述的绘画风格。使用5.2版本模型生成的第四张图像更是进一步逼近了照片的真实感。最新更新的6.0版本不仅满足了提示语的描述要求,而且在画面笔触上呈现出了更加真实和细腻的效果。
v4是2022年Midjourney的早期版本,能够输出相对不错的图像,但在图像的真实程度上稍有不足,生成人物面部与手容易变形,但在生成插画、科幻等图像方面有着优异表现。
full body,futuristic knight in shining armor standing in ruins, flames and smoke background environment, this knight is holding a blue laser sword ,h.r giger style intricate designs etched into the armor, gold and silver accents, sleek and smooth, the rococo-style steel vines are winding,photorealism,intricate details, precise features, cinematic 8k,Unreal Engine, HDR, Subsurface scattering --ar 2:3 --v 4 --seed 1 --stylize 840
自2023年3月16日更新5.0版本后,Midjourney后续又陆续完成了v5.1、v5.2的小版本更新,下面分别介绍其特点。
v5.0版本是v4版本的全面升级,画面质量和图像风格开始接近真实影像,画面写真实风格提升显著。
»生成的图像风格更广泛,可以在提示词中添加艺术风格进行图像模拟生成。
»提示词理解能力升级,具有更详细的细节描述能力。
»支持生成更高质量的图像,动态范围更广。
»支持--tile参数,以实现无缝贴图。
»支持--ar比例大于2:1的长宽比。
»支持--iw,以权衡图像提示和文本提示。
jewelry design, Ornate, Expensive,shot by canon eos R5, photorealistic , product view, --s 550 --v 5 --iw 2 --v 5
jewelry design, Ornate, Expensive,shot by canon eos R5, photorealistic , product view, --s 550 --v 5 --iw 0.5 --v 5
V5.1版本于2023年5月4日发布,在该版本中AI文本理解能力进一步提高,可以进行一定程度的自主发挥和补充,让画面的细节更丰富、风格更强烈。
»引入了AI自主理解功能,为画面补充细节丰富画面内容。
»对文本提示的识别更准确,画面内容与文本提示关联性更高,视觉效果更连贯自然。
»减少了画面中不必要的边框和乱码文字内容的出现。
»提升了画面锐度,生成的图像比之前的更加清晰。
»新增加了raw模式,生成的图像与提示词更加匹配。
并且,在v 5.1版本中还提高了构图合理性,人物体态和画面元素关系更加真实自然。因此在图片生成方面更加贴近现实和用户的意图,对于生成广告、平面设计类图像来说有较大提升。
back light,A beautiful lady dressed in gorgeous Chinese Hanfu is dancing in an ancient Chinese courtyard --s 500 --style raw --v 5.1
cool Luffy,white curly hair, laughing out loud, Elichiro Oda style, Surrounded by lightning,black background,kungfu pose, kawaii, full body, random neon lights, re flective clothing, clean background, blind box style, popmart, chibi, holographic, prismatic, pvc --style raw --s 750 --v 5.1
v5.2模型版本于2023年6月23日发布,这是一个明显追求写实效果的模型,生成的光影效果变化更加细腻,并具有更好的颜色、对比度和构图,但在图像创意度方面与v5.1相比有所下降。此外,Midjourney新增了拓展与画面平移功能。
»新增Zoom out图像外绘功能,可实现图像的任意拓展绘制,下页上左图为原图,下页上右图为扩展后的图像。
»新增High Variation Mode模式,让同一张图像生成4张变体图像差异更加明显。
»新增/shorten命令,可以让Midjourney帮我们分析、精简提示词。
»修复了--stylize参数,图像的风格化程度会明显增强。
shadows from windows on face,Two girls in style HanFu style clothing stand on the street of the city,Three-quarter view, photography, photorealistic,full body,full portrait --s 750 --v 5.2
shadows from windows on face,Two girls in style HanFu style clothing stand on the street of the city,Three-quarter view, photography, photorealistic,full body,full portrait --s 750 --v 5.2
v6 Alpha版本测试发布于2023年12月21日,并在2024年2月完成正式上线。v6版本不是在原有模型基础上的升级,而是一个重新开始训练的新模型,该模型可以生成比之前发布的任何模型都更加真实的图像。
特别需要指出的是,由于此模型在训练时使用了大量电影素材,因此可以生成几乎与知名电影一般无二的场景图。
»图像质量升级,画面质感及细节刻画更加细致,图像的光影处理相比v5.2模型也更加真实自然。
»文本提示内容增加,具备长语句自然语言描写能力。
»可以使用主体+方位词的形式控制画面中元素的位置。
»新增文本绘制功能,可以在图片中添加简单文本。
»支持制作多格漫画风格,多格漫画可以作为动画视频的分镜参考,同时也可以直接用于漫画生成。
Still life photograph with a red apple on the left on the wooden table, a basket of bananas in the middle, a basket of oranges on the right, and a vintage camera in the bodyguard, head-up photography, Tyndall light effects, primitivism --v 6
a cake, text "Welcome 2024" on it --ar 3:2 --stylize 200 --v 6
Chinese comic book page Panel 1: In a serene village, the young protagonist, Xiao Ming, discovers an ancient and mysterious necklace. When he puts it on, he is transported to a magical and fantastical world. Panel 2: Xiao Ming finds himself in a forest full of magic and mythical creatures. There, he encounters a small fairy named Nina who can speak the human language. Nina tells him that he can return to his world only by completing three tasks. Panel 3: Xiao Ming accepts the challenge and embarks on an adventure with Nina. They journey through the forest, encountering various fantastical creatures and learning magical skills along the way. Panel 4: During their adventure, Xiao Ming meets a powerful and mysterious wizard who imparts new magical abilities. This strengthens Xiao Ming's belief in the possibility of completing the tasks. Panel 5: Xiao Ming and Nina successfully accomplish the first two tasks, but the third task becomes more challenging. They must traverse a dangerous maze and find a hidden treasure within. Panel 6: In the depths of the maze, Xiao Ming and Nina encounter the most powerful guardian. Through teamwork, they defeat the guardian and discover the treasure. Xiao Ming puts on the necklace from the treasure, returning to his world, but the friendship with Nina remains forever in his heart --ar 3:2 --v 6.0