与Stable Diffusion相反,Midjourney是一款付费且闭源的AI绘画软件,如图1-4所示。它于2022年3月面世,创始人是David Holz。Midjourney并没有以APP或者网站的形式提供服务,而是将服务搭载在Discord频道上,用户可以进入Discord的Midjourney服务器选择一个频道,然后在聊天框里调用“/imagine”命令,指示聊天机器人生成图片,如Midjourney的最新模型拥有更多关于生物、地点、物体等知识,它更擅长正确处理小细节,并且可以处理包含多个角色或对象的复杂提示,如图1-5所示。Midjourney所有的功能都是通过调用聊天机器人程序实现的。对于大多数人来说,这是一种新奇的体验。
图1-4
图1-5
Midjourney一直在努力改进其算法,每隔几个月就会发布新的模型版本。
专注于模型迭代:Midjourney是闭源的并且已经盈利了,未来会有足够的现金流支撑它的研发。另外在竞争的初期保持闭源,能够保持自己的竞争优势,从而将注意力更多地花在产品的改进和提升上。
图片质量高:目前看,Midjourney制作的图片质量都比较高,它的水平下限比Stable Diffusion高不少。另外工具软件也相对简洁、易用,相比庞杂的Stable Diffusion来看,轻便许多。
产品特性强:Midjourney团队不断致力于优化产品体验,他们的目标是将Midjourney打造成一个庞大的、精致的、易用的、高效的基础设施。
使用成本高:Midjourney是付费应用,每生成一张图,都会消耗对应的积分,为了获得满意的图片,用户往往需要进行多次修改和调整,这带来了昂贵的使用成本。
画面控制能力不足:目前,Midjourney无法像Stable Diffusion那样,允许用户通过ControlNet插件对画面的构图、人物的动作甚至表情进行干预。用户可以通过设置参考图的方式来影响图片生成,但可控性不强。
无法使用自定义的插件或模型:在Midjourney中用户无法训练并使用自己的模型,用户无法自由探索创作的边界,也没有足够多的第三方插件供用户选择使用。