原文标题:《逼真到颤抖!Midjourney 画出完美中国情侣,画师、演员、模特一键淘汰》
继 GPT-4 之后,Midjourney V5 上线。网友纷纷试玩,画出了一对中国情侣,视觉炸裂,碾压人类画师。
昨天,由 Midjourney V5 画的一对中国情侣在网上引起轩然大波。
许多人纷纷惊呼:人类画师别活了。
有人不相信这是 Midjourney 之作,也亲手体验了一把。在输入以下的 prompt 后,画风瞬间惊艳了。
「A pair of young Chinese lovers, wearing jackets and jeans, sitting on the roof, the background is Beijing in the 1990s, and the opposite building can be seen --v 5 --s 250 --q 2」
在 GPT-4 发布后,Midjourney 也更新了 V5,不仅绘图更逼真,而且 prompt 更灵敏。
最重要的是,一直被诟病的「AI 不会画手指」,Midjourney V5 都拿捏了。
还有满屏的电影质感,除了 OMG,还是 OMG。
甚至有网友惊呼:模特不存在了!
效果炸裂,一大波设计师要失业了
从 Midjourney 的 V1 到 V5,就可以看到 AIGC 这一年来的进化速度有多快。
最新 V5 版的图像质量更高、输出更多样化、有更广泛的风格、支持无缝纹理、有更宽的纵横比、有更好的图像提示,以及更宽的动态范围……
激动的心,颤抖的手,国内网友纷纷上手实操了一波。
先上手的写真图:
虽然 V5 能够画出 5 根手指,但是在手指的细节上,还是差点意思。
比如试着让 Midjourney V5 给梵高的房间拍个照:
Midjourney V5 在画中国美女的神态时,把控也是非常到位。
V5 还能拿捏中国古典风格的美,画出了亭亭玉立的美人,细节颗粒度拉满。
还有网友用 GPT-4+Midjourney V5 创作了电影「杭州重生」,连豆瓣上介绍页都 P 出来了,看起来还真是那么回事儿。
在 2022 年 12 月,谭木匠举办了一场梳子比赛,人类设计师设计的梳子如下:
网友黄仲生用 V5 试了一波,并惊讶地发现「麻瓜」在 AI 面前完全不能打。
当别人反馈说上面的梳子太美,只能用来收藏,网友又整了一波日常可用的梳子。
还有给小朋友用的梳子
在国外,有网友直接用 Midjourney V5 画出了 The Matrix 的电影质感,让人瞬间怀疑这是不是电影里的截图。
并且献上了 prompt:
「Keanu Reeves in The Matrix. AI cinema. Synthography. Cinematic. Film grain. --ar 16:9 --v 5」
还有网友尝试用「民宅火灾现场微笑女孩」经典 meme 让 Midjourney 创作「城堡火灾现场微笑洛基」。
来看下这炸裂的效果。
网友还开脑洞把「北京屋顶情侣」图加上洛基元素。
还有个搞笑版的,龙卷风来了,老太太骑着电驴在「狂飙」。
亚洲人的脸部特征也是做的非常逼真。
旅行博主都不用出门,直接在家调教 Midjourney 就可以了。
还有网友拿 V4 和 V5 做了对比图,通过输入一张图,还有文字提示,V4 生成的图片在光照下物体阴影处理方面无法与 V5 相比。
再来一张眼睛特写图:
通过对 V3、V4、V5 这三个版本输入相同提示、相同设置,对其输出图片进行了对比。
在 V5 这个版本中,波光粼粼的水面,还有鱼儿在水中游的倒影,已经达到了以假乱真的程度。
但是如果没有提供有关环境的文本的提示,比起 V4,V5 默认生成了更加真的环境。
网友迫不及待地让 V5 来复刻一下王家卫「蓝莓之夜」的电影风格,发现 V5 在处理玻璃的反射方面做得更逼真了。
以及各种真假难辨的作品:
反派气质拉满的马斯克:
「猫戴 VR」:
比 V4 强在哪?
最新升级的 V5,相较于前一版有什么改进,一位研究员就他们之间的对比做了一张表:
1. 密铺(--tile argument)
在创建模式时使用。此前 V3 有这一参数,然而在 V4 中暂时终止使用,V5 版本重新上线。
比如输入「/imagine tesseract pattern, repeat, white and blue highlights --s 1000 --v 5 --tile」,生成如下的图:
2. 长宽比(--ar argument )
在 V4 中,只能有不高于 1:2 或不宽于 2:1 的自定义纵横比。而在 V5 中,你可以自定义比率与任何「宽度: 长度」比,如下是自定义比例的演示:
这一点升级,意味着什么?
现代电影中常见的最宽纵横比 2.39:1 都能够实现,你可以制作电影巨幕,人人都能成为导演!
3. 图像权重可以自定义( -- iw argument)
图像提示中的权重现在可以输入自定义值。你可以决定输入图像对最终生成的图像的影响程度。
如下,在 Midjourney V5 中,输入一张图和一句文本提示。
通过自定义不同权重,2、1、0.5 生成了不同的图片。
输入的提示如下:「/imagine http://imgur.com/ romman.png a roman soldier with daisies in the background --seed 123 --iw 2 --v 5」
4. less opinionated
「less opinionated」意味着,在 V4 中,只需要编写较少的文本提示,Midjourney 便会输出更具创造性的图像。
但 V5 不是这样的,你可能需要输入更多的形容词,并给出更多的细节,比如风格或情绪,输出图像应该是什么样子。如果没有更多描述,Midjourney 就会输出一个默认风格,比如「摄影」风格。
这一点升级,可以让人们通过文本提示能够更精准地把控 Midjourney 输出的内容。也意味着,在输入文本和输出图像之间有「更多的内聚力」。
以上 4 点升级是官方博客中提到,但是最让人意想不到的是 Midjourney V5 能够画出「5 个手指和脚趾」!
另外,V5 已经在更真实的图像 / 照片上进行了微调,因此可以看到在输出窗户反射和透过玻璃的图片上更加真实。
考考眼力见
最后来一个测试题:
下面 4 张图,只有一张是真人,其他都是 Midjourney V5 画的,猜猜真人是哪一张?
参考资料:
https://bootcamp.uxdesign.cc/midjourney-v5-is-here-so-whats-new-df3f3a645295
https://twitter.com/mranti/status/1637326003927396352?s=46&t=iBppoR0Tk6jtBDcof0HHgg
本文来自微信公众号:新智元 (ID:AI_era)
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。