设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

逼真 AI“情侣合照”竟被代码识出破绽?沃顿教授预言 AI 将在 18 个月后完成进化

新智元 2024/8/12 14:25:56 责编:清源

AI 生图工具 Flux,俨然已经掀起了全网的风暴。这张情侣写真逼真、细腻,打光、纹理、毛发,都是挑不出破绽的程度。视频、声音、口型,AI 的进化越来越完美了!

最近 Flux 的爆火,简直把所有人的三观都撼动了。

不懂就问:现在网上的东西,还有什么是真的?

Flux 震惊全网

如今,开源文生图模型 Flux,俨然已经在全网掀起了一股风暴。

下面这些合影,竟然全是 AI 生成的?简直把这位博主震惊到怀疑人生。

正面特写大光圈,脸部打光、肌肉纹理、毛发,看不出丝毫破绽。

注意,即使是背景板人物们,也很自然,挑不出太大毛病。

镜头远一点,光线暗一点呢?也很自然。

两个人物在光线明暗处的对比,简直搞出了世界名画的光影质感。

就问细不细腻,真不真实吧?

人再多一点,Flux 也没在怕的。

无论是三个人、四个人、五个人,乃至更多人,画面依然挑不出错。

挑刺的网友们,还在努力寻找着细小的 bug。

最容易一眼看破是 AI 的,无疑就是徽标上的文字了。

感受到了 AI 想蒙混过关的努力

还有一些细节,比如 AI 不懂人类的帽子和项链是干嘛使的,所以画出来还是会有漏洞。

顺便,一年半前 Midjourney V5 惊艳全网的情侣合照长这样:

一大波二创来袭

现在,全网已经掀起了 Flux 生图的风暴,人们一致感叹:Flux 把 AI 生图带到了新的一级台阶。

每当我们觉得 AI 生图不可能变得更好时,它都会再次证明:我们错了。

用这位博主的话来说就是,AI 正在失控,潘多拉魔盒正在被打开!

尤其是 Flux 如此高超的生图能力和开源可玩性,也给各种二创、视频、语音的创作提供了极大的空间。

这些被疯转的 TEDx 演讲者,就不必说了。

这位网友用 Flux、可灵 AI 和 synclabs,做出一段 YouTube 网红博主的视频。

虽然仍有 AI 的痕迹,但图像和视频上的进步已属惊人。

作者表示,自己的目的并不只是创建网红,而是制作自动化广告、YouTube、TikTok 视频、教学视频、营销、讲解课程等等。

甚至当 AI 达到足够快时,它就能达到实时生成,FaceTime AI 朋友或者 AI 治疗师都有望成真。

是的,要说 AI 有什么最恐怖,那就是它的速度了。

渲染一段 AI 短片,时间只需要几秒、几分钟。毫无疑问,AI 正在走向世界,所有人对此都很乐观。

这位网友直言:把 Flux.1、Midjourney 引入 AI 视频后,虽然不完美,但已经是迄今为止自己见过最好的 AI 作品了。

这位博主结合了 Flux 和 LoRA,发现 LoRA 对现实主义图像和绘画 / 艺术图像,也都有很好的处理效果。

Flux.1 和 LoRA,对动漫生成效果也很好,单个 4090 就可跑。

这位网友表示,自己用了不到 1 个小时,就做出了两个香水广告。他直言:我们已经接近 AI 视频的奇点。

AI 超进化,只用 18 个月

沃顿商学院 AI 方向的副教授看到了最近的 AI 生成视频后,做出预言 ——AI 将在 18 个月之后完成进化。

之所以有这种观点,是因为 AI 模型的进化速度实在超乎想象。

比如下面这几张「水獭在飞机上使用 wifi」的图片,在一两周的时间内就有肉眼可见的进步。

再看看一年多之后,现在的 AI 进化成什么样子了 ——

不仅水獭的形象更加逼真可爱,操作手机时的手部动作也没有破绽。

再来对比一下同款产品的进化速度:MidJourney v3 和 v4 之间就有非常明显的进步。

一秒换脸马斯克,口型同步不露馅

不仅如此,最近 GitHub 一项爆火研究称,只需一张照片,就能换脸直播。

下面的视频中,只见马斯克「本尊」戴上眼镜,开启了实时无延迟直播。

是连马斯克的妈都要骗过的程度。

还有 LeCun 大佬,也被网友拿来换脸直播。

目前,项目已经在 GitHub 上收获了 14k 星,刷榜 Trending。

项目地址:https://github.com/hacksider/Deep-Live-Cam

与此同时,各种对口型技术,比如 ReSyncer,也让 AI 视频人物的嘴型无比自然。

至此,AI 把一整个工作流都跑通了!从此在网上看到再逼真的影像,我们心里恐怕都要打个问号了。

提高饱和度,AI 生图露怯

所以,究竟有没有什么方法,能用火眼金睛识别出 AI 的痕迹?

蹭着最近这波 AI 生图热度,前谷歌搜索创始人之一 Deedy 提出 ——

识别 AI 图片最好的方法,就是提高图像饱和度,并仔细查看麦克风接口、牙齿的部位。

就比如,最近爆火的 TED 演讲者的图片,将饱和度设为 200%,可以看到让人惊悚的牙齿。

值得一提的是,识别工具的代码均是由 Claude 编写的,而且还是公开可用。

传送门:https://claude.site/artifacts/6890e3d7-e65e-41ff-a7d4-3ccb38040b46

不过,再拿另一张 AI 生成的 TED 演讲者图片进行测试,却毫无破绽。

这张图片中,牙齿并不奇怪,而且在正题颜色区域色彩更加一致。

Deedy 称,如果对真实图像进行 JPG 压缩,可能会破坏这种一致性。

网友:只能拔网线了

当我们身处一个被 AI 包围的「楚门的世界」,人类最后的退路在哪里?

也许,是时候拔掉网线了。

参考资料:

  • https://x.com/AngryTomtweets/status/1822203767728591350

  • https://x.com/deedydas/status/1822665923775611374

  • https://github.com/hacksider/Deep-Live-Cam?continueFlag=4be7aad2ca0a560d6f9019228a8b2d3e

  • https://x.com/emollick/status/1822774265390985401

  • https://www.reddit.com/r/singularity/comments/1eo4sne/single_image_to_live_stream_deep_fake_deeplivecam/

本文来自微信公众号:微信公众号(ID:null),作者:新智元,原标题:《情侣合照逼真到恐怖,竟被代码识出破绽?沃顿教授预言 AI 18 个月封神!》

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

相关文章

关键词:人工智能

软媒旗下网站: IT之家 最会买 - 返利返现优惠券 iPhone之家 Win7之家 Win10之家 Win11之家

软媒旗下软件: 软媒手机APP应用 魔方 最会买 要知