Grok 连夜上线图片编辑功能,继 Gemini 引爆图片编辑热潮后,动动嘴就能实现「证件照换西装」、「黑发变金发」等专业级 P 图效果。随着 AI 巨头内卷加剧,很多工作可能会经历「从复杂操作到简单交互」的范式转移,大模型内卷,受伤可能是传统软件。
Grok 连夜上线图片编辑功能。
昨晚,Grok 上线图片编辑功能,可以通过文字描述直接修改图片。
比如你可以上传一张个人证件照,「动动嘴」让 Grok 给你 PS 一套全新的西服。
看起来效果非常不错,Grok 还「体贴地」给你设计了四种不同风格,比如领带「带花纹」和「不带花纹」。
不过该功能目前应该还是在灰度测试中(作为 Premium 氪金用户的 Grok 主页暂时还没有编辑按钮)。
Grok 手机 App 同步上线
Grok 也同步上线了 X 的手机 APP,你也可以在手机上体验图片编辑功能。
比如上传一张照片,让图片中人物的「黑发」变成「金发」。
不过作为手机内部的 Grok 功能,目前同样是在灰度测试中。
由于 Grok 灰色测试,目前全网还没有太多讨论。
不过从一些博主的测试作品来看,Grok 应该是对自己的效果很有信心。
比如这位有 6 万粉丝的 Borriss 博主,他的头像是一件「黑色高领毛衣」。
但是经过 Grok 的 P 图后,换成了一套「西服」。
「黑毛衣秒变西服」,AI 编辑的能力目前看起来效果并不赖。
其他陆续有用户放出了自己使用 Grok 编辑图片的效果,不过这次 Grok 犯了一个错误,把用户的脸也给换了。
比如,可以将图片风格变成 Egon Shiele 的画作风格。
或者是给马斯克加一顶帽子。
大模型「内卷」,PS 受伤
Grok 这次「连夜」上传图片编辑功能,大概率是被 Google 的 Gemini2.0 火出圈的「动动嘴」PS 功能给刺激到了。
Google 发布 Gemini-2.0-flash 的 Experimantal 版本靠着简单的文本描述就能「P 图」的能力着实火了一把。
比如将两张照片 P 在一起还不违和,并且可以添加人物动作。或者,将白色风格的裙子换成红色,还能给人物打个领带。
从 Gemin2.0 到 Grok 的图片编辑,能看出目前 SOTA 模型的「内卷」依然还在进行。
大模型也在「抢占」用户心智。
以后人们谈起 P 图,第一个想到也许不是 Photoshop 这种传统的图片编辑软件,而是 AI 赋能各种大模型功能。
从 P 图这件事情可以窥见一些苗头,AI 的发展很可能会带来一个很大的「范式转移」。
未来的很多工作会从「复杂操作」变成「简单交互」。
比如在图片编辑领域,Gemini 和 Grok 等大模型将持续降低图片编辑的技术门槛。
从原来需要专业软件、复杂步骤,到只需一句自然语言指令即可实现高质量图片编辑。
当然在目前的大模型 P 图效果依然停留在「可玩」的层面,专业的图片编辑还需要专业的 UI 工程师使用特定的软件才能完成。
不过 SOTA 模型的内卷依然没有结束。
正如 Alvaro Cintas 所说,为什么 OpenAI 还没有发布原生图像生成和编辑功能。
也许快了,说不定哪天 ChatGPT 就放出编辑原生图片。
参考资料:
https://x.com/dr_cintas/status/1903112910735339984
本文来自微信公众号:新智元(ID:AI_era)
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。