IT之家 11 月 25 日消息,Stability AI 本周二发布了 Stable Video Diffusion 模型,基于之前发布的 Stable Diffusion 文本转图片模型,可实现图片生成视频能力。
Stability AI 近日更新 Stable Video Diffusion 模型,为其添加了 ComfyUI 工具支持。
IT之家注:ComfyUI 是 Stable Diffusion 的图形用户界面,使用图形 / 节点界面,帮助用户构建复杂的工作流程。
Stability AI 表示本次更新之后,用户可以使用 7 年前 8GB 显存的英伟达 GTX 1080 显卡(2016 年 5 月发布),生成分辨率为 1024*576、长度为 25 帧的视频。
而 AMD 方面支持的最低门槛是 6800 XT,可以在 Linux 系统中运行 ROCm,图片生成视频大约需要 3 分钟时间。
Stability AI 在其博文中,分享了在 ComfyUI 中调用 Stable Video Diffusion 的示例流程,一个用于 14 帧模型,一个用于 25 帧模型。
Stable Video Diffusion 目前处于 Stability AI 所谓的“研究预览”阶段。想要使用这款模型的人必须同意一些使用条款,其中规定了 Stable Video Diffusion 的预期应用场景(例如“教育或创意工具”、“设计和其他艺术过程”等)和非预期的场景(例如“对人或事件的事实或真实的表达”)。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。