IT之家 4 月 1 日消息,人工智能(AI)初创公司 Runway 于本周一发布了其最新研发的 AI 视频生成模型 Gen-4。该公司声称,这是目前为止保真度最高的 AI 驱动视频生成工具之一。
新发布的 Gen-4 模型现已开始向 Runway 的个人及企业客户推送。据 Runway 介绍,该模型的核心优势在于能够在不同的视频场景中保持角色、地点和物体的高度一致性,维持“连贯的世界环境”,并且能够从场景内的不同视角和位置重新生成元素。
Runway 在其官方博客文章中指出:“Gen-4 能够有效利用视觉参考资料,并结合用户的文本指令,创造出风格、主体、地点等要素保持一致的新图像和视频,整个过程无需进行模型微调或额外的专门训练。”
Runway 公司获得了包括 Salesforce、谷歌和英伟达在内的知名投资机构的支持,专注于提供包括 Gen-4 在内的一系列 AI 视频创作工具。然而,在 AI 视频生成这一竞争激烈的赛道上,Runway 面临着来自 OpenAI 和谷歌等科技巨头的强劲挑战。为了在市场中脱颖而出,Runway 采取了差异化竞争策略,不仅与一家好莱坞大型电影制片厂达成了合作协议,还特别拨出数百万美元资金,用于资助那些运用 AI 生成视频技术进行创作的电影项目。
具体到 Gen-4 的功能,Runway 表示,用户只需提供角色的参考图像,模型便能在不同的光照条件下生成外观持续一致的角色。在构建具体场景时,用户可以上传主体的图像,并辅以文字描述,明确说明希望生成的镜头构图要求。
Runway 在博客中进一步强调:“Gen-4 在生成具有高度动态感和逼真运动效果的视频方面表现卓越,同时在主体、物体和风格的一致性、对用户指令的精准遵循度以及对现实世界规律的理解方面,均达到了同类顶尖水平。”公司还宣称,“Runway Gen-4 的发布,也标志着视觉生成模型在模拟真实世界物理规律的能力方面取得了一个重要的里程碑。”
如同当前所有的视频生成模型一样,Gen-4 也是通过对海量的视频数据进行训练而成的。通过学习这些数据中的模式,模型得以生成全新的合成视频片段。然而,Runway 方面拒绝透露其训练数据的具体来源,部分原因是出于保护商业竞争优势的考量,但也因为训练数据的细节往往是潜在知识产权诉讼的敏感地带。
一个典型的例子是,Runway 目前正面临一起由艺术家群体提起的诉讼。该诉讼指控 Runway 及其他几家生成式 AI 公司,在未经授权的情况下,使用了受版权保护的艺术作品来训练其 AI 模型。对此,Runway 主张其行为受到“合理使用”(Fair Use)原则的保护,应免于承担法律责任。目前,该案的最终结果尚不明朗。
这场法律纠纷对于 Runway 来说风险颇高。据《The Information》报道,Runway 目前正在进行新一轮融资,此轮融资可能使其公司估值达到 40 亿美元(IT之家注:现汇率约合 290.44 亿元人民币)。随着其视频生成模型 API(应用程序编程接口)等新产品的陆续推出,Runway 期望能在今年实现 3 亿美元的年化收入目标。
无论这场官司走向如何,以 Gen-4 为代表的生成式 AI 视频工具正对现有的电影和电视行业带来颠覆性的挑战。由代表好莱坞动画师和漫画家的动画协会(Animation Guild)在 2024 年委托进行的一项研究显示,在已经采用 AI 技术的电影制作公司中,高达 75% 的公司在引入该技术后,出现了裁减、合并岗位或直接取消职位的现象。该研究同时预测,到 2026 年,生成式 AI 可能会冲击超过 10 万个美国娱乐行业的工作岗位。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。