放大招！百度复旦视觉生成模型 Hallo2 或将落地数字人等场景

2024/10/25 13:21:38 来源：之家网站作者：- 责编：-

评论：

近日，百度联合复旦大学等发布 Hallo2，一个可以生成长达数小时且分辨率为 4K 的人物动画的视觉模型。Hallo2 目前已经在 GitHub 平台开源，供全球开发者免费使用和研究，预计将促进视频生成技术的广泛应用和发展。

Hallo2 发布后在海外引发了不小的震动。有人惊叹视频生成的长度和分辨率，也有老用户从 Hallo 第一代模型就被圈粉。

还有对 Hallo2 开源模型和代码的认可。

放大招！百度复旦视觉生成模型 Hallo2 或将落地数字人等场景

Hallo2 备受关注，很重要一个原因是百度和复旦的研究团队解决了人像视频生成一个很大的痛点：如何提升视频生成的时长和质量。

一直以来，生成高质量的人物动画需要耗费大量的时间和人力成本。而百度与复旦联合发布的 Hallo2 的出现，有望彻底改变这一现状，为数字人、电影制作、虚拟助手、游戏开发等领域带来革命性的变化。这不同于 Sora 等 AI 视频生成模型遭遇到的发展瓶颈，Hallo2 模型解决的问题更垂直，可落地空间更大。

Hallo2 是目前首个实现长达一小时、4K 分辨率的音频驱动人像动画生成模型。通过创新的图像块丢弃、噪声增强和时间对齐等技术，Hallo2 解决了长时视频生成中的外观漂移和视觉不一致问题，支持灵活的语音与文本控制，生成质量达到业内领先水平。

放大招！百度复旦视觉生成模型 Hallo2 或将落地数字人等场景

Hallo2 继承了前代 Hallo 模型的创新框架，继续采用基于扩散的生成模型和分层音频驱动视觉合成模块，提高了音频与视觉输出之间的同步精度，并经过改进使得各部分的协同作用更加高效，增强了生成动画的质量和真实感。此外，Hallo2 不仅在图像和视频的质量方面有了显著提升，而且大幅增加了动作的丰富性和多样性，可以说为 AI 驱动的肖像图像动画领域树立了新的标杆。

放大招！百度复旦视觉生成模型 Hallo2 或将落地数字人等场景

有行业专家表示，Hallo2 的出现，标志着音频驱动的肖像图像动画技术迈入了新的发展阶段。百度基于长期的视觉技术积累，正在瞄准行业痛点进行针对性研究和场景落地，不仅为开发者提供了强大的工具，也为未来各种应用场景下的动画形象创作带来了新的可能性。

目前 Hallo2 模型已在 GitHub 上开源，项目地址：https://fudan-generative-vision.github.io/hallo2/#/。

另据悉，除视觉模型外，作为中国最大的 AI 公司，百度将在 11 月 12 日召开百度世界大会 2024，展现更多 AI 方面的应用和技术进展。大会将围绕大模型和 AI 应用带来五大亮点，除百度创始人李彦宏领衔的主题演讲外，还有 100+AI 原生应用发布、四场主题分论坛、30 + 公开课和 5000 平米 AI 展区，全方位展示 AI 应用的落地成果。大会目前已开放免费报名通道，可通过大会官网报名参会。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

下载IT之家APP，签到赚金币兑豪礼

放大招！百度复旦视觉生成模型 Hallo2 或将落地数字人等场景

相关文章