设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

腾讯混元大模型上线并开源文生视频能力:支持中英文双语输入,参数量 130 亿

2024/12/3 15:43:27 来源:IT之家 作者:沛霖(实习) 责编:沛霖

IT之家 12 月 3 日消息,腾讯今日宣布,混元大模型上线并开源文生视频能力,参数量 130 亿,支持中英文双语输入。

▲ 提示词:肩摄视角平移切入,清晨阳光透过纱帘洒落。画面中央是一位老爷爷,正在木工台前专注雕刻。摄影机徐徐推近,特写他布满皱纹的手指和木屑纷飞。背景虚化的老房间里,木工工具整齐排列,墙上挂满完成的作品。

官方宣称,腾讯混元视频生成大模型可以生成“超写实的”高质量视频,生成的画面不容易变形;在镜面或镜子场景中,可以做到镜面反射动作和外面完全同步,光影反射基本符合物理规律

▲ 提示词:超大水管浪尖,冲浪者在浪尖起跳,完成空中转体。摄影机从海浪内部穿越而出,捕捉阳光透过海水的瞬间。水花在空中形成完美弧线,冲浪板划过水面留下轨迹。最后定格在冲浪者穿越水帘的完美瞬间。

▲ 提示词:手持长焦跟拍,磨砂金属车厢在高速中留下光带。隧道灯光断续闪过,映照出乘客若隐若现的侧脸。防护玻璃上的水珠随速度扭曲变形,构建出城市地下的光影迷宫。

据介绍,腾讯混元视频生成大模型采用 DiT 架构适配了新一代文本编码器提升语义遵循,更好地应对多个主体描绘,实现更加细致的指令和画面呈现。

▲ 提示词:超广角俯拍,热气球节。数百只彩色热气球缓缓升空,篝火在地面点亮黎明。云层被晨光染成粉色,构成壮观的空中景观。

在“腾讯元宝 App”,进入“AI 应用”,选择“AI 视频”,可申请试用。

腾讯表示,本次开源包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件

IT之家附相关链接如下:

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

相关文章

软媒旗下网站: IT之家 最会买 - 返利返现优惠券 iPhone之家 Win7之家 Win10之家 Win11之家

软媒旗下软件: 软媒手机APP应用 魔方 最会买 要知