IT之家 12 月 3 日消息,腾讯今日宣布,混元大模型上线并开源文生视频能力,参数量 130 亿,支持中英文双语输入。
官方宣称,腾讯混元视频生成大模型可以生成“超写实的”高质量视频,生成的画面不容易变形;在镜面或镜子场景中,可以做到镜面反射动作和外面完全同步,光影反射基本符合物理规律。
据介绍,腾讯混元视频生成大模型采用 DiT 架构,适配了新一代文本编码器提升语义遵循,更好地应对多个主体描绘,实现更加细致的指令和画面呈现。
在“腾讯元宝 App”,进入“AI 应用”,选择“AI 视频”,可申请试用。
腾讯表示,本次开源包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。
IT之家附相关链接如下:
Huggingface:https://huggingface.co/tencent/HunyuanVideo
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。