设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

字节发布豆包视觉理解、3D 生成等新模型,豆包音乐模型可生成 3 分钟作品

2024/12/18 11:33:56 来源:IT之家 作者:清源 责编:清源
感谢IT之家网友 風見暉一 的线索投递!

IT之家 12 月 18 日消息,IT之家从字节跳动官方获悉,在今日的火山引擎 Force 大会上,字节跳动正式发布豆包视觉理解模型,为企业提供多模态大模型能力。豆包视觉理解模型千 tokens 输入价格仅为 3 厘,一元钱就可处理 284 张 720P 的图片,官方宣称比行业价格便宜 85%。

豆包 3D 生成模型也在本次活动中正式亮相。将其与火山引擎数字孪生平台 veOmniverse 结合使用,可完成智能训练、数据合成和数字资产制作,官方称之为“一套支持 AIGC 创作的物理世界仿真模拟器”。

豆包大模型旗下多款产品也迎来了更新:

  • 豆包通用模型 pro:全面对齐 GPT-4o,使用价格仅为后者的 1/8;

  • 音乐模型:可生成 3 分钟的完整作品

  • 文生图模型 2.1 版本:精准生成汉字、一句话 P 图,已接入即梦 AI 和豆包 App。

此外,豆包将于明年春季推出具备更长视频生成能力的豆包视频生成模型 1.5 版,豆包端到端实时语音模型也将很快上线,从而解锁多角色演绎、方言转换等新能力。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

相关文章

关键词:字节跳动即梦豆包

软媒旗下网站: IT之家 最会买 - 返利返现优惠券 iPhone之家 Win7之家 Win10之家 Win11之家

软媒旗下软件: 软媒手机APP应用 魔方 最会买 要知