近日,火山引擎正式发布“豆包.语音模型创业者加速计划”,面向初创企业提供语音合成、声音复刻和语音识别等大模型资源支持,入选企业可获得 3 个月免费试用、价值 4.7 万元的语音大模型服务。该计划希望通过开放豆包语音大模型能力,加速 AI 语音相关新产品研发,助力人工智能初创生态更加繁荣。目前火山引擎官网已开启企业认证申请入口。
3 大语音模型能力,数千小时及千万字支持
该计划针对人数少于 30 人,以及将 AI 语音能力融入新产品研发并长期迭代的初创企业。具体而言,火山引擎通过 API 调用等方式开放豆包.声音复刻模型、豆包.语音合成模型、豆包.语音识别模型等热门能力,共计数千小时及千万字支持。企业可登录火山引擎官网申请,通过企业认证之后填写申请表,工作人员将在 10 个工作日进行审核,并对审核通过的企业发放支持资源代金券。获得代金券后 3 个月内,初创企业可通过火山引擎官网控制台及接口文档接入豆包语音大模型能力,兑换免费额度,用于 AI 语音相关应用或产品的研发。
AI 语音场景加速,助力良性生态发展
调研显示,在发展“人工智能 +”的大背景下,出于技术门槛和资金投入等因素,中小初创企业亟需更加广泛深入的基础设施和平台支撑。
豆包语音大模型致力于多个语音场景的深耕,聚焦陪伴式 AI 交互、沉浸式听书、跨语种内容生产、企业客户服务等场景,为企业级客户提供丰富的语音能力:
豆包.语音合成模型:根据上下文智能预测文本的情绪、语调等信息,并生成超自然、高保真、个性化的语音,以满足不同用户的个性化需求。
豆包.声音复刻模型:全新自研语音大模型算法打造的高效化的轻量级音色定制方案。仅需只需 5 秒数据, 即可完成对用户音色、说话风格、口音和声学环境音的复刻,并进行跨语种迁移。
豆包.语音识别模型:拥有更加灵敏的耳朵 + 更加聪明的大脑,通过上下文感知功能进行推理,识别效果更加精准,同时支持上海话、闽南语等多种方言识别。
目前,火山引擎豆包语音大模型能力已在豆包 APP、剪映、抖音、番茄小说等多款内部产品展开应用,并逐渐向企业开放以拓展更多 AI 语音应用场景。大模型技术不断演进成熟,推动人工智能向产业渗透,而初创企业正是应用创新的重要前线。火山引擎将持续推动字节跳动 AI 能力外溢,以成熟的大模型和平台工具,以及广泛的生态支持,助力广大初创企业成长,实现人工智能时代的共同繁荣。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。