设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

阿里通义千问开源 Qwen2-Audio 7B 语音交互大模型:自由互动,无需输入文本

2024/8/13 12:07:20 来源:IT之家 作者:沛霖(实习) 责编:沛霖
感谢IT之家网友 我抢了台風見暉一 的线索投递!

IT之家 8 月 13 日消息,阿里通义千问开源 Qwen2-Audio 系列的两个模型 Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。

作为一个大规模音频语言模型,Qwen2-Audio 能够接受各种音频信号输入,并根据语音指令执行音频分析或直接响应文本,有两种不同的音频交互模式:

  • 语音聊天:用户可以自由地与 Qwen2-Audio 进行语音互动,而无需文本输入

  • 音频分析:用户可以在互动过程中提供音频和文本指令对音频进行分析

官方在一系列基准数据集上进行了测试,Qwen2-Audio 超越了先前的最佳模型。

▲ Qwen2-Audio 整体表现

IT之家附相关链接如下:

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

相关文章

软媒旗下网站: IT之家 最会买 - 返利返现优惠券 iPhone之家 Win7之家 Win10之家 Win11之家

软媒旗下软件: 软媒手机APP应用 魔方 最会买 要知