设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

又创新高,阿里通义开源模型 Qwen2.5 进入大模型盲测全球前十

2024/9/29 15:21:35 来源:之家网站 作者:- 责编:-

9 月 29 日消息,基准测试平台 Chatbot Arena 日前公布最新大模型盲测榜单,10 天前发布的阿里通义千问开源模型 Qwen2.5 再次闯入全球十强,其大语言模型 Qwen2.5-72B-Instruct 排名 LLM 榜单第十,是前十唯一的中国大模型;Qwen 系列视觉语言模型 Qwen2-VL-72B-Instruct 排名 Vision 榜单第九,是得分最高的开源大模型。

同一时间,全球开源社区基于 Qwen 系列二次开发的衍生模型数量突破 7.43 万,超越 Llama 系列衍生模型的 7.28 万。通义千问 Qwen 成长为世界最大的生成式语言模型族群,在 Hugging Face 社区的开源模型权威榜单 Open LLM Leaderboard 上,Qwen 系列及其衍生模型包揽了前十全部座次。

不论是模型性能还是生态影响力,Qwen 都创造了中国开源大模型的历史。

Qwen2.5-72B-Instruct 排名 Chatbot Arena 大语言模型榜单第十

Chatbot Arena 是由开放研究机构 LMSYS Org 推出的大模型性能测试平台,自 2023 年 5 月推出以来一直是世界顶级大模型的最重要竞技场。平台目前集成了全球 70 多个大模型,采用匿名方式将大模型两两组队,交给用户进行盲测,用户根据真实对话体验对模型能力进行投票。

9 月 19 日发布的 Qwen2.5 迅速进榜,旗舰模型 Qwen2.5-72B-Instruct 得分位列 LLM 榜单第十,居于 OpenAI 的 o1、GPT-4o 等模型之后,是得分最高的中国大模型;同天开源的视觉语言模型 Qwen2-VL-72B-Instruct 闯入 Vision 榜单第九,略逊于 GPT-4o、Gemini-1.5-Pro 等闭源模型,是成绩最好的开源模型。此前 Qwen 系列已有多款开源模型闯入 Chatbot Arena 榜单。

截屏2024-09-29 00.48.13.png

Chatbot Arena 官方发文,Qwen2-VL-72B-Instruct 是排名最高的开源视觉语言模型

Qwen2.5 的发布在海内外开源社区引发一场狂欢,这套开源模型涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,几乎所有尺寸的模型都实现了同等规模业界最佳性能,发布 10 天下载量超过 150 万。有国外开发者称赞通义千问称得上是真正的“开放 AI”;有用户测评发现 Qwen2.5 从 0.5B 到 72B 都是 SOTA 水平,于是发起话题:“大家都用 Qwen2.5 替换了那些常用模型?”

截屏2024-09-19 09.30.04.png

截屏2024-09-25 11.13.44.png

海外开源社区盛赞 Qwen2.5

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

相关文章

关键词:业界动态

软媒旗下网站: IT之家 最会买 - 返利返现优惠券 iPhone之家 Win7之家 Win10之家 Win11之家

软媒旗下软件: 软媒手机APP应用 魔方 最会买 要知