近日,全球最大 AI 开源社区 Huggingface 发布了最新的开源大模型榜单(Open LLM Leaderboard),榜单显示,其排名前十的开源大模型全部是基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。该榜单是目前全球最具权威性的开源大模型榜单,其测试维度涵盖阅读理解、逻辑推理、数学计算、事实问答等。
通义千问 Qwen 大模型已经成为全球最大的开源模型族群。在海内外开源社区中,Qwen 的衍生模型数量已突破 9 万,超越美国 Meta 公司旗下的 Llama 系列开源模型,位居全球第一。在 Hugging face2024 年的开源模型下载中,Qwen 模型系列中的 Qwen2.5-1.5B-Instruct 的下载量占总下载量的 26.6%,是全球下载量最高的开源模型。在这一轮推理模型技术浪潮中,Qwen 系列模型广受欢迎。此前爆火的 DeepSeek 公司基于 R1 推理模型蒸馏了 6 个模型开源给社区,其中有 4 个模型来自 Qwen。近期,著名 AI 科学家李飞飞团队用较少的资源和数据训练出的 s1 推理模型同样以 Qwen 模型为基础模型。国内外开发者认为,以上模型取得的良好成绩跟基础模型的强大性能有很大关系。
从 2023 年 8 月起,阿里云通义千问相继开源 Qwen、Qwen1.5、Qwen2、Qwen2.5 等 4 代模型,囊括大语言模型、多模态模型、数学模型和代码模型等数十款,多次登上国内外权威大模型榜单,已成为开源社区最重要的模型系列。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。