3 月 17 日,国际权威大模型评测榜单 LiveBench 放榜,阿里巴巴最新开源的推理模型通义千问 QwQ-32B 冲入全球前五,超过 OpenAI-GPT-4.5 preview、Google-Gemini2.0、DeepSeek-R1 等国内外顶尖模型,成为全球性能最强的开源模型。
LiveBench 是由图灵奖得主、Meta 首席 AI 科学家杨立昆(Yann LeCun)领衔发起的大模型评测榜,对大模型的推理、编程、数学、数据分析、语言理解和指令遵循等能力进行综合全面评估。该榜单采用不断更新的实时题库及数据,杜绝了模型提前针对性训练及微调的可能性,是业界公认的最权威、最公正的大模型榜单之一。在最新一期 LiveBench 榜单中,全球排名前十的模型仅两款开源,且均来自中国。
千问 QwQ-32B 开源当天即登顶全球最大的 AI 社区 HuggingFace 模型榜榜首,是当下全球最受欢迎的开源大模型。在刷新开源推理模型性能纪录的同时,千问 QwQ-32B 还大幅降低部署使用成本,让全球先进的中国推理大模型首次在学术界、产业界广泛落地。目前,国家超算互联网平台、广州人工智能公共算力中心以及东南大学、天津大学、山东大学等国内多所 985、211 高校均接入千问 QwQ-32B 模型,壁仞科技、摩尔线程、硅基流动、CAMEL-AI、OpenRouter、SambaNova Cloud 等海内外企业和平台均推出部署 QwQ-32B 的算力产品或 API 服务。
从 2023 年至今,阿里通义团队已开源 200 多款模型,囊括文本生成模型、视觉理解 / 生成模型、语音理解 / 生成模型、文生图及视频模型等「全模态」,覆盖从 0.5B 到 110B 等参数「全尺寸」。截至目前,海内外 AI 开源社区中千问 Qwen 的衍生模型数量突破 10 万个,超越美国 Meta 公司的 Llama 系列模型,已成为全球第一开源模型。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。