设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

阿里千问与 DeepSeek 同日上架魔搭,社区模型总数已超 4 万个

2025/3/26 11:12:34 来源:之家网站 作者:- 责编:-

3 月 26 日,中国 AI 又给全球开源社区带来了新惊喜 —— 阿里通义千问与 DeepSeek,均于昨日低调开源了两款新模型:阿里发布了更适合本地部署的高性能「多模态模型」Qwen2.5-VL-32B,DeepSeek 则将此前热门的「基座模型」V3 更新到 0324 版本,并官宣在魔搭社区上架开源。截至目前,魔搭社区模型总数已超 4 万个,已成为中国最大的 AI 开源社区。

千问 Qwen-VL 是全球 AI 开源社区最受欢迎的多模态模型之一,此前,通义千问 Qwen2.5-VL 已开源 3B、7B 及 72B 等 3 个尺寸,昨日又推出更适合本地部署的 32B 版本。Qwen2.5-VL-32B 模型在 MMMU、MathVista、 MM-MT-Bench 等基准测试中的性能表现突出,超越了更大规模的 Qwen2-VL-72B 和 GPT-4o-0513,并且优于近期火热的 Mistral-Small-3.1-24B 、Gemma-3-27B-IT 等模型。在开发者关注的知名 Hacker News 网站上,Qwen2.5-VL-32B 的热度爆表,是当天评论最多的新闻。

image.png

image.png

DeepSeek-V3 是全球最受关注的基座大模型之一,也于昨夜官宣完成小版本升级。据 DeepSeek 透露,新版 V3-0324 模型借鉴 R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩,并在前端开发、中文写作、中文搜索等能力上均有提升。V3-0324 模型在 HuggingFace 开源后不久,即斩获趋势榜榜首。同时,在昨日官方推文中,DeepSeek 首次官宣在魔搭社区开源,更好服务于中国开发者和企业。

image.png

据了解,阿里云联合 CCF 开源发展委员会共同牵头组建的魔搭社区(Model Scope),已发展成为中国最大的 AI 开源社区。秉承“模型即服务”(MaaS,Model as a Service)理念,魔搭为 AI 开发者提供模型体验、下载、调优、训练、推理、部署等一站式服务,“找大模型上魔搭”成为开发者心照不宣的默契。截至目前,阿里通义千问、DeepSeek、阶跃星辰、MiniMax、月之暗面、百川智能、零一万物、智谱 AI 等知名大模型公司均官方在魔搭开源最新模型,魔搭社区模型总量超过 4 万个,涵盖 LLM、对话、语音、文生图、图生视频、AI 作曲等多个领域,魔搭已经服务超过 1000 万开发者。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

相关文章

关键词:业界动态

软媒旗下网站: IT之家 最会买 - 返利返现优惠券 iPhone之家 Win7之家 Win10之家 Win11之家

软媒旗下软件: 软媒手机APP应用 魔方 最会买 要知