3 月 26 日,中国 AI 又给全球开源社区带来了新惊喜 —— 阿里通义千问与 DeepSeek,均于昨日低调开源了两款新模型:阿里发布了更适合本地部署的高性能「多模态模型」Qwen2.5-VL-32B,DeepSeek 则将此前热门的「基座模型」V3 更新到 0324 版本,并官宣在魔搭社区上架开源。截至目前,魔搭社区模型总数已超 4 万个,已成为中国最大的 AI 开源社区。
千问 Qwen-VL 是全球 AI 开源社区最受欢迎的多模态模型之一,此前,通义千问 Qwen2.5-VL 已开源 3B、7B 及 72B 等 3 个尺寸,昨日又推出更适合本地部署的 32B 版本。Qwen2.5-VL-32B 模型在 MMMU、MathVista、 MM-MT-Bench 等基准测试中的性能表现突出,超越了更大规模的 Qwen2-VL-72B 和 GPT-4o-0513,并且优于近期火热的 Mistral-Small-3.1-24B 、Gemma-3-27B-IT 等模型。在开发者关注的知名 Hacker News 网站上,Qwen2.5-VL-32B 的热度爆表,是当天评论最多的新闻。
DeepSeek-V3 是全球最受关注的基座大模型之一,也于昨夜官宣完成小版本升级。据 DeepSeek 透露,新版 V3-0324 模型借鉴 R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩,并在前端开发、中文写作、中文搜索等能力上均有提升。V3-0324 模型在 HuggingFace 开源后不久,即斩获趋势榜榜首。同时,在昨日官方推文中,DeepSeek 首次官宣在魔搭社区开源,更好服务于中国开发者和企业。
据了解,阿里云联合 CCF 开源发展委员会共同牵头组建的魔搭社区(Model Scope),已发展成为中国最大的 AI 开源社区。秉承“模型即服务”(MaaS,Model as a Service)理念,魔搭为 AI 开发者提供模型体验、下载、调优、训练、推理、部署等一站式服务,“找大模型上魔搭”成为开发者心照不宣的默契。截至目前,阿里通义千问、DeepSeek、阶跃星辰、MiniMax、月之暗面、百川智能、零一万物、智谱 AI 等知名大模型公司均官方在魔搭开源最新模型,魔搭社区模型总量超过 4 万个,涵盖 LLM、对话、语音、文生图、图生视频、AI 作曲等多个领域,魔搭已经服务超过 1000 万开发者。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。