设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

Mistral 发布 Pixtral Large 多模态 AI 模型:登顶复杂数学推理,图表 / 文档推理超过 GPT-4o

2024/11/19 14:57:21 来源:IT之家 作者:故渊 责编:故渊

IT之家 11 月 19 日消息,Mistral AI 公司昨日(11 月 18 日)发布公告,宣布了全新的多模态 AI 模型 Pixtral Large。该模型拥有 1240 亿参数,基于 Mistral Large 2,主要用于处理文本和图片。

Pixtral Large 现已在 Mistral 研究许可证和商业许可证下提供,适用于研究、教育以及商业用途。

Pixtral Large 是 Mistral AI 多模态家族中的第二个模型。IT之家援引官方新闻稿,该模型在 MathVista、DocVQA 和 VQAv2 等标准多模态基准测试中表现出色,尤其在 MathVista 中达到了 69.4% 的准确率,超越了所有竞争对手。

在 ChartQA 和 DocVQA 测试中,Pixtral Large 同样表现优异,超越了 GPT-4o 和 Gemini-1.5 Pro。

该模型配备了 123B 的多模态解码器和 1B 的视觉编码器,支持 128K 的上下文窗口,能够处理至少 30 张高分辨率图像。Pixtral Large 不仅在视觉数据上表现出色,同时在复杂推理和图表理解方面也具备强大能力。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

相关文章

关键词:MistralAI多模态

软媒旗下网站: IT之家 最会买 - 返利返现优惠券 iPhone之家 Win7之家 Win10之家 Win11之家

软媒旗下软件: 软媒手机APP应用 魔方 最会买 要知