IT之家 3 月 14 日消息,加拿大 AI 初创公司 Cohere 昨日发布了一款名为“Command A”的 AI 模型,该模型主打轻量化应用,号称只需要两块英伟达 A100 或 H100 GPU 即可轻松部署,号称“表现能和 GPT-4o 相媲美”,实现“用最少的硬件发挥最大的性能”。
Cohere 表示,Command A 专门为中小型企业环境设计,其支持 256k 的上下文长度和 23 种语言,作为比较,其他竞争对手的“同类模型”需要 32 块 GPU 才能部署。
在性能测试中,Command A 最快每秒可以输出 156 个 Token,据称比 GPT-4o 快 1.75 倍。而在指令追踪、SQL、代理程序和工具任务的基准测试上,Command A 也表现出色。
Cohere 援引相应性能数据,声称业界的大语言模型如果“规模过大”,反而在输出结果时可能会出现严重的延迟问题;如果只是想快速得到正确答案,Command A 相对是个不错的选择。
目前,Cohere 已将相应 Command A 发布在 Hugging Face 平台(点此访问),对学术界开放使用,未来还会登陆其他云服务平台。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。