设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

AMD 推出完全开源的 3B 参数语言模型 Instella,媲美 Llama-3.2-3B 和 Qwen2.5-3B

2025/3/6 14:34:45 来源:IT之家 作者:汪淼 责编:汪淼

IT之家 3 月 6 日消息,AMD 今日宣布,为 Radeon RX 9070 系列开源 Linux 驱动程序,还宣布开源 Instella —— 一个完全开源的 3B 参数语言模型

AMD Instella 代表“完全开源的尖端 30 亿参数语言模型(LMs)”。这些模型在 AMD Instinct MI300X GPU 上进行了训练,根据 AMD 发布的数据,其性能与 Llama 3.2 3B、Gemma-2 2B 和 Qwen 2.5 3B 等相媲美

AMD Instella 模型是在 Instinct MI300X 硬件上从头开始训练的,并且宣称是完全开源的:

完全开源和可访问:模型权重、训练超参数、数据集和代码的完全开源发布,促进人工智能社区内的创新与合作。

IT之家附开源地址如下:

https://github.com/AMD-AIG-AIMA/Instella

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

软媒旗下网站: IT之家 最会买 - 返利返现优惠券 iPhone之家 Win7之家 Win10之家 Win11之家

软媒旗下软件: 软媒手机APP应用 魔方 最会买 要知