IT之家 11 月 15 日消息,创新工场董事长兼 CEO 李开复于今年创办了 AI 大模型创业公司“零一万物”,该公司已推出 Yi-34B 和 Yi-6B 两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。
不过在 Yi-34B 的 Hugging Face 开源主页上,开发者 ehartford 质疑称该模型使用了 Meta LLaMA 的架构,只对两个张量(Tensor)名称进行了修改,分别为 input_layernorm 和 post_attention_layernorm。
“零一万物” 公司昨日正式公开回应了此事,该公司开源团队总监 Richard Lin 承认了修改 Llama 张量名称的做法不妥,将会按照外界建议把“修改后的张量名称从 Yi 改回 LLaMA”。
Richard Lin 声称,这一命名问题是开发人员疏忽导致,开发人员在代码中进行了几次重命名,以满足实验要求。但是开发人员“忘记将张量名称修改回 LLaMA”,开发人员对此感到抱歉。
Richard Lin 同时邀请开发者 ehartford 提交包含上述改动的 PR,以对 Yi 的张量名称进行重命名以符合 Llama 架构。
不过截至IT之家发稿,另一名开发者 JosephusCheung 声称,既然官方已经宣布修改 Yi 大模型的张量名称,那么开源大模型 Yi 便是 LLaMA 的衍生作品,而这显然构成了许可证冲突,因为代码的推理部分和模型定义都是“LLaMA”的一部分。
JosephusCheung 声称,“零一万物”必须修订有关商业用途的条款,此外如果模型每月活跃用户超过 7 亿,必须向 Meta 申请许可规定,此外,“Yi 系列模型及其相关知识产权所有权仅由许可方持有”的条款将不再有效,因为该模型的知识产权将由 Meta、Yi 等公司共同拥有。Richard Lin 暂未对此进行回复。
相关阅读:
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。