设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

Meta 遭遇版权诉讼,扎克伯格被指亲自批准 AI 团队用盗版书训练模型

2025/1/11 17:08:37 来源:IT之家 作者:清源 责编:清源

IT之家 1 月 11 日消息,根据 TechCrunch 9 日的报道,在一起针对 Meta 的版权诉讼中,原告的律师表示,Meta CEO 马克・扎克伯格批准了公司 Llama AI 模型开发团队使用盗版电子书和文章的数据集来进行训练。

当地时间周三晚些时候提交给美国加州北区法院的最新文件中,Kadrey 诉 Meta 案的原告(包括畅销书作家莎拉・西尔弗曼和塔-内希西・科茨)叙述了 Meta 去年晚些时候的证词,证词中透露扎克伯格批准了 Meta 使用名为 LibGen 的数据集进行 Llama 相关的训练

IT之家注:LibGen 自称为“链接聚合器”,提供包括 Cengage Learning、Macmillan Learning、McGraw Hill 和 Pearson Education 等出版商的盗版作品。LibGen 曾多次被起诉、关闭,并因版权侵权被罚款数千万美元。

根据 Meta 的证词,原告律师称,扎克伯格在 Meta 的 AI 高管团队和其他员工提出担忧的情况下,仍批准使用 LibGen 数据集来训练至少一个 Llama 模型。文件中引用 Meta 员工的话称内部“知道这是盗版”,并且指出使用该数据集“可能会削弱 Meta 与监管部门的谈判地位”。

该文件还引用了一份备忘录,指出在“上报至 MZ”后,Meta AI 团队“获准使用 LibGen”。而此处的“MZ”,显然是“马克・扎克伯格”的简写。

周三的文件还揭示了新的指控,称 Meta 可能试图通过去除 LibGen 数据中的版权标记来掩盖侵权行为。

原告律师表示,Meta 工程师尼古拉・巴什利科夫为 Llama 团队编写了一个脚本,用于删除电子书中的版权信息,并且 Meta 还涉嫌从“用于训练 Llama 的科学期刊文章和其他数据”中去除了版权标记。“这一发现表明,Meta 不仅仅为了训练而删除版权信息,可能还试图掩盖其侵权行为,因为删除版权信息可以防止 Llama 输出可能揭露‘侵权’的版权信息。”

Meta 还在证词中透露,它通过 torrent 下载了 LibGen,部分 Meta 工程师对此表示担忧。torrent 下载是一种通过网络共享文件的方式,它要求下载者同时“做种”,即上传他们试图获取的文件。

原告律师称,Meta 通过 torrent 下载 LibGen 实质上又进行了另一种形式的版权侵权,帮助传播盗版内容。不仅如此,Meta 还通过减少上传的文件数量来隐瞒其侵权行为。

文件中提到,Meta 生成式 AI 部门负责人艾哈迈德・阿尔-达赫勒批准了通过 torrent 下载 LibGen,忽视了巴什利科夫对其可能“法律上不合规”的担忧。

原告律师表示:“如果 Meta 直接购买或借阅原告的作品并未经授权训练 Llama 模型,它将构成版权侵权。Meta 选择绕过合法途径,加入非法 torrent 网络,证明其侵权行为。”

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

相关文章

关键词:meta人工智能版权

软媒旗下网站: IT之家 最会买 - 返利返现优惠券 iPhone之家 Win7之家 Win10之家 Win11之家

软媒旗下软件: 软媒手机APP应用 魔方 最会买 要知