设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

英伟达推出 NIM AI 护栏服务,防止模型遭用户“越狱”

2025/1/18 22:39:35 来源:IT之家 作者:漾仔 责编:漾仔

IT之家 1 月 18 日消息,英伟达宣布推出一项名为“NIM”的 AI 护栏服务,该服务现已以英伟达 NeMo 护栏(NeMo Guardrails)套件的形式提供,可以让开发人员为大语言模型(LLM)添加一系列护栏规则,旨在解决用户通过提示词“越狱”大模型,防止 AI 生成不符合预期的内容。

英伟达表示,相应 AI 护栏服务套件基于英伟达的 Aegis 内容安全数据集进行训练而成,该数据集包含了 3.5 万个标注的数据样本,并已在 Hugging Face 上公开,IT之家附地址如下(点此访问)。

英伟达指出,相应 AI 护栏套件具有体积小、效率高的特点,在大部分场合中都能流畅运行,企业可以在开发 AI 模型时直接嵌入相应安全套件,可以改善医疗、汽车、制造业等领域部署的 AI 安全性。

此外,英伟达还提供了公布了一项名为 Garak 的漏洞扫描工具,用于检测模型的安全性,防止模型可能输出幻觉内容或泄露企业内部机密信息。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

相关文章

关键词:英伟达AI 护栏

软媒旗下网站: IT之家 最会买 - 返利返现优惠券 iPhone之家 Win7之家 Win10之家 Win11之家

软媒旗下软件: 软媒手机APP应用 魔方 最会买 要知