11 月 19 日消息,阿里云百炼推出全新 RAG 框架,全面提升大模型的准确性和可靠性,可解决 90% 以上幻觉问题,更好地满足企业级大模型应用场景的需求。
RAG 是大模型落地的重要技术,它可以将检索到的知识和大模型结合,以此优化大模型的生成效果。然而传统 RAG 方案容易检索到与问题相似,但与问题描述不符的难负样本,从而导致大模型易出现幻觉,例如面对“iPhone 16 的参数规格”与“iPhone 16Pro 的参数规格”这类极为相似的问题时,大模型容易给出错误答案。
为此,阿里云百炼在传统 RAG 框架之上,在业界首创双层幻觉信息过滤框架。在这一全新框架下,大模型在生成回答前,能先对候选信息进行一次全面的深度分析和判断,自动识别并剔除“难负样本”,确保所有用于生成的信息高度相关且可靠。具体来说,该框架可通过重排序模型进行第一轮过滤,可过滤 70% 的通用难负样本,第二层大模型会进一步过滤剩余 30% 涵盖更复杂业务定制规则的样本。通过双层幻觉信息过滤框架,可解决 90% 以上大模型幻觉问题,并且相比单层信息过滤方案,效率大幅提升。
阿里云百炼通过双层幻觉信息过滤框架,可解决 90% 以上大模型幻觉问题
阿里云百炼资深算法专家谢朋峻表示:“全新的 RAG 框架极大地提升了大模型的生成效果,为大模型在复杂场景下的应用开辟了新的可能性,我们希望这一新方案能进一步推动了人工智能技术的发展和应用。”
目前,阿里云百炼可为企业和开发者提供三种模型服务:用户可直接调用大模型进行推理,例如 Qwen、Llama、ChatGLM 等主流开源和闭源模型;用户还可对大模型进行微调和训练,阿里云百炼提供从数据管理、模型调优、评测到部署的全链路模型服务,用户可弹性按需调用算力,无需关心底层架构;此外,阿里云百炼还支持企业打造 RAG 应用,用户可在百炼上轻松创建知识库,并一键开启 RAG,通过 Assistant API 联合输出。
据介绍,阿里云百炼已上线超 100 款国内外主流大模型,已服务一汽、金山、哈啰集团、国家天文台等超 30 万企业客户。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。