谢谢您的订阅!
当新的内容发布后您将开始接收邮件。您也可以点击邮件内的链接随时取消订阅。关闭Close

RAG 是什么?

by Canonical on 11 April 2025

2020 年的一篇论文中,Patrick Lewis 和他的研究团队引入了术语 RAG,即检索增强一代。该技术通过利用外部知识来源,如文件和广泛的数据库,增强了生成式 AI 模型。RAG 填补了传统大型语言模型(LLM)中的一个空白。传统的模型依赖于已经包含在其中的静态知识,而 RAG 则结合了最新信息,作为 LLM 的可靠事实来源。虽然 LLM 可以在没有 RAG 的情况下快速理解和响应提示,但它们通常不能提供最新或更具体的信息。

RAG 的一个实际应用是对话代理和聊天机器人。借助 RAG 模型,这些系统能够从外部来源获取上下文相关的信息,从而增强自身性能。这种能力确保客户服务聊天机器人、虚拟助理和其他对话界面在交互过程中提供准确和信息丰富的响应。另一个用例是在高级问答系统中,RAG 模型可帮助个人获得查询的答案,例如支持票证响应。此外,RAG 可用于内容推荐系统,通过检索相关信息提供个性化推荐,以增强用户体验和内容参与度。

使用 RAG 的好处 

构建信任的数据源

将机器学习模型用于企业应用程序(例如聊天机器人)或搜索敏感数据时,RAG 为模型提供可引用的可验证信息。该方法使模型能够专注于不太模糊的背景信息,大大降低了产生错误输出的可能性,这种现象通常被称为“幻象”。

最新信息

使用 RAG,您可以加载最新的可靠数据,确保您的模型将检索到准确的信息。

RAG 的简单性

Lewis 和三位合著者发表了一篇题为《知识密集型 NLP 任务的检索增强生成》的论文,其中他们只用五行代码演示了 RAG。该实施生成了一个模型,包括一个问题编码器、一个检索器和一个生成器,用于生成上下文感知的答案。该实施的简单性表明,RAG 作为一个概念和项目相对容易操作。然而,在生产和大规模部署中,复杂性确实增加了。

降低持续模型重新训练的成本

持续重新训练机器学习模型可能会很昂贵。利用 RAG,不需要依赖于时间密集和昂贵的参数重新训练。这可能降低在企业环境中运行 LLM 驱动的聊天机器人的计算和财务成本。

RAG 的工作原理

当在 AI 聊天机器人中进行查询时,基于 RAG 的系统首先从大型数据集或知识库中检索相关信息,然后这些信息用于通知并指导生成回复。基于 RAG 的系统由两个关键组件组成。第一个组件是检索器,它负责定位有助于回答用户查询的相关信息。它搜索数据库以选择最相关的信息。然后,将该信息提供给第二个组件,即生成器。生成器是一个产生最终输出的大型语言模型。见下图:

在使用基于 RAG 的系统之前,必须首先创建知识库,它由未包含在 LLM 训练数据中的外部数据组成。这些外部数据可能来自不同的来源,包括文档、数据库和 API 调用。大多数 RAG 系统利用一种称为模型嵌入式 AI 技术,将数据转换为数字表示,并将其存储在矢量数据库中。使用嵌入式模型,您可以创建一个在 AI 环境中易于理解和检索的知识模型。在创建知识库并设置矢量数据库后,现在可以执行 RAG 过程;以下是一个概念性流程:

基于 RAG 的系统包含五个简单的步骤:

  1. 您可以通过输入提示或查询来开始操作。 
  2. 检索器用于从知识库中搜索相关信息。通过矢量搜索和数据库功能,可以使用数学矢量计算和表示来确定相关性。 
  3. 检索相关信息来提供增强的上下文,并将其传递给生成器。
  4. 现在使用这些上下文来丰富查询和提示,并准备好使用提示工程技术 (LLM)来扩充,以用于大型语言模型。增强的提示使语言模型能够准确地响应您的查询。
  5. 最后,向您发送生成的文本响应。

Canonical 满足您的 RAG 要求

使用 Canonical RAG workshop 构建正确的 RAG 架构

Canonical 提供为期 5 天的 workshop,旨在帮助您开始构建自己的企业 RAG 系统。在 workshop 结束时,您将对 RAG 和 LLM 理论、架构和最佳实践有一个透彻的理解。我们将共同开发和部署满足您特定需求的解决方案。

下载数据表

了解更多信息并联系我们的团队,以满足您的 RAG 需求。

订阅博客文章

订阅您感兴趣的主题

在提交此表格的同时,我确认已阅读和同意的隐私声明隐私政策。

查看更多内容

SiFive、ESWIN和 Canonical 宣布在 HiFive Premier P550 上提供 Ubuntu

SiFive、ESWIN(奕斯伟计算)和 Canonical 正在 HiFive Premier P550 上启用 Ubuntu 24.04 LTS,这是一个提供高级 RISC-V 开发体验的开发平台,是 RISC-V 开发社区的一个重要里程碑。这种合作确保了购买 HiFive Premier P550 的开发人员可以充分利用 Ubuntu 强大的生态系统,实现与更广泛的开源生态系统的无缝集成,并加快 RISC-V 支持的软件开发的创新。 HiFive Premier P550 开发系统 SiFive 在 2024 年中宣布推出 HiFive Premier P550。Canonical、SiFive 和奕斯伟计算合作,在本月推出这款预装了 Ubuntu 的产品。  该主 […]

Canonical 获得 ISO/SAE 21434 认证,强化了汽车网络安全标准

经过认证的网络安全流程有助于保护下一代互联汽车 Canonical 自豪地宣布,其安全管理系统经过全球知名认证提供商 TÜV SÜD 的广泛评估,已获得 ISO/SAE 21434 认证。这一里程碑突出了 Canonical 在为汽车行业提供可信可靠的开源解决方案方面的领导地位。它强调了 Canonical 对三大关键业务支柱的承诺:强大的网络安全、符合全球行业标准以及为自动驾驶和智能汽车构建更安全的未来。 强大的汽车网络安全 随着车辆的互联程度越来越高,未经授权的访问、远程攻击和数据泄露的风险也显著增加。ISO/SAE 21434 为在整个车辆生命周期内管理这些风险提供了详细的框架。对于原始设备制造商和一级供应商来说,合规是在竞争激烈的市场中交付产品的关键。 Canon […]

Canonical 和 Renesas 宣布将合作加速企业 AI 创新

Ubuntu 的发行商 Canonical 宣布,半导体解决方案的全球领导者 Renesas Electronics Corporation 已加入 Canonical 的硅合作伙伴计划,以提供量身定制的尖端解决方案来满足边缘计算和 AI 应用不断增长的需求。随着行业越来越多地采用 AI 驱动的解决方案,对高效、可扩展和安全维护的边缘计算平台的需求前所未有地高涨。此次合作将结合 Renesas 在嵌入式处理方面的专业知识和 Canonical 全面的物联网(IoT)软件堆栈。 可扩展的生产级解决方案 Canonical 和 Renesas 的合作旨在为原始设备制造商(OEM)和原始设计制造商 (ODM)提供可扩展的生产级解决方案,从而缩短上市时间(TTM)。Renesas […]