支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


RAG 是个啥?一文秒懂

发布日期:2025-05-18 09:35:31 浏览次数: 1528 作者:AI设计湿
推荐语

深入理解RAG技术,提升大模型应用效率。

核心内容:
1. RAG技术简介与应用场景
2. RAG的核心流程和工作原理
3. RAG主流框架和解决方案

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

大语言模型(LLM)在自然语言处理和自然语言理解方面取得了重大突破。大模型与应用场景的结合有助于可以在降低成本的同时提高效率。在具体场景的落地中,通用领域的大模型缺乏具体的领域知识,需要对其进行微调,这将消耗大量的计算资源。

当前,检索增强生成(RAG)作为大语言应用的一种模式,可以将大语言模型强大的理解能力和领域知识相结合,可以提高模型准确性和效率

什么是 RAG

RAG是 “Retrieval-Augmented Generation” 的缩写,直译过来叫做“检索增强生成”。

首先我们把大模型想象成一个学识丰富的老师,当学生向老师问了一个很冷门的问题时,老师可能也不知道答案,就不太好回答或者回答不了。而 RAG 则是相当于这题我不会,但是我有“小抄”,我回答的时候,就看一眼小抄,然后再综合我脑子里的已有知识,进行回答。

RAG,不是训练,不改变大模型的“脑回路”,但可以作为外挂,提升大模型回答问题的精准性。 适用于企业自身积累了大量知识库文档,通过RAG的方式,与大模型关联。

这样,大模型在回答问题的时候,会先检索知识库,进行精准回答。

RAG 核心流程

RAG 主要流程分为两步:

  • 1.从知识库中检索出和问题相关的内容;
  • 2.将相关的知识拼接到 prompt 中,让 LLM 基于相关知识和用户问题进行回答。

以下是一个 RAG prompt 示例:

你是一名资深的商家助理,专注解答用户开店时遇到的问题。请基于 '---' 之间的相关参考内容对用户的问题进行回答。

相关参考内容:
---
1. 在亚马逊商城开店的第一步是创建一个卖家账户。中国大陆、中国香港和中国台湾的卖家需要提供下列文件。

为了顺利完成整个流程,请在开始之前收集所有必需材料。您可以随时停止和继续完成注册流程,只需使用您选择的注册电子邮件地址和密码保存进度即可。

如果您在注册过程中遇到问题,请点击注册页面上的“获得支持”以获得帮助。

注册清单:

1. 以下企业文件的彩色扫描件:
对于中国大陆的公司: 公司营业执照(不接受个体工商户营业执照)
对于中国香港的公司: 公司注册证书和商业登记条例
--- 
用户问题:中国商家在亚马逊开店需要什么资料?
注意以下要求:
1. 在回答时,尽可能参考原文
2. 若无法提供回答,请回复联系人工客服
在上述示例中,由于添加了相关的知识,大模型可以对公司资质问题给出准确的回答,相对于直接使用大模型进行回答,RAG 可以更有效地借助垂域知识。总的来说,RAG 的主要流程如下:

RAG 主流框架

由于 RAG 的可解释性、不依赖模型微调、能适应多样化的应用需求等优点,市面上存在着诸多以 RAG 为核心的解决方案,主要包括框架和应用两类:

  • • 框架类:主要提供面向开发者的SDK。用户需要自行对接不同的模型资源,构建自己的应用流程。自定义程度高,但具备一定的上手难度。相关框架如langchain、LlamaIndex、promptflow 等
  • • 应用类:开箱即用,大多是2C的类知识助手应用,一般流程为用户上传文档(知识库),然后可以基于知识库进行端到端的问答(通常,不同的应用的内置问答流程有在关键环节有一些区别,比如召回策略、是否使用 Agent等)。相关应用如 dify、有道 QAnything、字节 Coze 等。

实现一个小型 RAG demo

作为一名前端开发,优先采用了以 Nodejs 为核心的技术栈:

  • • Nodejs 18
  • • Langchain.js
  • • LLM model: DeepSeek-R1:7B

技术方案设计如下,采用组件化思想打包各个模块,方便后续模块的扩展:

本地成功执行:

结语

目前我只是简单尝试了 RAG 流程,相比微调,RAG 的入门门槛会低很多,且效果还挺不错。大部分企业想要应用 AI,RAG 是一个很好的方向,低成本高 ROI。

 


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询