微信扫码
添加专属顾问
我要投稿
从B站看到一位小姐姐分享《基于 Gemini 和向量搜索的生成式推荐》,里面提到做RAG的流程,我总结为4大阶段10个步骤如下:
一、知识准备阶段
1. 文档收集与预处理
首先收集大量的相关文档,即知识。这些文档可以是文本文件、PDF、网页、图片等多种形式。收集完成后,对文档进行预处理,包括清洗、去重等,确保数据的质量。其中可以做元数据提取,提取文件名、章节title、图片alt信息等,也利用OCR等技术,将PDF、图片等内容数字化。
2. 文档内容分块
将文档分割成若干个数据分块,以便于后续的处理和检索。有多种分块方式,比如固定大小分块或意图分块等。固定大小分块要注意增加“块”的冗余量,否则会损失很多语义,比如“我们今天晚上应该去吃个大餐庆祝一下”,可能被分在两个“块”里面——“我们今天晚上应该”、“去吃个大餐庆祝一下”,这样对检索是非常不友好的。增加“块”的冗余,就是一头一尾保留相邻“块”头尾的内容。
3. 向量数据库存储
将分块后的内容转化为向量,存储到向量数据库中,即embedding,以便于快速检索。
二、问题处理阶段
4. 用户交互与问题处理
针对用户问题,使用大模型的能力进行拼写检查和内容改写,在保证问题原意的前提下,使问题变成一个适合向量检索的问题。比如“用户提问:我的背景调查一直没有结果。”改写为“为什么我的背景调查要花费这么长时间。”
5. 问题向量化
将处理后的用户问题转化为向量,以便与向量数据库中的向量进行相似度检索和语义匹配。
三、问题召回阶段
6. 内容召回
根据匹配结果,召回与问题最相关的topN个文档。为保证检索结果全面性和准确性,可能会混合使用相似度检索、关键词检索、SQL检索等多种技术。
7. 合规处理
根据既定的安全规则,对召回文档进行审查处理,确保信息的安全性和合法性,包括用户是否有权接触该信息。
8. 生成回答
将用户问题、召回的合规文档等内容组成提示词提供大模型,生成回答。
四、答案优化阶段
9. 多轮检索优化
为了保证答案的准确性和完整性,系统可能需要进行多轮检索,对每一轮生成的答案进行比较,判断是否需要修改或追加答案。
这里的原因是“块”的数量很多,每次检索的维度不一定是最优的,所以需要把相关度、匹配度等因素做一些重新调整,得到更符合业务场景的排序。可能有一个内部判断器来评审相关度,触发重排序。
10. 最终答案呈现
经过多轮检索后,最终让大模型生成一个经过检验的最准确的答案,呈现给用户。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-30
聊聊AI智能体框架MetaGPT下的RAG实践
2025-04-30
如何用大模型+RAG给宠物做一个AI健康助手(干货分享)?
2025-04-30
HiRAG:基于层级知识索引和检索的高精度RAG
2025-04-29
教程|通义Qwen 3 +Milvus,混合推理模型才是优化RAG成本的最佳范式
2025-04-29
RAG开发框架LangChain与LlamaIndex对比解析:谁更适合你的AI应用?
2025-04-29
RAG性能暴增20%!清华等推出“以笔记为中心”的深度检索增强生成框架,复杂问答效果飙升
2025-04-29
超神了,ChatWiki 支持GraphRAG,让 AI 具备垂直深度推理能力!
2025-04-29
AI 产品思维:我如何把一个 AI 应用从基础 RAG 升级到 multi-agent 架构
2024-10-27
2024-09-04
2024-07-18
2024-05-05
2024-06-20
2024-06-13
2024-07-09
2024-07-09
2024-05-19
2024-07-07
2025-04-30
2025-04-29
2025-04-29
2025-04-26
2025-04-25
2025-04-22
2025-04-22
2025-04-20