我要投稿

RAG相关术语快速了解

发布日期：2025-05-30 06:41:46 浏览次数： 2360

作者：灵矩Lab

微信搜一搜，关注“灵矩Lab”

RAG (Retrieval-Augmented Generation)，检索增强生成

一、RAG架构核心组成

术语	含义
Retriever（检索器）	负责从外部知识库中查找与用户问题相关的文档或片段（如向量数据库中的Top-k检索）。
Generator（生成器）	通常是大型语言模型（如GPT、T5），利用检索到的信息生成最终回答。
Index（索引）	检索系统的核心数据结构，用于快速查找文档。一般为向量索引。
Knowledge Base / Corpus（知识库 / 文档库）	存储结构化或非结构化知识的内容集合，RAG系统会从中检索相关信息。

二、Embedding与向量检索

术语	含义
Embedding（嵌入表示）	把文本转化为向量，用于语义比较和检索。
Dense Retrieval（稠密检索）	使用语义向量（如DPR、BERT）进行文本检索，优于传统TF-IDF方法。
Vector Store（向量数据库）	用于存储文档向量的数据库，如FAISS、Pinecone、Milvus、Weaviate等。
ANN（Approximate Nearest Neighbor）	一种高效查找相似向量的算法，常用于大规模向量检索。

三、检索技术

术语	含义
DPR（Dense Passage Retrieval）	Facebook提出的稠密检索方法，训练了Query Encoder和Passage Encoder。
BM25	一种经典的基于词频的稀疏文本检索算法，传统搜索引擎常用。
Hybrid Retrieval（混合检索）	同时结合稀疏检索（如BM25）和稠密检索（如DPR）结果，提高召回率。

四、生成与上下文控制

术语	含义
Context Window（上下文窗口）	LLM能处理的最大输入长度，超出后会截断。
Chunking（分块）	将长文档切分为小块（chunks）以适应检索与上下文窗口限制。
Top-k Retrieval	返回与查询最相关的前k个文档块或片段。
Prompt Engineering	设计提示词，以更好地引导语言模型利用检索内容生成答案。
Grounding	保证生成内容基于真实检索结果，而非幻想（hallucination）。

五、相关技术与模式

术语	含义
Reranking（重排序）	对初步检索结果再次打分排序，提升质量。
Query Expansion（查询扩展）	通过添加同义词、上下义词等方式增强查询效果。
Multi-hop Retrieval	支持跨多个文档或查询步骤的复杂问题解答。
Fusion-in-Decoder（FiD）	Google提出的一种生成架构，融合多个检索文档到decoder中。
Retriever-Reader Architecture	检索器+阅读器的传统问答架构，是RAG的前身。

六、RAG部署相关

术语	含义
Cold Start	系统首次运行时缺少有效检索结果或嵌入表示的问题。
Latency（延迟）	检索+生成的总耗时，是RAG系统优化的重点之一。
Caching	将常见检索或生成结果缓存，提升性能。
Incremental Indexing	支持新增文档时无需重建整个索引的机制。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-02-27

如何用 AI 做业务级 Code Review

2026-02-22

不用向量数据库的 RAG，居然跑得更准了？

2026-02-22

AIOps探索：做运维领域的RAG，如何做数据清洗

2026-02-21

Claude Code 每次都要重新探索代码？这个工具直接省下30%成本

2026-02-18

函数计算 AgentRun 重磅上线知识库功能，赋能智能体更“懂”你

2026-02-15

当RAG遇上Agent记忆：为什么相似度检索会"塌方"？

2026-02-15

查个问题还要全图跑一遍？DA-RAG说我只取一瓢

2026-02-13

深度解析 PageIndex：无向量 RAG 框架的技术实现与原理剖析

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

2026 年你需要了解的 RAG 全解析

2026-01-15

如何用NotebookLM，把枯燥的财报解读成精美的PPT？

2026-01-02

为什么Claude Code不用RAG？

2025-12-23

Embedding模型选型思路：相似度高不再代表检索准确（文末附实战指南）

2025-12-07

从 RAG 到 Context：2025 年 RAG 技术年终总结

2025-12-18

告别向量数据库！PageIndex：让AI像人类专家一样阅读长文档

2026-02-03

企业RAG知识库系统中关于向量数据库的对比选型指南

2025-12-31

使用 Agent Skills 做知识库检索，能比传统 RAG 效果更好吗？

2026-02-03

当 Claude Code 连接 NotebookLM，个人 AI 终于有了“长期记忆”

2026-01-06

Claude Code 外挂最强大脑 NotebookLM Skill

2025-12-29

大家都在问

不用向量数据库的 RAG，居然跑得更准了？

2026-02-22

当RAG遇上Agent记忆：为什么相似度检索会"塌方"？

2026-02-15

Claude Cowork 真能替换 RAG ？

2026-02-04

使用 Agent Skills 做知识库检索，能比传统 RAG 效果更好吗？

2026-02-03

为什么 RAG 越用越慢？如何反向调优？

2026-01-19

NotebookLM如何在48小时内分析2万份论文？

2026-01-12

都有混合检索与智能路由了，谁还在给RAG赛博哭坟？

2026-01-08

如何用NotebookLM，把枯燥的财报解读成精美的PPT？

2026-01-02

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部