我要投稿

图解 RAG 的 5 种分块策略

发布日期：2025-06-01 15:38:56 浏览次数： 2291

作者：AI科技前哨站

微信搜一搜，关注“AI科技前哨站”

以下是 RAG 的典型工作流程：

由于附加文档可能很大，步骤 1 还涉及分块处理，即将大文档分割成更小/易于管理的小块。

此步骤至关重要，因为它确保文本符合 embedding 模型的输入大小。

以下是 RAG 的五种分块策略：

今天让我们来了解它们！

1.固定大小分块 (Fixed-size chunking)

基于预定义数量的字符、单词或 token 将文本分割成统一的片段。

由于直接分割可能会破坏语义流，因此建议在两个连续的块之间保持一些重叠（上图中的蓝色部分）。

这种方法实现简单。此外，由于所有块大小相等，它简化了批处理。

但这种方法通常会中断句子（或观点）。因此，重要信息很可能会分散在不同的块中。

2.语义分块 (Semantic chunking)

根据有意义的单元（如句子、段落或主题部分）对文档进行分段。
接下来，为每个片段创建 embedding。
假设我们从第一个片段及其 embedding 开始。

如果第一个片段的 embedding 与第二个片段的 embedding 具有高的余弦相似度，则这两个片段形成一个块。
这个过程一直持续到余弦相似度显著下降为止。
一旦相似度下降，我们就开始一个新的块并重复上述过程。

输出结果可能如下所示：

与固定大小分块不同，这种方法保持了语言的自然流畅性并保留了完整的思想。

由于每个块的内容更丰富，它提高了检索准确性，从而使 LLM 能够生成更连贯和相关的响应。

一个小问题是，它依赖于一个阈值来确定余弦相似度是否显著下降，这个阈值可能因文档而异。

3.递归分块 (Recursive chunking)

首先，根据段落或章节等固有分隔符进行分块。

接下来，如果块的大小超过预定义的分块大小限制，则将每个块分割成更小的块。但是，如果块符合分块大小限制，则不进行进一步分割。

输出结果如图所示：

如上所示：

首先，我们定义了两个块（紫色的两个段落）。
接下来，段落 1 被进一步分割成更小的块。

与固定大小分块不同，这种方法也保持了语言的自然流畅性并保留了完整的语义。

然而，在实现和计算复杂性方面存在一些额外的开销。

4. 基于文档结构的分块 (Document structure-based chunking)

它利用文档的固有结构，如标题、章节或段落，来定义分块边界。通过这种方式，它与文档的逻辑部分对齐，从而保持结构完整性。

输出结果如图所示：

也就是说，这种方法假设文档具有清晰的结构，但这可能并非总是如此。

此外，块的长度可能会有所不同，可能会超出模型的 token 限制。可以尝试将其与递归分割相结合。

5.基于 LLM 的分块 (LLM-based chunking)

提示 LLM 生成语义上独立且有意义的块。

这种方法确保了高语义准确性，因为 LLM 能够理解上下文和含义，而不仅仅是依赖简单的启发式方法（如上述四种方法所采用的）。

但这也是这里讨论的所有五种技术中对计算需求最高的分块技术。

此外，由于 LLM 通常具有有限的上下文窗口，因此也需要注意这一点。

每种技术都有其自身的优点和权衡。

我们观察到语义分块在许多情况下效果很好，但同样，需要进行具体的测试。

选择将取决于内容性质、embedding 模型的能力、计算资源等。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-12-04

搜索的终极形态？向量搜索重构信息检索范式

2025-12-04

RAG 深度解读：检索增强生成如何改变人工智能

2025-12-03

大模型RAG入门宝典｜从AI搜索到实战搭建，小白&程序员必收藏的检索增强指南

2025-12-03

货拉拉RAG优化实践：从原始数据到高质量知识库

2025-12-03

RAG评估:Opik监控追踪RAG应用

2025-12-02

Struct Array 如何让多向量检索返回完整实体？知识库、电商、视频通用|Milvus Week

2025-12-02

企业级 AI Agent规模化落地的避坑指南，就藏在这四大趋势里

2025-12-01

MCP与数据库的完美结合

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

RAG彻底爆了！一文掌握其效果优化的架构设计及核心要点

2025-09-15

万字长文详解腾讯优图RAG技术的架构设计与创新实践

2025-09-08

关于多模态应用的几个疑问，以及多模态应该怎么应用于RAG？

2025-09-10

您应该为您的 RAG 系统使用哪种分块技术？

2025-09-10

Embedding与Rerank：90%的RAG系统都搞错了！为什么单靠向量检索会毁了你的AI应用？

2025-10-04

企业级 RAG 系统实战（2万+文档）：10 个项目踩过的坑（附代码工程示例）

2025-10-11

存算一体破局向量检索瓶颈，IBM放出王炸VSM：性能飙升100倍，能效碾压GPU千倍，RAG要变天？

2025-09-30

总结了 13 个顶级 RAG 技术

2025-10-12

大模型生态的“不可能三角”：规模化应用的架构困境？

2025-11-04

通过两个案例，看RAG如何解决大模型的“知识短板”

2025-09-08

大家都在问

RAG知识库迎来大洗牌：GraphRAG如何让机器真正读懂世界？

2025-11-23

再谈RAG的文档解析——文档解析的难点在哪里？

2025-11-20

为什么RDF是AI系统的“天然知识层”？

2025-11-19

大模型生态的“不可能三角”：规模化应用的架构困境？

2025-11-04

Embedding与Rerank：90%的RAG系统都搞错了！为什么单靠向量检索会毁了你的AI应用？

2025-10-04

存算一体破局向量检索瓶颈，IBM放出王炸VSM：性能飙升100倍，能效碾压GPU千倍，RAG要变天？

2025-09-30

您应该为您的 RAG 系统使用哪种分块技术？

2025-09-10

关于多模态应用的几个疑问，以及多模态应该怎么应用于RAG？

2025-09-10

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部