我要投稿

用 LangGraph 打造了一个迷你 RAG：150 行代码跑通知识库问答

发布日期：2025-07-18 17:56:29 浏览次数： 1977

作者：AISpace研习所

微信搜一搜，关注“AISpace研习所”

你是不是厌倦了在低代码平台上，拖拉拽一通操作搭建RAG系统？是不是想深入学习RAG，自己实现RAG的每一个步骤？今天我们将用最精简的方式，带你从零实现一个完整的RAG系统！通过LangChain+LangGraph实战，深入拆解RAG的每个核心模块，告别"黑箱"操作，真正理解检索增强生成的运行机制。

速览 MiniRAG

体积：不到 150 行核心代码

向量存储：PGVector，一个 Docker 命令搞定

嵌入 & 重排：直接调用 SiliconFlow API，无需本地 GPU

编排：LangGraph 工作流，像拼乐高一样搭链路

RAG流程图：

MiniRAG流程图

项目结构

├── .env                    # 环境变量配置
├── README.md               # 项目说明
├── demo_embedding.py       # 文档嵌入示例
├── demo_minirag.py         # 问答系统示例
├── src/
│   ├── config.py           # 配置加载
│   ├── embedding.py        # 嵌入逻辑
│   ├── prompts.py          # 提示词模板
│   ├── reranker.py         # 重排序逻辑
│   └── workflow.py         # 工作流定义

麻雀虽小，五脏俱全

模块	说明	对应文件
文档读取 & 分块	支持 4 种格式，自动按 1024token 切片	`src/embedding.py`
向量存储	PGVector 存储嵌入	Docker 容器
检索 & 重排	先用向量召回 Top-10 * n，再用 Reranker 取 Top-5	`src/reranker.py`
提示词模板	自带中文模板，可自定义 system prompt	`src/prompts.py`
工作流	LangGraph 可视化 DAG，方便加日志、重试	`src/workflow.py`

15行代码快速测试

文档嵌入，运行demo_embedding.py

from src.embedding import load_and_chunk
load_and_chunk(
    file_path = r"E:\vanna_technical_article.md",
    separator = "\n\n", 
    chunk_size = 1024, 
    chunk_overlap = 80
)

知识问答，运行demo_minirag.py

from src.workflow import MiniRag
minirag = MiniRag()
query = "怎么使用Vanna实现chatBI"
chunks = []
for chunk in minirag.invoke(query):
    chunks.append(chunk)
print(chunks)

Demo结果

(完)

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-12-04

搜索的终极形态？向量搜索重构信息检索范式

2025-12-04

RAG 深度解读：检索增强生成如何改变人工智能

2025-12-03

大模型RAG入门宝典｜从AI搜索到实战搭建，小白&程序员必收藏的检索增强指南

2025-12-03

货拉拉RAG优化实践：从原始数据到高质量知识库

2025-12-03

RAG评估:Opik监控追踪RAG应用

2025-12-02

Struct Array 如何让多向量检索返回完整实体？知识库、电商、视频通用|Milvus Week

2025-12-02

企业级 AI Agent规模化落地的避坑指南，就藏在这四大趋势里

2025-12-01

MCP与数据库的完美结合

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

RAG彻底爆了！一文掌握其效果优化的架构设计及核心要点

2025-09-15

万字长文详解腾讯优图RAG技术的架构设计与创新实践

2025-09-08

关于多模态应用的几个疑问，以及多模态应该怎么应用于RAG？

2025-09-10

您应该为您的 RAG 系统使用哪种分块技术？

2025-09-10

Embedding与Rerank：90%的RAG系统都搞错了！为什么单靠向量检索会毁了你的AI应用？

2025-10-04

企业级 RAG 系统实战（2万+文档）：10 个项目踩过的坑（附代码工程示例）

2025-10-11

存算一体破局向量检索瓶颈，IBM放出王炸VSM：性能飙升100倍，能效碾压GPU千倍，RAG要变天？

2025-09-30

总结了 13 个顶级 RAG 技术

2025-10-12

大模型生态的“不可能三角”：规模化应用的架构困境？

2025-11-04

通过两个案例，看RAG如何解决大模型的“知识短板”

2025-09-08

大家都在问

RAG知识库迎来大洗牌：GraphRAG如何让机器真正读懂世界？

2025-11-23

再谈RAG的文档解析——文档解析的难点在哪里？

2025-11-20

为什么RDF是AI系统的“天然知识层”？

2025-11-19

大模型生态的“不可能三角”：规模化应用的架构困境？

2025-11-04

Embedding与Rerank：90%的RAG系统都搞错了！为什么单靠向量检索会毁了你的AI应用？

2025-10-04

存算一体破局向量检索瓶颈，IBM放出王炸VSM：性能飙升100倍，能效碾压GPU千倍，RAG要变天？

2025-09-30

您应该为您的 RAG 系统使用哪种分块技术？

2025-09-10

关于多模态应用的几个疑问，以及多模态应该怎么应用于RAG？

2025-09-10

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部