我要投稿

不到 100 行代码用 LlamaIndex 搞一个“带脑子”的 RAG 系统（RAG + 知识图谱）

发布日期：2025-12-28 16:55:25 浏览次数： 1742

作者：数联未来

微信搜一搜，关注“数联未来”

一个真实可落地、代码完整、部署简单的教程，手把手教你用 LlamaIndex + Neo4j（知识图谱） + Chroma（向量库） 搭建一个“能推理、会回答”的智能问答系统。

以一个企业内部 IT 支持场景为例：

员工问：“我怎么重置密码？”，系统不仅要返回操作步骤，还要知道“你是哪个部门的”——因为不同部门流程不同！

这个案例跑起来，不需要 GPU，普通笔记本就行。

🎯 场景设定

假设你是一家公司的 IT 助理 Agent，员工会问各种问题：

“怎么连公司 Wi-Fi？”
“报销流程是什么？”
“我是市场部的，怎么申请新电脑？”

但注意：不同部门的流程不一样！

比如：

技术部：自己在系统里申请
市场部：需要主管审批
财务部：走纸质表单

所以，光靠“语义相似”检索是不够的——你得知道 “用户 → 部门 → 流程” 这个关系链。

这就轮到 知识图谱 上场了！

🧰 准备工作

1. 安装依赖

pip install llama-index \
llama-index-graph-stores-neo4j \
llama-index-vector-stores-chroma \
neo4j \
chromadb \
python-dotenv

💡 如果你没装 Neo4j，用 Docker 一键启动。

2. 启动 Neo4j（图数据库）

docker run --name neo4j-kg -p 7474:7474 -p 7687:7687 \
  -e NEO4J_AUTH=neo4j/password \
  -d neo4j:5.18

访问 http://localhost:7474，用账号 neo4j / 密码 password 登录，看到界面就成功了！

3. 准备知识文档（模拟公司制度）

创建一个 docs/ 文件夹，放两个文件：

docs/it_policy.md

所有员工重置密码需访问 https://reset.mycompany.com。技术部员工可直接重置。市场部和财务部员工需先邮件通知 IT 支持。

docs/hardware_request.md

申请新电脑： - 技术部：登录资产系统提交申请 - 市场部：填写 OA 表单并由总监审批 - 财务部：联系行政部领取纸质申请表

🧠 第一步：从文档中自动抽取知识图谱

我们用 LlamaIndex 的 KnowledgeGraphIndex 自动构建图谱。

# build_kg.py

from llama_index.core import SimpleDirectoryReader, KnowledgeGraphIndex
from llama_index.graph_stores.neo4j import Neo4jGraphStore
from llama_index.core import StorageContext
from llama_index.llms.openai import OpenAI # 或换成 Ollama/Qwen

# 1. 读文档
documents = SimpleDirectoryReader("docs").load_data()

# 2. 连接 Neo4j 图数据库
graph_store = Neo4jGraphStore(
username="neo4j",
password="password",
url="bolt://localhost:7687",
database="neo4j"
)

# 3. 创建存储上下文
storage_context = StorageContext.from_defaults(graph_store=graph_store)

# 4. 构建知识图谱索引（会自动调 LLM 抽取三元组！）
index = KnowledgeGraphIndex.from_documents(
documents,
storage_context=storage_context,
max_triplets_per_chunk=2,# 每段抽最多2个关系
llm=OpenAI(model="gpt-3.5-turbo"),# 你也可以用本地模型
show_progress=True
)

print("✅ 知识图谱构建完成！去 Neo4j 看看吧：http://localhost:7474")

运行：

python build_kg.py

⚠️ 注意：这一步会调用 LLM（比如 OpenAI），如果你不想花钱，可以换成 Ollama 的 qwen:0.5b 或 Llama.cpp 本地模型（LlamaIndex 支持）。

跑完后，打开 Neo4j 浏览器，输入 MATCH (n) RETURN n，你会看到类似这样的图：

[IT_Support] --(procedure_for)--> [Tech_Department]
[Hardware_Request] --(approval_flow)--> [Marketing_Department]
...

恭喜！你的知识已经结构化了！

🔍 第二步：混合检索 —— 先查图谱，再查向量

现在，我们要让系统“先推理，再回答”。

比如用户说：“我是市场部的，怎么重置密码？”

理想流程：

从问题中识别出 部门 = 市场部
在图谱中找：(Password_Reset) --(procedure_for)--> (Marketing_Department)
找到对应的规则
再用向量库找原文细节，生成自然语言回答

LlamaIndex 提供了 KGQueryEngine + RetrieverQueryEngine 混合模式。

# query_hybrid.py


from llama_index.core import VectorStoreIndex, SimpleDirectoryReader
from llama_index.vector_stores.chroma import ChromaVectorStore
from llama_index.core import StorageContext, load_index_from_storage
from llama_index.graph_stores.neo4j import Neo4jGraphStore
from llama_index.core.query_engine import RetrieverQueryEngine
from llama_index.core.retrievers import KnowledgeGraphRAGRetriever
import chromadb

# 1. 加载向量索引（用于补充上下文）
client = chromadb.PersistentClient(path="./chroma_db")
chroma_collection = client.get_or_create_collection("quickstart")
vector_store = ChromaVectorStore(chroma_collection=chroma_collection)
vector_storage_context = StorageContext.from_defaults(vector_store=vector_store)

# 如果第一次运行，先建向量索引
try:
    vector_index = load_index_from_storage(vector_storage_context)
except:
    docs = SimpleDirectoryReader("docs").load_data()
    vector_index = VectorStoreIndex.from_documents(
        docs, storage_context=vector_storage_context
)

# 2. 初始化图谱检索器
graph_store = Neo4jGraphStore(
    username="neo4j", password="password", url="bolt://localhost:7687"
)
kg_retriever = KnowledgeGraphRAGRetriever(
    storage_context=StorageContext.from_defaults(graph_store=graph_store),
    verbose=True
)

# 3. 混合查询引擎：先用图谱找关键事实，再用向量补充细节
query_engine = RetrieverQueryEngine.from_args(
    retriever=kg_retriever,
    node_postprocessors=[],
)

# 4. 问问题！
response = query_engine.query("我是市场部的，怎么重置密码？")
print("\n🤖 回答：", response)

运行：python query_hybrid.py

你可能会看到这样的输出：

根据公司政策，市场部员工重置密码需先邮件通知 IT 支持。  
具体操作请访问 https://reset.mycompany.com 并按提示操作。

🧪 效果对比：纯 RAG vs RAG+图谱

问题	纯向量 RAG 回答	RAG+图谱回答
“怎么重置密码？”	“访问 https://reset...”（对所有人一样）	同左
“我是市场部的，怎么重置密码？”	“访问 https://reset...”（没区分部门！）	“需先邮件通知 IT 支持” ✅

差距就在这里！
没有图谱，系统根本不知道“部门”这个变量会影响答案。

🚀 如何产品化？（加个 Web API）

用 FastAPI 包一下，5 分钟变服务：

# api.py

from fastapi import FastAPI
from query_hybrid import query_engine # 复用上面的引擎

app = FastAPI()

@app.post("/ask")
defask(question:str):
response = query_engine.query(question)
return{"answer":str(response)}

运行：

uvicorn api:app --reload

然后 curl 测试：

curl -X POST http://localhost:8000/ask -H "Content-Type: application/json" -d '{"question":"我是财务部的，怎么申请电脑？"}'

搞定！你的智能 IT 助手上线了！

💡 小贴士 & 优化方向

不用 OpenAI？
把 OpenAI() 换成：

from llama_index.llms.ollama import Ollama
llm = Ollama(model="qwen:0.5b", request_timeout=120)

本地跑，完全免费！

2.想支持更多实体？
在文档里加更多结构化描述，比如：

[Department: Marketing] has policy [Policy: Email_IT_For_Password_Reset]

3.性能优化

Neo4j 开启索引：:auto CREATE INDEX FOR (d:Department) ON (d.name)
向量库换成 Milvus（如果数据量大）

4.安全提醒

给 Neo4j 加防火墙
不要让用户直接输入 Cypher 查询
对 LLM 输出做内容过滤

✅ 总结

用不到 100 行代码，实现了：

从非结构化文档自动构建知识图谱 ✅
混合检索：图谱推理 + 向量补充 ✅
部署成 Web 服务 ✅

记住：RAG 的未来，不是“更大的 embedding”，而是“更聪明的知识组织”。

你现在就可以把这个方案套用到：

法律咨询（法条 + 案例关系）
医疗问答（症状 → 疾病 → 治疗方案）
电商客服（产品 → 配件 → 保修政策）

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-02-15

当RAG遇上Agent记忆：为什么相似度检索会"塌方"？

2026-02-15

查个问题还要全图跑一遍？DA-RAG说我只取一瓢

2026-02-14

OpenClaw 终于能"记住"事了！我花了 3 周折腾出的长期记忆系统

2026-02-13

深度解析 PageIndex：无向量 RAG 框架的技术实现与原理剖析

2026-02-12

走进 OceanBase 向量背后的算法库 —— VSAG

2026-02-11

开源：我们复刻了OpenClaw的mem系统，为所有Agent打造透明、可控的记忆

2026-02-10

Data Agent Ready Database：下一代企业数仓架构

2026-02-10

丢掉向量数据库！PageIndex 开启“推理型 RAG”新时代，长文档分析准确率高达 98.7%

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

RAG 深度解读：检索增强生成如何改变人工智能

2025-12-04

大模型RAG入门宝典｜从AI搜索到实战搭建，小白&程序员必收藏的检索增强指南

2025-12-03

2026 年你需要了解的 RAG 全解析

2026-01-15

企业级 AI Agent规模化落地的避坑指南，就藏在这四大趋势里

2025-12-02

为什么Claude Code不用RAG？

2025-12-23

如何用NotebookLM，把枯燥的财报解读成精美的PPT？

2026-01-02

Embedding模型选型思路：相似度高不再代表检索准确（文末附实战指南）

2025-12-07

从 RAG 到 Context：2025 年 RAG 技术年终总结

2025-12-18

告别向量数据库！PageIndex：让AI像人类专家一样阅读长文档

2026-02-03

RAG知识库迎来大洗牌：GraphRAG如何让机器真正读懂世界？

2025-11-23

大家都在问

当RAG遇上Agent记忆：为什么相似度检索会"塌方"？

2026-02-15

Claude Cowork 真能替换 RAG ？

2026-02-04

使用 Agent Skills 做知识库检索，能比传统 RAG 效果更好吗？

2026-02-03

为什么 RAG 越用越慢？如何反向调优？

2026-01-19

NotebookLM如何在48小时内分析2万份论文？

2026-01-12

都有混合检索与智能路由了，谁还在给RAG赛博哭坟？

2026-01-08

如何用NotebookLM，把枯燥的财报解读成精美的PPT？

2026-01-02

为什么Claude Code不用RAG？

2025-12-23

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean

不到 100 行代码用 LlamaIndex 搞一个“带脑子”的 RAG 系统（RAG + 知识图谱）

🎯 场景设定

假设你是一家公司的 IT 助理 Agent，员工会问各种问题：

🧰 准备工作

1. 安装依赖

pip install llama-index \llama-index-graph-stores-neo4j \llama-index-vector-stores-chroma \neo4j \chromadb \python-dotenv

2. 启动 Neo4j（图数据库）

3. 准备知识文档（模拟公司制度）

🧠 第一步：从文档中自动抽取知识图谱

我们用 LlamaIndex 的 KnowledgeGraphIndex 自动构建图谱。

🔍 第二步：混合检索 —— 先查图谱，再查向量

现在，我们要让系统“先推理，再回答”。

🚀 如何产品化？（加个 Web API）

💡 小贴士 & 优化方向

✅ 总结

用 不到 100 行代码，实现了：

pip install llama-index \
llama-index-graph-stores-neo4j \
llama-index-vector-stores-chroma \
neo4j \
chromadb \
python-dotenv

用不到 100 行代码，实现了：