微信扫码
添加专属顾问
我要投稿
LEANN 革命性压缩技术,让 RAG 应用在笔记本上也能轻松运行,6000 万文档仅占 6GB!核心内容: 1. 传统 RAG 系统的痛点与 LEANN 的创新解决方案 2. LEANN 的技术原理:图索引与两步搜索机制 3. 实际应用场景与性能测试结果
开篇:做 RAG 应用,向量数据库动辄几十上百 GB,云服务费用一个月小几千。有个开源项目挺有意思,反着来——不存向量,只存关系图,6000 万文档只要 6GB。
去年给公司搭 RAG 系统,踩了不少坑:
后来发现 LEANN 这个项目,思路挺特别。
常规做法:
文档 → 转成向量 → 全存硬盘 → 搜索时直接查
存储:201GB(6000 万文档)
LEANN 做法:
文档 → 建图索引 → 压缩关系 → 搜索时现算
存储:6GB(6000 万文档)
具体实现:
其实很简单:用户搜索只看前几条结果。
边缘设备特别适合这个方案——硬盘小但 CPU 够用。
from leann import LEANN
# 建索引
index = LEANN(backend="hnsw", dim=768)
index.build(documents)
# 搜索
results = index.search("分布式事务怎么做", top_k=5)
实测:
配置成 MCP 服务器,给 Claude Code 加个语义搜索:
{
"mcpServers": {
"leann": {
"command": "python -m leann.mcp",
"env": {"INDEX_PATH": "./codebase"}
}
}
}
比 grep 关键词搜索聪明多了,能理解你想找什么。
某金融公司的案例:
# 数据少用 HNSW(省内存)
index = LEANN(backend="hnsw")
# 数据多用 DiskANN(省硬盘)
index = LEANN(backend="diskann")
代码没改,换个参数就行。
# 先建基础索引
index.build(initial_docs)
# 后面慢慢加
for new_batch in stream:
index.add(new_batch)
日志分析、监控这种持续写入的场景很方便。
不用:
对隐私要求高的团队来说,这点挺重要。
取舍:慢一点点,准确率低一点点,但省了 97% 空间,不用运维。
适合:
不适合:
pip install leann
# 五行代码搞定
from leann import LEANN
index = LEANN()
index.build(your_documents)
index.save("my_index")
results = index.search("查询内容")
云栈社区( https://yunpan.plus )有人把它接到 Logseq、Zotero 里了,本地搜索体验不错。想深入了解向量数据库原理,可以看看数据库与中间件这块的资料。
LEANN 这个项目给了我一些启发:
现在大模型本地化、隐私计算越来越火,这类项目的思路值得关注。如果你在搭云原生架构或者研究 RAG 落地,可以参考一下。
📌 项目仓库:https://github.com/yichuan-w/LEANN
📄 论文:https://arxiv.org/pdf/2506.08276
💻 Python 教程:https://yunpan.plus/f/26
💻 AI 教程:https://yunpan.plus/f/29
关注《云栈后端架构》,一起聊聊开源项目和技术实践
标签:#LEANN #Github #向量数据库 #RAG #本地AI #隐私计算 #边缘计算
https://yunpan.plus/t/7150-1-1
云栈社区
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-01-02
如何用NotebookLM,把枯燥的财报解读成精美的PPT?
2026-01-01
这次,RAG记忆被微信AI团队的超图盘活了
2026-01-01
企业级 RAG + 知识图谱的4 种主流实现路径
2025-12-31
企业RAG知识库系统中关于向量数据库的对比选型指南
2025-12-31
EdgeVec:浏览器原生向量数据库,让AI应用彻底摆脱服务器
2025-12-29
Claude Code 外挂最强大脑 NotebookLM Skill
2025-12-28
先RAG后KG,还是先KG后RAG?我们试了三种策略
2025-12-28
多层记忆架构:让你的AI“像人一样记忆”
2025-10-11
2025-10-12
2025-12-04
2025-11-04
2025-10-31
2025-12-03
2025-11-13
2025-10-12
2025-10-16
2025-10-16
2026-01-02
2025-12-23
2025-12-21
2025-12-10
2025-11-23
2025-11-20
2025-11-19
2025-11-04