微信扫码
添加专属顾问
我要投稿
利用AI技术优化文档查询,让编程更高效! 核心内容: 1. AI编程中文档查询的挑战与现状 2. NotebookLM与Gemini引擎在文档查询中的应用实例 3. 利用大语言模型优化文档查询的策略与实战案例
在使用 AI 编程的过程中,你是否也遇到过这样一个问题——或者说是一种挑战:手上拥有一大堆文档,但却急需定位其中某条具体的信息。
几年前,答案很简单粗暴:看文档!
而如今,很多人已经转向更智能的做法:直接问 GPT!
更别提配合 Cursor、Cline 这类编程助手,查找答案变得更轻松了。
虽然在大多数情况下,这一方法都能奏效,但偶尔你会发现得到的答案并不全面,有时甚至只是一知半解,远不能满足需求。
让我以 NotebookLM(借助 Gemini 引擎)为例,讲讲我的亲身体验。
我把 dify 的文档(一款令人惊叹的开源大语言模型聊天工具)输入给 NotebookLM。在这个例子中,我问了怎么创建一个聊天助手,可惜它要么完全不知情,要么只是给出零散的信息。
其实,即便是 Cursor、Windsurf 等强大工具,也可能出现相当随机的回答。
为什么会这样?
主要原因在于:
幸运的是,借助像 Gemini 这样支持高达 200 万 token 上下文的大语言模型,我们可以有一种更简单的方法。
具体来说:
这种方法不仅简单直观,还能大大降低因 RAG 检索偶发偏差而导致的信息丢失风险。
听起来是不是有点抽象?那我们就以实际项目为例,看看如何利用这种方案用 Dify 创建聊天助手。当然,这个方法同样适用于其他任何文档,只要你能获取到源文档的代码即可。
开源项目通常都会有公开的文档。你可以通过点击文档页面上的“编辑”按钮迅速定位到对应的 Git 仓库和具体目录。
以 https://docs.dify.ai/为例,你很容易就能发现它们所在的文件夹。
注意:指定准确的文件夹,可以减少传给模型的文件量。
如果直接把整个仓库(包含大量不必要的源代码)作为上下文,往往是得不偿失。最理想的做法是,只提取出其中的 Markdown 文档。例如,在 Dify 的案例中,所有文档都集中在 指定 文件夹里。
既然找到了文档目录,接下来就需要将整个目录中的 Markdown 文件“拼接”成一个单一的文件。
这时,一款名为 Repomix 的开源工具就能大显身手。你可以通过 npx repomix
命令运行它,或者直接访问它的在线版:https://repomix.com/。
操作流程大致如下:
短短几秒钟后,你就能得到一个文件,其中整合了所选文件夹中所有的内容,以一个长字符串形式呈现。你可以选择复制或下载该文件。
同时,在页面左侧还能看到这个压缩版本的 token 数量。在我的案例中,大约是 475000 token。
(虽然这一数值已经接近 Claude Sonnet 的上限,但与 Gemini 2x 的上百万甚至两百万 token 相比,仍然绰绰有余。)
现在,将整份文档保存成文件或复制到剪贴板后,就可以前往 Gemini(或者当 token 数量未超限时的 Claude)中粘贴进去。
接下来,你就能基于这完整的文档上下文开始提问或让 AI 自动生成代码了。
在我的示例中,我使用的是 Gemini AI Studio 的免费版本。和之前不同,这一次,我再次询问关于如何添加助手,结果获得了极其全面且正确的答案!
通过上述步骤,你就可以使用同一个提示(一整份文档作为上下文)来提问或生成代码,而不必再依赖那些敷衍的 RAG 检索结果,或是听起来合理却与真实文档不符的“凭空捏造”答案。
温馨提示:
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-30
聊聊AI智能体框架MetaGPT下的RAG实践
2025-04-30
如何用大模型+RAG给宠物做一个AI健康助手(干货分享)?
2025-04-30
HiRAG:基于层级知识索引和检索的高精度RAG
2025-04-29
教程|通义Qwen 3 +Milvus,混合推理模型才是优化RAG成本的最佳范式
2025-04-29
RAG开发框架LangChain与LlamaIndex对比解析:谁更适合你的AI应用?
2025-04-29
RAG性能暴增20%!清华等推出“以笔记为中心”的深度检索增强生成框架,复杂问答效果飙升
2025-04-29
超神了,ChatWiki 支持GraphRAG,让 AI 具备垂直深度推理能力!
2025-04-29
AI 产品思维:我如何把一个 AI 应用从基础 RAG 升级到 multi-agent 架构
2024-10-27
2024-09-04
2024-07-18
2024-05-05
2024-06-20
2024-06-13
2024-07-09
2024-07-09
2024-05-19
2024-07-07
2025-04-30
2025-04-29
2025-04-29
2025-04-26
2025-04-25
2025-04-22
2025-04-22
2025-04-20