微信扫码
添加专属顾问
我要投稿
颠覆认知:少给Agent喂数据,反而能提升性能!RAG的复杂工程可能走错了方向。核心内容: 1. 动态上下文发现:让Agent自主探索文件系统比预先索引更高效 2. 工程实践案例:Claude Code和d0代理的成功验证了"少即是多"原则 3. 静态与动态上下文对比:后者在token成本、噪音控制和模型自主性上全面胜出
一个反直觉结论:你越少喂上下文,Agent 反而越能干。
很多公司做知识库问答(RAG)都是“拼命三郎”:
但最后呢?要么“找不到”,要么“胡编”。
所以我们换个脑回路:不去替模型管上下文,而是给它一个可探索的文件系统。
Agent 只拿一个最小起点,剩下的让它自己找。
换句话说:你负责把食材放进冰箱分门别类,Agent 自己决定做几菜一汤。
先讲清楚背景:代码库动辄上万行,传统做法是“预先索引 + 向量检索”。但 Claude Code 在实践里更像一个“命令行老手”。
它用 glob/grep/find/tail 来定位文件,再逐步精读。
相关原文:
结论很直接:文件系统 + Unix 命令 = 最高效的上下文导航原语。
动态上下文发现的核心很简单:
只给 Agent 一个干净的起点,剩下的按需加载。
它解决了三个老问题:
再补一个具体场景,很多团队都踩过:
你让 Agent 跑一次数据库迁移,终端输出 5000 行日志,前面 4999 行都是进度条,最后一行才是 ERROR。
tail 看末尾,再按需定位,就能精准发现问题。这就是“动态上下文发现”的真实工程价值,而不是一句口号。
Vercel 的 d0 代理之前工具多到像杂货铺,结果成功率只有 80%。
他们最后删到只剩一个工具:执行任意 bash 命令,反而成功率从 80% 到 100%,步骤更少、token 更少。
原文链接:
https://vercel.com/blog/we-removed-80-percent-of-our-agents-tools
“减法增益”是真的:
每多一个工具,你就替模型做一次选择。
Manus 总结了一个非常硬核的生产指标:
KV-cache 命中率是生产阶段 AI 代理最重要的单一指标。
关键实践包括:
还有一个很巧的设计:
遮蔽,而非移除。
动态移除工具会让缓存失效,改用 logits 掩蔽限制可选工具,更稳。
这里再举个“人话版”例子:
Manus 会在复杂任务中创建一个 todo.md,每完成一步就更新。它把目标不断复述到上下文末尾,避免“中间丢失”。
这不是可爱行为,而是注意力管理。
原文链接:
https://manus.im/zh-cn/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus
以下是五个可落地实践:
tail 看结论再展开grep 定位错误Agent Skills 为什么是热点?
因为它本质就是“文件化能力说明”,让模型按需加载技能,而不是你一次性塞满提示词。
你可以把它理解成“技能书书架”:
这比把 50 本技能书一次性塞进模型脑子里更现实。
不是所有场景都适合“慢慢找”。
这些场景仍需要人为流程和工作流设计。
软件工程没有银弹,选对场景才是银弹。
如果你想把 Agent Skills 和文件系统上下文落地,有两个入口:
它们都把“文件化上下文 + 按需发现”做成了开箱即用的能力。
参考链接:
真正有效的 Agent,不是“背得多”,而是“找得准”。
文件系统 + Agent Skills,正在把上下文工程从“人肉管理”变成“模型自探索”。
如果你也在做 Agent,建议从“少喂一点”开始。
欢迎分享你在实际项目里遇到的“不知道怎么做”的问题。如果你已经用规划模式优化过 Agent,也欢迎晒晒效果数据,互相取经。
我们是成都艾维禾砺数字科技有限公司,长期做 AI 应用定制:
如果想聊聊 Agent Skills、文件系统上下文、规划模式怎么结合在你的场景里发挥作用,可以:
official.ivheli.com
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-01-25
Langgraph从零开始构建第一个Agentic RAG 系统
2026-01-24
大模型在需求分析与设计中的提效实践
2026-01-23
GraphRAG:让 RAG 看见"关系网络"的技术进化
2026-01-22
企业级 AI 知识库问答,是不是面子工程? – 是也不是
2026-01-21
SentGraph:一句一句把多跳RAG“画”成图
2026-01-21
增强型RAG还是Agentic RAG?一场关于检索增强生成系统的全面对比实验
2026-01-20
别再用向量数据库给AI灌"迷魂汤"了
2026-01-20
DSPy 3 + GEPA:迄今最先进的 RAG 框架——自动推理与提示
2025-10-31
2025-12-04
2025-11-04
2025-12-03
2025-11-13
2025-12-02
2025-11-13
2025-11-05
2025-11-06
2025-12-07
2026-01-19
2026-01-12
2026-01-08
2026-01-02
2025-12-23
2025-12-21
2025-12-10
2025-11-23