我要投稿

Claude Code 工具调用上下文爆炸？新版占用归零

发布日期：2026-03-06 08:37:24 浏览次数： 2574

作者：JAVA架构日记

微信搜一搜，关注“JAVA架构日记”

升级到 Claude Code 2.1.69 后，我输入 /context 看了一眼。System tool 那一栏显示 0。

之前这个数字是 10% 左右，有时候更高。现在直接归零了。

2.1.69 版本把所有工具都改成了延迟加载（defer loading）。启动时不加载任何工具定义，需要的时候才去搜索、才去加载。

另外如果你用过 Claude Code 连接多个 MCP 服务器，应该能感受到这个变化有多大。

以前是什么样的？

如果你用过旧版本，可能遇到过这种情况：

工具越加越多，响应越来越慢。明明只是想让 AI 帮忙查个 GitHub Issue，它却在几十个工具里犹豫半天，最后还可能选错。

打开 /context 一看，系统工具的上下文占用直接飙到 10%。还没开始干活，大半个上下文窗口就被工具定义塞满了。

这不是你的问题，是 MCP 的"成功陷阱"。

MCP（Model Context Protocol）给了我们一个标准化的工具协议，让 AI Agent 可以轻松接入各种服务。但它的设计有个隐含假设：所有工具定义都要一次性加载到上下文里。

当你只有几个工具时，这没问题。但当你连接了 GitHub、Slack、Jira、Google Drive、Sentry、Grafana……工具数量突破 50 个时，问题就来了。

2.1.69 改变了什么？

Claude Code 2.1.69 引入了 Tool Search 功能，思路很简单：所有工具默认不加载，需要的时候再去找。

最明显的变化有两个：

系统工具上下文占用降为 0（以前启动就占用 10% 上下文）。工具选择准确率也提升了，因为 Claude 不需要在几十个工具里犹豫。

而且你什么都不用做，装上最新版就自动生效。

问题的根源：工具定义比你想象的更"重"

MCP 工具为什么会吃掉这么多上下文？看一个典型的 3 服务器配置：

• GitHub：35 个工具，约 26K tokens
• Context7：2 个工具，约 3K tokens
• Exa：2 个工具（默认启用），约 2K tokens

总计：39 个工具，约 31K tokens。

这还只是 3 个服务器。如果再加上 Slack（11 个工具，21K tokens）、Jira（17K tokens）、Linear……很容易就突破 100K tokens。

Anthropic 团队在内部测试中，见过工具定义消耗 134K tokens 的极端案例。对话开始前，上下文窗口已经被工具定义占据了大半。

但 token 消耗只是表面问题。更严重的是：工具越多，AI 越容易选错。

当 Claude 面对 50+ 个工具时，很多工具的名字和描述都很相似：

• notification-send-user vs notification-send-channel
• github-create-issue vs github-create-pull-request
• slack-post-message vs slack-send-dm

人类都要仔细看才能分清，何况 AI。

MCP 工具越多，AI 反而越"笨"。不是模型能力不行，是信息过载了。

Tool Search：从"全量加载"到"按需发现"

Claude Code 的解决方案：不要一次性加载所有工具，需要的时候再去找。延迟加载（Lazy Loading）。

工作流程

传统方式：

Tool Search 方式：

对比一下：

• 传统方式：约 77K tokens（工具定义 72K + 系统提示 5K）
• Tool Search：约 8.7K tokens（搜索工具 0.5K + 发现的工具 3K + 系统提示 5K）

节省了 95% 的上下文空间。

两种搜索方式

Tool Search 提供了两种搜索策略：

1. Regex 搜索

Claude 生成一个 Python 正则表达式，匹配工具名称、描述和参数。

示例：

• "weather" - 查找天气相关工具
• "get_.*_data" - 查找所有 get 开头、data 结尾的工具
• "(?i)slack" - 不区分大小写查找 Slack 工具

适合工具命名规范、描述清晰的场景。

2. BM25 搜索

Claude 用自然语言描述需求，系统用 BM25 算法排序匹配。

示例：

• "send a message to a user"
• "create a pull request on GitHub"
• "search customer orders by date"

适合工具命名不规范、描述较长的场景。

两种方式都会返回 3-5 个最相关的工具，然后自动展开成完整定义。Claude 看到的，只是这几个工具，而不是全部 50+ 个。

defer_loading：一个标记改变一切

实现 Tool Search 的关键，是一个简单的标记：

{
  "name": "github-create-pr",
  "description": "Create a pull request on GitHub",
  "input_schema": {...},
  "defer_loading": true
}

加上 defer_loading: true，这个工具就不会在启动时加载，只能通过搜索发现。

Claude 推荐的最佳实践：

• 保留 3-5 个最常用的工具，设置 defer_loading: false（或不设置）
• 其他所有工具，设置 defer_loading: true

这样既保证了高频操作的响应速度，又避免了上下文浪费。

如何使用？你可能已经在用了

如果你用的是 Claude Code 2.1.69 或更高版本，Tool Search 已经自动启用了。

Claude Code 会检测你的 MCP 工具是否超过上下文窗口的 10%。如果超过，自动切换到 Tool Search 模式。

你不需要修改任何配置，不需要改任何代码。升级，就行了。

总结

Anthropic 的工程实践发现，在很多实际任务中，1M 上下文窗口的表现不如 200K。上下文窗口大小不是关键，资源管理的精准度才是。Tool Search 就是这个思路的实践。

有人说 Skills 可以完全替代 MCP，从技术角度看确实有一定道理。但现实是，主流厂商提供的集成，基本都是以 MCP server 的形式交付的，所以 MCP 的工具膨胀问题，短期内不会消失，Tool Search 这类优化的价值也就一直在。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-04

ContextBucket：Agent 的"无限"记忆与工作区底座

2026-06-04

写给 Codex 小白用户的全网最详细教程：从 0 到 1，把它真正用起来

2026-06-03

Kimi Work Beta 版邀你体验：你的工作，分我一半

2026-06-03

实测MiniMax M3，全链路Agent要的三块拼图终于凑齐了

2026-06-03

Agent 越能干，你越不敢放手？ANOLISA给它穿上全套防护

2026-06-03

《审慎部署智能体AI服务》指南

2026-06-03

OpenClaw 和 Hermes 没凉，浅层使用先退场了

2026-06-03

Anthropic突然上线全新CLI：一行命令操控Claude全部API

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

OpenAI Codex CLI 完整使用指南

2026-04-07

2026年国内如何注册 Claude 账号教程

2026-03-13

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

香港终于能直接用 Gemini 了，内地用户能用上吗？

2026-03-17

编程选GPT-5.4，还是GPT-5.3-Codex？

2026-03-21

GPT5.5来了，最大特点解析

2026-04-24

Claude Opus 4.7 发布，全网最详细解读

2026-04-17

大家都在问

当 AI 开始拥有“自主调度权”：Claude 4.8 这个新功能，到底有多可怕？

2026-06-03

哪些活，该交给Claude Code的 /workflows?

2026-06-02

面向 LLM 的架构设计：什么是真正的 AI Friendly 架构？

2026-06-01

如何使用Codex的Goals机制完成长程任务？

2026-05-26

Codex 的 computer use 功能，为什么这么好用？

2026-05-23

前有用友YonClaw，今有金蝶灵基，中国软件双雄的AI底牌谁能笑到最后？

2026-05-21

Harness Engineering：AI 能在真正"出事会炸"的后端系统里写代码吗？

2026-05-19

谁来给企业端即将大规模入职的Agent盖办公室？

2026-05-09

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw