我要投稿

Anthropic 祭出杀手锏：你可能错过了 Agent 架构的真正巨变

发布日期：2026-03-31 05:45:15 浏览次数： 1823

作者：大迁世界

微信搜一搜，关注“大迁世界”

本月，Anthropic 披露了两项重磅更新。根据我在各大开发者社区的观察，多数人仅将其视为常规的功能迭代。然而，程序化工具调用（Programmatic Tool Calling）与网页搜索动态过滤（Web Search Dynamic Filtering）的背后，实则隐藏着同一种核心逻辑的两种呈现。它们共同释放出一个前所未有的信号：严谨的 AI Agent 架构正在发生质变。

究竟什么是“上下文税”？在你意识到之前，它可能已经拖慢了你的整个系统。在标准的工具使用流程中，这一模型调用工具，返回结果填充上下文，它再次阅读、决策并循环往复。每一次往返都在重新采样，每一条中间数据都在蚕食你的窗口。

当你试图构建一个包含五个以上连续调用的 Agent 时，痛感会变得极其写实。令牌（Token）成本在叠加，延迟在加剧。最令人意外的是，随着无关噪音塞满上下文，回答质量反而会因“锚定”在无用信息上而出现滑坡。网页搜索更是重灾区——一次简单的检索往往会把导航栏、侧边栏和页脚等数万个字符的 HTML 垃圾塞进大脑，只为寻找其中那三句关键信息。

拆解“程序化工具调用”的底层逻辑

虽然名字听起来晦涩，但其本质非常纯粹。相比于让智能实体逐个发起 API 请求，它现在能直接撰写一段 Python 脚本，将你的工具作为函数进行内部调用。这段代码运行在安全的沙箱容器中，所有的中间过程都留存在容器内部。最终，只有你需要的结果——无论是 print() 的日志还是计算出的数值——才会返回给模型。

你只需在工具定义中添加一个极简的字段即可开启：

{
  "name": "query_database",
  "description": "执行 SQL 查询。返回 JSON 对象格式的行数据。",
  "input_schema": { ... },
  "allowed_callers": ["code_execution_20250825"]
}

那个 allowed_callers 字段便是通往新世界的钥匙。一旦设定为 ["code_execution_20250825"]，该 Agent 就能在生成的代码中调度此工具；否则，它将退回到传统的交互模式。

其执行逻辑如下：

模型撰写 Python 脚本，以异步函数的形式调用你的工具。
代码在隔离的沙箱容器中启动。
当代码内部触发工具时，执行会暂时挂起，API 将抛出一个 tool_use 块。
你提供结果后，容器继续运行。
脚本结束后，该 Agent 仅获取最终产出并给出响应。

这意味着所有的原始查询结果、杂乱的 JSON 格式和 API 原始响应都不会进入上下文。它们在沙箱中被精准处理后即被抛弃。

为什么 Token 数学题从此改变了？

让我们看一个具体的案例：你需要构建一个查询五个大区销售数据并找出冠军的 Agent。在旧方案下，你需要五次采样、五次原始数据回流。而利用程序化调用，它只需写下一段精简的循环代码并运行一次：

regions = ["West", "East", "Central", "North", "South"]
results = {}

for region in regions:
    data = await query_database(f"SELECT SUM(revenue) FROM sales WHERE region='{region}'")
    results[region] = data[0]["revenue"]
top = max(results.items(), key=lambda x: x[1])
print(f"Top region: {top[0]} - ${top[1]:,}")

在这个场景中，只有那行 print 的结论会返回给上下文。根据官方文档，程序化调用 10 个工具与直接调用相比，令牌消耗量降低了近 10 倍。这并非边际优化，而是对于高吞吐量数据型 Agent 的降维打击。此外，诸如“提前终止循环”、“根据文件大小动态选择读取方式”以及“在 10,000 行日志中仅筛选末尾错误”等复杂编排，现在都能由模型自动实现。