我要投稿

万物皆可Agent！Anthropic官方“三步循环法”手把手教你造最强智能体

发布日期：2025-10-12 20:35:23 浏览次数： 4036

作者：AI寒武纪

微信搜一搜，关注“AI寒武纪”

Anthropic推出Claude sonnet 4.5时正式发布了Claude Agent SDK

Claude Agent SDK旨在帮助开发者在Claude上构建功能强大的自主智能体Agent

实际上，Claude Agent SDK的前身是为支持内部开发效率而生的Claude Code SDK。但在过去数月，它的应用早已超越了编码范畴，在Anthropic内部被广泛用于深度研究、视频创作、笔记整理等各种非编程任务，并已成为几乎所有主要智能体循环（agent loops）的动力核心

为了体现其更广泛的应用前景，Anthropic决定将其正式更名为Claude Agent SDK

这篇文章将深入解读Anthropic构建该SDK的初衷、如何使用它来打造自己的智能体，以及团队在实际部署中总结出的最佳实践

核心设计：给Claude一台电脑

Claude Agent SDK背后的核心设计原则非常直接：Claude需要和程序员一样，拥有相同的日常工具

这意味着，智能体需要能够在代码库中查找文件、编写和编辑文件、进行代码检查（lint）、运行、调试，并在此过程中不断迭代直至成功

Anthropic团队发现，通过终端给予Claude访问用户计算机的权限，它就获得了像程序员一样编写代码所需的一切

更重要的是，这也使得Claude在处理非编码任务时同样高效。通过运行bash命令、编辑、创建和搜索文件，Claude能够读取CSV文件、搜索网页、构建可视化图表、解读指标等，胜任各类数字工作——简而言之，成为一个拥有计算机的通用智能体

让智能体像人类一样使用计算机工作，这正是Claude Agent SDK的关键设计理念

创建新型智能体

Anthropic相信，为Claude配备一台“电脑”，能够解锁过去难以有效实现的智能体能力。利用该SDK，开发者可以构建：

金融智能体：理解投资组合和目标，通过访问外部API、存储数据和运行代码来帮助评估投资

个人助理智能体：连接内部数据源，跨应用追踪上下文，帮助预订差旅、管理日历、安排会议、整理简报等

客户支持智能体：处理高模糊性的用户请求（如客服工单），通过收集和审查用户数据、连接外部API、回复用户，并在必要时将问题升级给人类

深度研究智能体：在大型文档集合中进行全面研究，通过搜索文件系统、分析和综合多源信息、交叉引用数据，并生成详细报告

其核心是，该SDK提供了构建智能体所需的基础模块，以自动化你想要的任何工作流

构建Agent循环

在实践中，Claude通常遵循一个特定的反馈循环进行操作：收集上下文 -> 采取行动 -> 验证工作 -> 重复

这个循环为思考如何构建其他类型的智能体以及应赋予它们何种能力，提供了一个有效的框架。下面，我们将以构建一个邮件智能体为例，逐步拆解这个过程

第一步：收集上下文

开发智能体时，不能只给它一个提示，而是要让它能够获取并更新自己的上下文

智能体搜索与文件系统

文件系统代表了可以被模型调用的潜在信息。当遇到日志等大文件时，Claude会自行决定使用grep、tail等bash脚本来加载最相关的部分。本质上，智能体的文件夹和文件结构本身，就成为了一种上下文工程。例如，邮件智能体可以将过去的对话存储在名为'Conversations'的文件夹中，以便在需要时进行搜索

子智能体 (Subagents)

SDK默认支持子智能体。其优势有二：一是并行化，可以同时启动多个子智能体处理不同任务；二是上下文管理，子智能体在隔离的上下文中工作，只将相关信息返回给主控者，非常适合处理需要从海量信息中筛选少量有用数据的任务。例如，邮件智能体可以并行启动多个“搜索子智能体”，分别查询邮件历史，并只返回相关的邮件摘要

压缩 (Compaction)

当智能体长时间运行时，上下文维护至关重要。当接近上下文窗口限制时，SDK的compact功能会自动总结之前的消息，确保智能体不会耗尽上下文空间。

语义搜索

语义搜索虽然速度通常比智能体搜索快，但准确性较低，且维护更困难、透明度更差。Anthropic建议从智能体搜索开始，仅在需要更快速度或更多样化结果时才引入语义搜索

第二步：采取行动

收集完上下文后，你需要为智能体提供灵活的行动方式。

工具 (Tools)

工具是智能体执行任务的主要构建模块。它们在Claude的上下文窗口中非常突出，是模型决定如何完成任务时优先考虑的选项。因此，你需要精心设计工具以最大化上下文效率。例如，为邮件智能体定义"fetchInbox"或"searchEmails"等核心工具

Bash与脚本

Bash作为一个通用工具，能让智能体灵活地使用计算机。例如，邮件智能体可以编写代码来下载邮件附件（如PDF），将其转换为文本，然后搜索其中的关键词（如“invoice”）

    pdftotext document.pdf - | grep -n "invoice" | tail -10

代码生成

Claude Agent SDK擅长代码生成。代码具有精确、可组合和可复用的特性，是执行复杂操作的理想选择。例如，Claude.ai中创建Excel、PPT和Word文档的功能，完全依赖于生成Python脚本来实现。对于邮件智能体，我们可以让它生成代码，为收到的邮件创建自动化规则：

    async function onEmailReceived(email) {
      const isFromCustomer = email.from.includes('@customer.com') || /* ... */;
      if (!isFromCustomer) return;
    
      const isEmailUrgent = await askLLM(`Does this email seem urgent: ${renderEmail(email)}, return TRUE OR FALSE`);
      
      if (isEmailUrgent === "TRUE" && isFromCustomer) {
        forwardEmail(email, { to: 'teamlead@company.com' });
        createTask({ title: `Urgent: Respond to ${email.from}` });
      }
    }