微信扫码
添加专属顾问
我要投稿
Anthropic 官方指南,揭秘高效智能体构建的秘诀 核心内容: 1. Agent 和 Workflow 的区别与定义 2. 何时使用智能体及选择框架的建议 3. 实际应用中的 6 种常见模式
Anthropic 官方发布了一篇《如何构建高效的智能体》。
这篇文章干货满满,非常值得一读。
文章总结了他们和众多跨行业客户合作的经验。分享了他们开发智能体的经验教训和实用建议。
实践证明:真正成功的应用,往往采用简单、可组合的模式,而非复杂的框架。
还总结了 3 大核心原则,以及 6 种常见模式。
以下是我根据原文整理的核心要点。
Agent 和 Workflow 这两个词,以及它们对应的中文翻译,已经被滥用了。
所以,在构建智能系统之前,很有必要对其下一个清晰的定义。
在 Anthropic 内部,将其统称为 Agentic System(智能体系统)。
但在架构上进行了区分:
清晰的定义是很有必要的,可避免团队成员理解不一致,降低沟通成本。
建议:尽可能寻找最简单的解决方案,仅在必要时增加复杂性。
这可能意味着:很多时候,根本就不需要构建智能体系统(Agentic System)。
对于大多数应用,其实通过检索(Retrieval)和为上下文提供一些示例(Few-shots),就可以很好地完成任务了。
不要过早把问题复杂化,一切从最简单开始。
要想实现智能体系统,有很多框架可以用,比如:
框架虽然为我们提供了便利,但同时也会带来复杂度。
能直接调用大模型 API 几行代码就能实现的,就不要使用框架。
如果确实要使用框架,需确保理解框架的底层代码。
实际应用场景中,有以下 6 种常见模式。
要想深入了解这些模式的流程图及应用场景,请点击文末 ↙ “阅读原文” 查看。
很多工作流看似复杂,但实际上,多数是这些模式的组合。
模式并非一成不变的,应根据自身的实际场景进行定制和组合。
? 成功的关键:衡量性能,对实现方式进行不断迭代。
只有在复杂性能够显著改善结果时,才应考虑增加复杂元素。
开放式问题很难或无法预测所需的步骤数量,并且你无法对固定路径进行硬编码,适合使用智能体。
智能体(Agents)可以处理复杂的任务,但其实现方式往往很直接。它们通常只是大语言模型,根据环境反馈循环使用工具。
因此,清晰且周全地设计工具集及其文档至关重要。
智能体的自主性意味着更高的成本和错误加剧的可能性。建议在沙盒环境中进行广泛测试,并设置适当的防护措施。
Anthropic 提供了它们自己实现的两个智能体的实现代码,一个是 SWE-bench tasks
,另一个是 Computer Use
,原文中有代码链接。
这部分内容在文章的附录 2 中。
无论构建何种智能体,工具都是重要的组成部分。
与整体提示词一样,工具定义和规范也应得到同样多的提示工程关注。
建议:
经验法则:
在创建智能体-计算机交互(ACI)时,应参照在人机交互(HCI)上所投入的精力。即 HCI 投入多少精力,就应该在 ACI 上投入等量精力。
Anthropic 声称:他们在构建 SWE-bench
智能体的过程中,花在优化工具上的时间,比优化整体提示词的时间更多。
在大模型领域,成功的关键不是做最复杂的系统,而是做适合自己的正确的系统。
从简单的提示词入手,通过全面评估对其进行优化,只有在更简单的解决方案无法满足需求时,才添加多步骤的智能体系统,以避免不必要的复杂设计导致诸如更高的延迟、成本,以及更难调试等问题。
遵循三条核心原则:
如果早期使用了框架快速构建的应用,可以重构为使用基础组件实现的,应该毫不犹豫地重构。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-07-13
AI 智能体协议解构:MCP、A2A、AG-UI
2025-07-13
AI圈演义:我躺平两年多,终于看懂了这场“智能的游戏”
2025-07-13
结果交付:企业级LLM+MCP+RAG+Agent融合架构正在重构AI基建标准!
2025-07-13
RAG-Anything:多模态RAG的全能王者,AI文档处理的终极形态!
2025-07-13
深度|a16z内部复盘:AI社交产品或许从根本上就不成立,AI只是模拟“表达”,从未触碰“关系”本身
2025-07-13
飞书搞了个AI分级体系,一上线就把一堆产品打回原形了
2025-07-13
Auto Agent:气宗还是剑宗?——Workflow 还是强大模型?
2025-07-13
“内卷”到向量空间:Qwen3-Embedding 是真香还是跟风?
2025-05-29
2025-05-23
2025-04-29
2025-04-29
2025-05-07
2025-05-07
2025-05-07
2025-06-01
2025-05-07
2025-04-17
2025-07-13
2025-07-13
2025-07-13
2025-07-13
2025-07-10
2025-07-10
2025-07-10
2025-07-09