我要投稿

Anthropic长文拆解上下文工程落地策略与实践

发布日期：2025-09-30 12:54:45 浏览次数： 1800

作者：AgenticAI

微信搜一搜，关注“AgenticAI”

把 200 k token塞满很容易，让模型在长上下文仍能够大海捞针却很难。Anthropic 在29号的官方长文里系统梳理了"上下文工程"（Context Engineering）这一新兴方向。本文将其进行技术拆解与压缩，务必让你快速掌握上下文工程。

1. 提示词工程的尽头是上下文工程

提示词工程主要关注的是怎么写，而上下文工程关注的则是给什么。Anthropic认为上下文工程是提示词工程的自然演化：当 Agent 运行多轮、系统指令、工具、MCP、外部数据、消息历史记录不断涌入时，根据大海捞针的测试，随着上下文窗口中Token数量的增加，模型准确回忆该上下文信息的能力会下降。

因此，我们需要制定策略来管理整个上下文状态，所以问题也就从如何写一条好提示升级为如何在每一轮只让模型看到最小充分信息集——这就是上下文工程的新战场。

faa261102e46c7f090a2402a49000ffae18c5dd6-2292x1290

2. 有效上下文工程剖析

提示应清晰、简洁且直接，避免过度复杂的 if-else 逻辑或假设共享上下文。我们建议将提示组织成不同部分（如背景信息、指令等），并用简单的标记语言（如 XML 或 Markdown）加以区分。随着模型功能增强，格式可能变得不那么重要。

系统提示

要用最少的信息概括预期行为，这并不等于简短，而是精确。通过初步测试模型的反应，识别问题并调整提示以提高性能。

工具的设计

至关重要，既能提升效率，又能避免功能过多导致决策模糊。为 AI智能体构建一个简洁、功能明确的工具集有助于长期稳定地管理上下文。

示例的设计

在提供示例时，应避免过度列举边缘情况，转而通过少量多样的标准示例有效引导模型行为。

总的来说，上下文应简明、具体且充实，以确保代理行为符合预期。

3. 上下文检索和Agentic检索

在《Building effective agents》中，他们定义了智能体为能在循环中自主使用工具的 LLM。随着模型功能的提升，Agent的自主性逐渐增强，能够独立探索问题并从错误中恢复。如今，许多 AI 应用采用基于RAG的方法为Agent提供重要的推理上下文。

“即时”情境策略不需要预先处理所有数据，而是通过维护轻量级标识符（如文件路径、查询、Web 链接）来动态加载数据。这种方法让Agent像人类一样按需检索信息，而不是记住全部数据。通过引用元数据（如文件夹层级、命名约定、时间戳等），Agent能够有效优化行为并逐步发现相关情境。

虽然运行时探索比预检索数据要慢，但合理的工具设计和启发式方法能提高效率。在某些任务中，混合策略（如预检索部分数据并进一步自主探索）可以更有效地平衡速度与自主性。Claude Code 就是采用这种方法，通过预加载文件并实时检索来避免过时索引和复杂语法问题。

所以这就是我一直推崇使用Cline式的主动探索式构建RAG的原因，虽然会牺牲实时性，但是只要前端有一定的反馈，用户体验式不会差的。

对于长期任务，Agent需要跨越上下文窗口的限制。压缩、结构化笔记和多智能体架构是应对这一挑战的技术。

压缩通过总结上下文历史，避免信息过载。

结构化笔记允许代理在上下文窗口外记录关键信息，保持任务一致性。

子代理架构则通过分配任务给专门的子代理，避免单个代理维护过多状态，提高任务处理效率。

这些技术可以根据任务需求灵活选择：压缩适用于对话任务，笔记记录适合迭代开发，而多代理架构则在复杂研究任务中表现优异。

总结

上下文工程代表了我们构建 LLM 时的根本转变。随着模型能力的提升，挑战不再仅仅是设计完美的提示，而是如何精心挑选每一步输入模型的关键信息，以最大化结果的可能性。不论是处理长周期任务的压缩、设计高效的工具，还是让代理按需探索环境，核心原则始终不变

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-01-02

2025四大AI怎么选？每月20美金，谁能当你的“全能外挂”？

2026-01-02

Google 发布研究型 Agent

2026-01-02

Gemini CLI V0.22发布了Conductor和Endor Labs并向Free Tier用户开放了Gemini 3

2026-01-02

AI Agent 重构SoR：从记录系统到决策系统的范式转移

2026-01-02

深度解析：为何私有化部署的满血版DeepSeek在企业场景下的多任务协作表现不佳，以及如何优化

2026-01-02

Agent圣经（四）| 一文搞懂Function Call、MCP、Skills

2026-01-02

深度｜从Monica到Manus，肖弘为什么会成功

2026-01-02

OpenAI前首席科学家Ilya Sutskever：规模神话的终结，回到研究时代

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

马斯克 Grok imagine 完整使用指南：工具、案例、提示词，看这一篇就够了！

2025-10-26

一文速览OpenAI Dev Day 2025，下半年开始大洗牌

2025-10-07

我挖到Gemini 3.0 Pro十大隐藏玩法，做网页已经落后N个版本了

2025-11-19

2025-10-20

深度体验TRAE SOLO 正式版，总结一点技巧(附完整可重现提示词和源码)

2025-11-13

从spec-kit到OpenSpec：规格驱动开发如何解决项目迭代痛点？

2025-10-18

英特尔发布“2纳米级”工艺CPU，你的AI PC性能即将暴涨50%

2025-10-11

实测｜DeepSeek-V3.2-Exp三大升级：长文本、多轮对话、开发支持

2025-10-21

ChatGPT 成人模式要来了，但作为成年人我一点都不高兴

2025-10-15

一万两千字，教你用ClaudeCode，解锁10倍生产力。

2025-10-09

大家都在问

2025四大AI怎么选？每月20美金，谁能当你的“全能外挂”？

2026-01-02

AGI的终极形态，是分布式集体智能？

2025-12-31

Manus联合创始人张涛：智能体Agent的终极形态是什么？

2025-12-31

Claude skills 底层逻辑是什么？

2025-12-31

LLM、RAG、微调、多模态，这些概念的「产品意义」是什么？

2025-12-30

谷歌没想到：Antigravity 竟成了 Claude Code 的“免费充电宝”？

2025-12-30

为什么大多数 Agent 项目，最终都没能跑进核心业务系统？

2025-12-25

一口气看完了200+企业的300多个AI案例，我发现了什么？

2025-12-25

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean