我要投稿

别卷 Prompt 了，上下文工程正在淘汰你

发布日期：2025-10-09 12:32:39 浏览次数： 2083

作者：洛小山

微信搜一搜，关注“洛小山”

AI Agent 应用的竞争逻辑，正在发生根本性变化。

当许多团队还在死磕提示词优化（PE 工程）时，一些优秀团队开始重心转向了上下文工程 (Context Engineering) 。

国庆期间，我反复研读一些 AI 上下文工程资料。今天，我想基于Anthropic 发布blog，和你聊聊这个将成为 AI 产品新护城河的系统性工程。

这篇文章介绍如何有效构建 Agent 环境，其中主要的观点是：AI Agent 应用关注的重心，正在从「提示词工程（Prompt Engineering）」，迅速转向「上下文工程（Context Engineering）」。

这个方案的变化，标志着 AI Agent 产品设计与竞争的逻辑进入了下一个阶段：一个更加精细化管理，更能拉开不同团队 AI 工程化效果的阶段。

互联网黑化叫做：深水区。

感兴趣的话，也可以点文章最后的「阅读原文」查看英文资料。

01｜提示词工程的辉煌和它的局限性

在过去几年，我们投入了大量精力去研究和优化提示词（Prompt）。

我们学习怎样向 AI 下达更清晰的指令、提供更丰富的背景，以及通过少量例子来引导大模型，这一切都是为了在单次交互中获得尽可能惊艳的结果。

这个阶段，整个行业的普遍迷信更大的上下文窗口（Context Window），好像长上下文就能带来更强的智能，似乎只要把所有相关资料都灌给大模型，大模型就能解决我们需要一切。

于是，去年 3 月份开始，以 Kimi 为代表，开始卷大模型的上下文长度。

各家模型厂商纷纷卷了起来…

但最近随着 AI Agent 应用的迭代，各位 Agent 开发者用实践证明，纯 PE 的这条路很快就遇到了瓶颈。

这篇文章指出：大型语言模型在处理信息时，存在注意力预算（Attention Budget）的限制。

当上下文窗口被海量、未经筛选的信息填满时，模型的性能并不会线性提升，反而会因为信息过载而下降，产生所谓的「上下文衰减（Context Rot）」。

也就是说模型会忘记或忽略上下文开头或中间的关键信息，导致输出结果的连贯性和准确性大幅降低。

同时，基于传统单条提示词 + 参考资料的 PE 范式，正在被上下文工程淘汰。

上下文工程到底是个啥？下图直观地展示了两种模式的根本区别：

同样做一个 Agent 应用，左侧的提示词工程，是一条单向、一次性的路径。而右侧的上下文工程，则是一个动态、循环的系统。

强调在将信息送入模型之前，必须经过一道关键工序：策展（Curation）。

我简单做了一个对比的表：

02｜上下文工程的三大核心策略

上下文工程的本质，是一套关于如何为AI精心筛选和管理信息的系统性方法论。

它不再追求将所有信息都塞给模型，而是追求：尽可能在任务的每一个环节，都为模型提供最优的信息组合。

根据Anthropic的实践，我们可以将其归纳为三大核心策略。

策略一、优化窗口内的信息流：动态压缩（Compaction）

为了解决长对话中的信息遗忘问题，最直接的方法是在上下文窗口接近上限时，对上下文内容进行智能压缩。

不过，这不是简单的粗暴总结，而是一个保留关键决策、待办事项和核心上下文的提炼过程。

在文章中提到了一个Claude 玩宝可梦的 Agent，这个实验中清晰地展示了这个方案。

系统通过一个循环的「摘要 / 管理」模块，让Claude能够持续地总结游戏进展，这样能让 AI 在长达好几个小时的游戏过程中保持目标和记忆的连贯性。

下图是我翻译了关键说明的版本，如果微信压缩了，可以后台留言「宝可梦」获得高清大图。

通过这种方式，AI获得了在长时间任务中进行自我反思和状态跟踪的能力，确保「注意力预算」始终用在最关键的信息上。

但我个人在业务上的尝试发现，即便动态摘要，假设用户的内容都很重要不太好放弃的话…迟早还是会达到大模型上下文上线的。

策略二、突破窗口的物理限制——持久化记忆（Persistent Memory）

大模型上下文窗口终究是有限的，它类似计算机的内存一样，断电就消失了。

如果想要让 AI 具备长期记忆和真正的个性化能力，就必须为它配备一块硬盘：持久化的外部记忆模块。

上下文工程通过赋予 AI 调用工具的能力，使得大模型能够随时读写外部的知识库或笔记文件。

这同样在宝可梦的 Agent 里得到了体现，AI可以通过工具随时更新自己的「知识库」，记录下它的关键发现和个人的偏好。

还是这张图，为了避免你翻页，我再贴一下。

这个策略使得 AI 能够超越单次对话的限制，对用户和项目知识的理解得以沉淀，这是构建能与用户共同成长的、真正伙伴式 AI 的基础。

策略三、分解复杂任务的上下文：子智能体架构（Sub-agent Architectures）

当 AI 面临一个极其复杂的、需要多种专业能力的任务时，让单一 AI 承载所有上下文和工具，通常会导致混乱和低效。

Anthropic 里给出的更优的策略是「分而治之」。

子智能体架构，就是将一个相对宏大目标分解，交给多个专职的子 Agent 协同完成。

每个子Agent都拥有自己独立的、高度优化的上下文环境，专注于解决特定的子任务。

例如，在文章中的一个例子里，一个中心化的 Agent 将开发任务分解，并协同调度四个子Agent分别处理邮件、搜索、总结和清理等不同工作。

这种架构极大地降低了单个模型的认知负担，通过上下文的隔离和分发，实现了系统整体性能和稳定性的提升。

这是另一篇关于多 Agent 设计的 blog，推荐。

https://www.anthropic.com/engineering/multi-agent-research-system

03｜从理论到实践：上下文工程的价值

上下文工程不仅是理论上的进步，更在实践中带来了可量化的性能提升。

Anthropic的内部数据显示，无论是集成Slack还是Asana的工具，经过针对模型特性进行精心设计和优化的版本（即应用了上下文工程思想的版本），任务完成的准确率都显著高于仅由人类工程师按常规思路编写的版本。

这些数据有力地说明，AI 产品的性能上限，不仅取决于模型本身的能力，更取决于我们围绕模型所构建的「信息整理系统」的精巧程度。

换言之，就是有效的 AI 工程化方案，能让你的产品显著和其他产品拉开差距。

无论是成本，还是产品效果。

对工具返回格式的细微调整（例如提供concise或detailed选项让AI自行选择），也能有效提升交互效率和任务成功率。

终｜上下文工程将成为你新的护城河

这篇文章看起来简简单单，但这对我们这些身处牌桌上的产品经理、创业者和管理者，意味着什么？

我觉得，上下文工程的兴起其实是为所有 AI 产品和创业者明确了新的战略焦点：

未来 AI 产品的核心竞争力，开始从追基础模型的原生能力，转向开发者对大模型的架构能力。

对于我们来说，我们需要转变思维，开发的工作重心需要从单纯地追求更好的模型转向设计更高效的、符合产品定位的上下文工程化架构。

毕竟，现在大模型基模的能力快到边界，基模也卷不动了。

换言之，以后你的产品的护城河，将不再是你调用了哪个最牛逼的模型，因为模型能力会迅速趋同。

接下来要卷的，在于：

你的 AI 动态压缩机制设计得有多智能？
你的 AI 持久化记忆架构得有多高效？
你的 AI 子流程拆解得有多丝滑？

这些，共同构成了你的上下文管理的架构，这些就算是恶意用户都根本没办法像提示词那样套出来。

它才是真正无法被轻易复制的核心竞争力。

上面说了对产品的要求，我个人认为开发者的组织构成，或者说团队能力模型也需要随之做一定的调整。

得益于 Vibe Coding 的崛起，对于产研团队的核心能力，也需要从提示词调优技巧的提升，扩展到信息流管理、智能体协同设计和动态数据策展等等这样的系统工程能力。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-11-24

谈LLM应用层目前推荐的新功能研发范式

2025-11-24

一文说清 Agentic AI：基于 LLM 的智能体进化史

2025-11-24

我来彻底说说 AI 上下文工程（下）

2025-11-24

Nano Banana Pro 完全指南！

2025-11-24

Cursor看了都要菊花一紧！Google AntiGravity 官方教程生猛来袭！

2025-11-24

不服 Gemini 3！Claude 祭出 Skills“反杀” 器！

2025-11-24

麦肯锡最新重量级报告：《The State of AI》全球企业AI应用现状——AI飞速普及，但能转化成利润的企业，只有 6%

2025-11-24

Hugging Face CEO预警：AI泡沫将破，无人幸免！

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

从需求场景出发的AI应用项目落地方法论

2025-09-19

实测 Sora 2 ：AI视频的“ChatGPT时刻”来了？八大场景教你解锁各种玩法（附邀请码）

2025-10-02

新版 GPT-5 刚刚发布，最卷 AI 连肝代码 7 小时，编程工具大洗牌开始了

2025-09-16

马斯克 Grok imagine 完整使用指南：工具、案例、提示词，看这一篇就够了！

2025-10-26

AI大家说 | 下一代AI创业的机会在哪里？定价趋势是什么？

2025-09-08

阿里发布下一代企业级智能体开发框架AgentScope 1.0

2025-09-17

RagFLow v0.20.X全面解析！双向MCP、Agentic智能体...这次真的起飞了！（附长图）

2025-09-29

Qwen3-Coder与Claude Code深度对比：谁是你的AI编程助手？

2025-09-14

一文速览OpenAI Dev Day 2025，下半年开始大洗牌

2025-10-07

Claude Sonnet4.5发布，号称世界最强模型，超越gpt-5-codex

2025-09-30

大家都在问

彻底搞懂 A2A 是什么、和 MCP 的区别、前身和与未来趋势、对打造 Agent 产品的影响？

2025-11-23

如何利用 Google NotebookLM 实现精准、可溯源的内容生成呢？

2025-11-19

Snowflake CEO 复盘：为什么 LLM 时代企业需要一个 AI Data Cloud？

2025-11-19

为什么Mac在AI时代更有性价比？

2025-11-19

EI Search：生成式AI时代的知识探索新范式？

2025-11-18

Kosmos发布：一个让博士生“失业"的科研AI？

2025-11-18

oLLM 如何在 8GB 3060 Ti 上实现 100k 上下文推理？

2025-11-17

这种全新的交互方式，会成为未来AI应用的标配吗？

2025-11-15

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

别卷 Prompt 了，上下文工程正在淘汰你

01｜提示词工程的辉煌和它的局限性

02｜上下文工程的三大核心策略

03｜ 从理论到实践：上下文工程的价值

终｜上下文工程将成为你新的护城河

03｜从理论到实践：上下文工程的价值