微信扫码
添加专属顾问
探索AI智能体高效运作的关键:上下文工程如何优化LLM性能并降低成本。 核心内容: 1. 上下文工程的定义与核心组件解析 2. 从提示工程到智能体工具的三大发展阶段 3. 当前面临的主要挑战与优化解决方案
著名AI专家 Andrej Karpathy 曾将大型语言模型(LLM)比作一种新型操作系统,其中LLM是CPU,而其上下文窗口(Context Window)则是RAM。正如操作系统需要精心管理内存(RAM)一样,我们在构建智能体时也必须高效地管理模型的“工作记忆”——上下文窗口。当智能体执行长时程、多步骤任务时,不断累积的指令、工具调用反馈和知识会迅速填满上下文窗口,导致成本飙升、延迟增加,甚至引发上下文中毒(Context Poisoning)、上下文分心(Context Distraction)等性能退化问题。“上下文工程”(Context Engineering)正是解决这一挑战的艺术与科学,它专注于在智能体运行的每一步,都为其上下文窗口精确填充“恰到好处”的信息。
DeepMind的工程师Philipp Schmid对上下文工程的理解如下:
如图所示,他将系统提示词(System Prompt)、指令(Instruction)、长期记忆(LongTerm Memory)、可用工具(Tools)、用户提示词(User Prompt)以及召回信息(Retrieved Infomation)、历史对话等短时记忆(History)甚至是结构化的输出(Structured Output)统称为上下文。
Chroma的首席执行官Hammad Bashir在他的一次演讲中,将上下文的定义总结为下图:
虽然和Philipp Schmid的图不完全一样,但是都大体的含义是一样的,即:上下文不止包括用户输入的单、多轮对话prompt与回答,也包括能够调用的工具、能够合作的智能体等“工具”,同时还包括“长期/短期记忆”、“环境状态”等抽象的概念。
AI智能体的核心工作模式是在LLM调用和工具调用之间进行循环,利用工具的反馈来决定下一步行动。这个过程必定会产生大量的上下文信息。
随着任务的进行,来自工具调用的上下文会不断累积,这种会直接导致多种严重问题:
针对目前的上下文问题,业界涌现出四大策略:写入(Write)、选择(Select)、压缩(Compress) 和 隔离(Isolate)。
“写入”是指将信息保存到上下文窗口之外的存储中,以便将来使用。
便笺是一种在单次任务会话中供智能体使用的“临时记事本”。它允许智能体在执行任务时记录中间思考、计划或重要发现,而无需将这些信息始终保留在上下文窗口中。
与便笺的“会话内”特性不同,记忆旨在实现跨会话的长期信息持久化。这使得智能体能够从过去的交互中学习和成长。如今,像 ChatGPT、Cursor 等主流产品都已经内置了基于用户交互自动生成和管理长期记忆的机制。
“选择”是指在需要时,从外部存储中精准地拉取相关信息并注入到当前上下文窗口中。
选择机制与写入机制相对应。如果便笺是工具,智能体可以通过调用读取工具来获取信息。如果记忆存储在数据库中,就需要一套高效的检索机制。记忆可以分为不同类型,以服务于不同目的:
选择的要点在于确保相关性。简单的实现是始终加载固定的规则文件,如Claude Code使用的CLAUDE.md。而更复杂的系统(如ChatGPT)则使用 嵌入(Embeddings)或知识图谱(Knowledge Graphs) 来索引海量记忆,并进行语义检索。
当智能体拥有大量工具时,它可能会因为工具描述重叠而感到困惑。对工具描述应用RAG(检索增强生成)是一种有效的解决方案,它能根据当前任务动态选择最相关的工具,有研究表明这能将工具选择的准确率提高3倍。对于知识的检索,RAG同样至关重要。
“压缩”是指在保留任务所需核心信息的前提下,尽可能减少上下文中的Token数量。
这种方法通常使用一个LLM来提炼和浓缩信息。例如,当Claude Code的上下文窗口使用率超过95%时,它会自动触发“auto-compact”功能,对整个用户-智能体交互轨迹进行总结。总结可以应用于不同层面:对整个对话历史进行递归或分层总结,或在特定节点对高Token消耗的工具输出(如网页搜索结果)进行后处理。
与使用LLM进行智能总结不同,裁剪通常依赖硬编码的启发式规则来过滤或“修剪”上下文。最常见的方法是简单地移除消息列表中最旧的消息。更高级的方法,如Provence,是训练一个专门用于问答场景的上下文修剪器。
“隔离”是指将上下文分解到不同的单元中,以降低单个上下文窗口的复杂性并实现关注点分离。
将一个复杂任务分解给多个专职子智能体是隔离上下文最流行的方式。每个子智能体都有自己独立的上下文窗口、指令集和工具集,可以并行处理不同子任务。Anthropic的多智能体研究系统证明,这种架构的性能远超单个大型智能体,因为每个子智能体的上下文窗口都可以更专注于一个狭窄的子任务。当然,其挑战在于更高的Token总消耗量和复杂的任务规划与协调。
另一种隔离方法是使用沙箱环境。例如,HuggingFace的CodeAgent并不直接调用工具API,而是生成可执行代码。这些代码在一个隔离的沙箱中运行,只有必要的返回值才会被传回给LLM。这种方式非常适合处理和隔离高Token消耗的对象(如图片、音频文件),只需在沙箱中将其赋值给一个变量,即可在后续步骤中复用,而无需将庞大的数据本身放入LLM的上下文中。
一个精心设计的运行时状态对象(State Object)本身就是一种强大的隔离机制。通过定义一个包含多个字段的模式(Schema),我们可以将提供给LLM的消息(如messages字段)与其他仅供程序逻辑使用的信息(如工具调用的原始JSON输出)分离开来。这样,LLM只看到它需要看到的信息,而其他上下文则被安全地隔离在状态对象的其他字段中。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-07-03
开发者转向 AI 应用工程,真正要迁移的是工程判断力
2026-07-02
不改一行代码,看透 AI Agent 的每一次调用
2026-07-02
AI 不缺智商缺纪律:一场 Harness 工程化实践
2026-07-02
天工 3.2 重磅升级:Skywork Tags 上线,给 Agent 一张工牌,邀其加入你的工作群聊
2026-07-02
Context Infra 会是 AI 领域的下一个热点
2026-07-01
一文了解|SkillScan 智能体技能安全扫描最佳实践
2026-07-01
协作的逆向演进:从 Agent 逻辑重构团队管理
2026-07-01
港科大郭毅可谈Agentic AI时代的核心命题:人机共生,人不可能退场
2026-04-15
2026-04-07
2026-04-07
2026-04-24
2026-04-17
2026-04-05
2026-04-05
2026-04-14
2026-04-24
2026-04-22
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。