微信扫码
添加专属顾问
上下文工程(CE)正成为AI领域的新范式,它通过系统性构建模型输入提升输出质量,比传统提示工程更全面高效。 核心内容: 1. CE与传统PE的本质区别:从便利贴到完整剧本的转变 2. CE五大核心组件:从系统提示到长期记忆的完整上下文体系 3. 实践价值:降低AI错误率,像厨师备菜般优化前置环节
🖌️ 本文目录:
6.25 Karpathy转发Shopify CEO的一条推文表达对"Context engineering"重要性的强调,7.19 Manus Peak发布一篇构建Agent Context engineering的经验分享文章,CE开始替代PE,成为每个能够处理好复杂任务的Agent必备的技术。
无论Manus的工程经验是否能在每个Agent产品中复用,但Karpathy的观点足够引起我的重视,毕竟他是少见的在x上不吹逼说实话又有前瞻性的人。
context中文称为“上下文”,不止用户发送给模型的内容,而是指模型生成输出前接收的所有内容。上图是目前公认的context范围,以下逐一表述:
CE代表了传统PE的范式转变。CE是一个系统,而不是一个静态的提示词模版,是在调用LLM之前的系统性的输出。
之前为提升 Agent 输出效果,主要focus在提升输出方式的路径上,例如ReAct框架,但CE强调除了关注如何响应,收集LLM完全实现其目标所需的信息也非常重要,然后才调用LLM。
如果Agent是一个厨师,炒菜过程的火候和调料顺序重要,但炒菜前的食谱、原料准备也很重要。
CE使得关注点不再focus在更智能的模型和更聪明的算法上,而是关注在为目标任务提供更准确的上下文上。
构建CE包含哪些方面——完整的CE应该在建设时check:
以下用n8n构建的Agent为例,阐述CE的内容。
系统提示词,在System prompt里需要明确提供哪些上下文能有效地执行任务,把待解决的问题拆分成核心组件,这不仅是一个简单的提示和指令,输出system prompt的过程需要实验并为模型提供重要的上下文,以最佳方式执行任务。
-- Instructions用于准确提示System要做什么
-- 有助于模型理解用户输入是什么以及希望system输出什么内容
-- <user_query> What's the latest dev news from OpenAI? </user_query>
You are an expert research planner. Your task is to break down a complex research query (delimited by <user_query></user_query>) into specific search subtasks, each focusing on a different aspect or source type.
--调用工具
The current date and time is: {{ $now.toISO() }}
--结构化输入
For each subtask, provide:
1. A unique string ID for the subtask (e.g., 'subtask_1', 'news_update')
2. A specific search query that focuses on one aspect of the main query
3. The source type to search (web, news, academic, specialized)
4. Time period relevance (today, last week, recent, past_year, all_time)
5. Domain focus if applicable (technology, science, health, etc.)
6. Priority level (1-highest to 5-lowest)
All fields (id, query, source_type, time_period, domain_focus, priority) are required for each subtask, except time_period and domain_focus which can be null if not applicable.
Create 2 subtasks that together will provide comprehensive coverage of the topic. Focus on different aspects, perspectives, or sources of information.
--结构化输出
Each substask will include the following information:
id: str
query: str
source_type: str # e.g., "web", "news", "academic", "specialized"
time_period: Optional[str] = None # e.g., "today", "last week", "recent", "past_year", "all_time"
domain_focus: Optional[str] = None # e.g., "technology", "science", "health"
priority: int # 1 (highest) to 5 (lowest)
After obtaining the above subtasks information, you will add two extra fields. Those correspond to start_date and end_date. Infer this information given the current date and the time_period selected. start_date and end_date should use the format as in the example below:
"start_date": "2024-06-03T06:00:00.000Z",
"end_date": "2024-06-11T05:59:59.999Z",以互联网上现有的工程实践和学术研究为例,阐述CE的实现重难点以及通过什么技术手段解决Agent的什么问题。
Context engineering的核心在于巧妙地组织和呈现信息给AI Agent,以引导其行为和决策,区别于Prompt engineering,通过“对话”和“示例”来塑造AI的“思维过程”。虽然潜力巨大,但绝非易事。
对于用CE构建的一个更复杂的AI系统而言,其效果真的好吗?任务失败如何定位问题?
对于此类AI系统的评估,核心是测试模型在长序列中的信息保持、位置偏差和推理连贯性,可以使用现有的许多评测集来测试,也可以by modules测试单个模块的输入输出是否准确,或者构建一些评估专家的AI系统,用一个LLM去评价另一个LLM的输出,也能作为分数之外的另一个衡量标准。
Context engineering的前提是大众已经认可了Agentic AI的长远价值,CE是对Multi-agent system应用现有问题打补丁的最佳工程实践。
如果把Agent应用比做一盘菜,那CE是让菜更加色香味俱全的调料,把现有的能吃但填不饱肚子也卖不起高价的菜做得更好吃更下饭更具备壁垒和商业价值。
但反过来想,Agentic AI并不是AGI最佳的呈现形式,完成复杂任务或许在目前的模型能力上始终无法尽善尽美,当有了更强的模型,CE价值会随着模型能力跃升而递减——当模型对上下文、工具、环境的理解趋近人类水平时,CE 会退到「安全护栏」与「个性微调」的位置,不再是“满汉全席全靠调料”。
AI更多的想象力或许不在处理复杂任务,而是更多的模态交互或更垂直的数据应用。更强的模型会让「任务完成」变得傻瓜化,Agent 的卖点不再是“能把事做完”,而是“让人愿意用它做更多事”。
因此 AGI 的额外价值空间会外溢到:
当模型逼近 AGI 时,“Agent=复杂任务执行器”的叙事会被淡化,AGI 的核心价值将转向「与人类共创意义」——让交互更自然,让决策更轻盈,让数据更增值;而 CE 则退居为「让 AI 更懂你我」的轻量旋钮,不再是撑起商业壁垒的那堵墙。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-07-01
Sonnet 5终于来了,然而Opus 4.8现在有点尴尬
2026-07-01
AI可观测性:Prompt、Tool Call、Trace、Token全链路追踪
2026-07-01
AI Infra 全景图:Agent Framework、调度、编排、沙箱、记忆管理、Tracing 分层拆解
2026-07-01
Claude Science发布:60+科学数据库一个对话搞定
2026-07-01
AI 的向量空间里藏着心理学,这是一场嵌入模型的情绪对决
2026-07-01
Claude Sonnet 5 来了:Opus 级智能,Sonnet 级价格
2026-07-01
Anthropic在Claude Code植入间谍检测你是否来自中国
2026-06-30
Context 即 Agent:下一场 AI 产品战争,是上下文之争
2026-04-15
2026-04-07
2026-04-07
2026-04-24
2026-04-17
2026-04-05
2026-04-02
2026-04-05
2026-04-14
2026-04-24
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。