我要投稿

OpenAI分享了一份上下文工程实用指南。

发布日期：2025-07-30 18:20:52 浏览次数： 2265

作者：探索AGI

微信搜一搜，关注“探索AGI”

OpenAI的产品负责人 Miquel 联合Piotr 发布了一份超全面的Context Engineering 深度指南（原文付费，主要是图多，还给了例子~）

到底什么是 Context Engineering

简单说，Context Engineering 的核心是构建一套系统，高效地为LLM的上下文窗口（Context Window）填充最优质的内容，从而最大化模型的性能。

如果你觉得提示词工程（Prompt Engineering）就是全部，那格局就小了。

提示词工程只是在用户与AI交互的最后一环做文章。

而上下文工程是一个更广阔的战场，它涵盖了在生成提示词之前的所有准备活动——从数据检索、筛选到信息组装，它是一个完整的系统工程。

上下文工程

给AI提供的6种核心上下文

那么，我们到底在给模型的上下文中“喂”些什么呢？共有6种核心类型：

指令 (Instructions): 最直接的命令，告诉模型“你要做什么”。
范例 (Examples): 也就是Few-shot，给模型几个例子，让它照着学。
知识 (Knowledge): 从外部数据源（如RAG）检索到的信息，作为回答的依据。
记忆 (Memory): 存储过去的对话历史，让AI有“记忆力”。
工具结果 (Tool results): 调用API或外部工具后返回的结果。
工具 (Tools): 告诉模型它有哪些工具（API、函数）可以用。

这6种核心内容共同构成了一个AI Agent的“世界观”和“行动力”。

6种核心上下文类型

RAG只是其中一环，别神话了！

聊到上下文，很多人第一反应就是RAG（检索增强生成）。RAG是上下文工程中最关键的一环，但它不是全部。

一个完整的RAG流程通常分为三步：

信息检索 (Information Retrieval): 从向量数据库、API等外部源拉取数据。
上下文组装 (Context Assembly): 将检索到的数据进行结构化、过滤，塞进提示词。
生成 (Generation): LLM基于组装好的上下文生成最终回复。

上下文工程主要关注前两步，即“检索”和“组装”。它决定了最终送到LLM的内容质量如何。

RAG流程与上下文工程的关系

信息检索的进化

信息检索技术本身也在疯狂进化。别再以为RAG就是简单地做个向量检索了，我们来快速扒一扒它的几种主流范式。

这个章节是个带交互的图，完全免费，地址在这： https://rag.productcompass.pm/

1. Vanilla RAG

最基础的版本，直接“检索+生成”，简单粗暴，效果也最拉胯。

Vanilla RAG

2. Standard RAG

进阶版，加入了“查询重写”和“结果重排”，先优化问题，再筛选答案，质量更高。

Standard RAG

3. 缓存增强生成 (CAG)

它不检索，而是提前把可能用到的信息“缓存”到上下文里。适合数据稳定且上下文窗口够大的场景。

CAG

4. Hybrid RAG

大力出奇迹，把多种检索方法（向量、关键词、知识图谱等）全用上，追求最全面的信息。

Hybrid RAG

5. 假设性文档嵌入 (HyDE)

它先让LLM根据你的问题，脑补一篇“完美的答案”（假设性文档），然后再用这个脑补的答案去匹配真实文档，据说能解决查询和文档之间的语义鸿沟。

HyDE

6. Agentic RAG

在这里，AI Agent会自己决定何时、何地、如何去检索信息，它能进行动态规划和多步推理。简单来说，AI从一个被动的查询者，变成了主动的思考者和决策者。

Agentic RAG

上下文组装 - Context Assembly

找到了信息，怎么“喂”给模型又是一门学问。这就是上下文组装（Context Assembly）要解决的问题。

目标很简单：提供最精简、最相关、结构最清晰的信息。

这需要一系列技术，比如信息压缩、重新排序、格式化等。

例如，使用XML这样的结构化格式，可以清晰地划分不同类型的上下文，极大地帮助模型理解任务。

作者提供的lovable bug fixing Agent的示例：https://github.com/phuryn/examples/blob/main/prompts/context_engineering/bug_fixing_agent_context.xml

n8n示例

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-28

谷歌放弃 Gemini CLI，转头用 Go 写了个新玩具 Antigravity CLI

2026-05-28

Claude code云端部署 & 魔改sdk实现http流式调用保姆级教程

2026-05-28

“不用AI的CEO，我会亲自干掉他！”亿万富翁马克·库班最新对话：看好Claude，但奥特曼迟早被自己反噬

2026-05-27

我把 OpenAI Codex 官方案例全跑了一遍

2026-05-27

一个Agent工程师听完VC的2小时播客后想通的事

2026-05-27

考虑把 Claude Code 全量切换到 Grok Build 了

2026-05-27

从透明开发到系统工程：AgentScope 2.0 发布

2026-05-27

大神Karpathy 发明 autoresearch，仅用 Markdown 就做出了自动化研究循环

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

OpenAI Codex CLI 完整使用指南

2026-04-07

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

2026年国内如何注册 Claude 账号教程

2026-03-13

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

香港终于能直接用 Gemini 了，内地用户能用上吗？

2026-03-17

编程选GPT-5.4，还是GPT-5.3-Codex？

2026-03-21

GPT5.5来了，最大特点解析

2026-04-24

刚刚，GPT-5.4 发布，百万上下文、最强全能模型

2026-03-06

大家都在问

如何使用Codex的Goals机制完成长程任务？

2026-05-26

Codex 的 computer use 功能，为什么这么好用？

2026-05-23

前有用友YonClaw，今有金蝶灵基，中国软件双雄的AI底牌谁能笑到最后？

2026-05-21

Harness Engineering：AI 能在真正"出事会炸"的后端系统里写代码吗？

2026-05-19

谁来给企业端即将大规模入职的Agent盖办公室？

2026-05-09

鹅厂员工觉得好的code模型应该具备什么能力？

2026-05-09

Markdown要被抛弃了？Claude Code工程师自曝：我已彻底放弃使用Markdown！团队倾向使用HTML！网友：其他编辑工具会被淘汰吗？

2026-05-09

AI吞噬软件的叙事要分化了？

2026-05-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部