微信扫码
添加专属顾问
我要投稿
OpenAI最新发布的上下文工程指南,揭示了超越提示词工程的AI性能优化新战场,助你打造更智能的AI系统。 核心内容: 1. 上下文工程的核心概念与6种关键上下文类型 2. RAG技术在上下文工程中的实际应用与流程解析 3. 信息检索技术的最新进化趋势与实用案例
OpenAI的产品负责人 Miquel 联合Piotr 发布了一份超全面的Context Engineering 深度指南 (原文付费,主要是图多,还给了例子~)
简单说,Context Engineering 的核心是构建一套系统,高效地为LLM的上下文窗口(Context Window)填充最优质的内容,从而最大化模型的性能。
如果你觉得提示词工程(Prompt Engineering)就是全部,那格局就小了。
提示词工程只是在用户与AI交互的最后一环做文章。
而上下文工程是一个更广阔的战场,它涵盖了在生成提示词之前的所有准备活动——从数据检索、筛选到信息组装,它是一个完整的系统工程。
那么,我们到底在给模型的上下文中“喂”些什么呢?共有6种核心类型:
这6种核心内容共同构成了一个AI Agent的“世界观”和“行动力”。
聊到上下文,很多人第一反应就是RAG(检索增强生成)。RAG是上下文工程中最关键的一环,但它不是全部。
一个完整的RAG流程通常分为三步:
上下文工程主要关注前两步,即“检索”和“组装”。它决定了最终送到LLM的内容质量如何。
信息检索技术本身也在疯狂进化。别再以为RAG就是简单地做个向量检索了,我们来快速扒一扒它的几种主流范式。
这个章节是个带交互的图,完全免费,地址在这: https://rag.productcompass.pm/
最基础的版本,直接“检索+生成”,简单粗暴,效果也最拉胯。
进阶版,加入了“查询重写”和“结果重排”,先优化问题,再筛选答案,质量更高。
它不检索,而是提前把可能用到的信息“缓存”到上下文里。适合数据稳定且上下文窗口够大的场景。
大力出奇迹,把多种检索方法(向量、关键词、知识图谱等)全用上,追求最全面的信息。
它先让LLM根据你的问题,脑补一篇“完美的答案”(假设性文档),然后再用这个脑补的答案去匹配真实文档,据说能解决查询和文档之间的语义鸿沟。
在这里,AI Agent会自己决定何时、何地、如何去检索信息,它能进行动态规划和多步推理。简单来说,AI从一个被动的查询者,变成了主动的思考者和决策者。
找到了信息,怎么“喂”给模型又是一门学问。这就是上下文组装(Context Assembly)要解决的问题。
目标很简单:提供最精简、最相关、结构最清晰的信息。
这需要一系列技术,比如信息压缩、重新排序、格式化等。
例如,使用XML这样的结构化格式,可以清晰地划分不同类型的上下文,极大地帮助模型理解任务。
作者提供的lovable bug fixing Agent的示例:https://github.com/phuryn/examples/blob/main/prompts/context_engineering/bug_fixing_agent_context.xml
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-16
GPT‑5-Codex 发布:OpenAI 的 Claude Code
2025-09-16
新版 GPT-5 刚刚发布,最卷 AI 连肝代码 7 小时,编程工具大洗牌开始了
2025-09-16
Subagents:构建高可靠 AI Coding 专家顾问团
2025-09-16
Agent三大痛点:知识库+工作流+Prompt工程
2025-09-16
Anthropic发布首个AI经济指数报告:越富越用AI,企业比个人更信任AI
2025-09-16
Claude Code与GitHub结合使用的实践指南
2025-09-16
企业复杂Agent落地的12个工程化原则 | 原则二:构建Prompt工程可扩展、可维护、可调试、可回滚 | 提示词A/B实验
2025-09-16
OpenAI深夜放出「编程核弹」:GPT-5-Codex 正式发布,能独立爆肝7 小时
2025-08-21
2025-06-21
2025-08-21
2025-08-19
2025-06-19
2025-07-29
2025-09-08
2025-08-19
2025-08-20
2025-07-04
2025-09-14
2025-09-12
2025-09-11
2025-09-11
2025-09-09
2025-09-09
2025-09-08
2025-09-08