我要投稿

从提示工程到上下文工程：构建真正可用的大模型应用

发布日期：2025-06-29 13:06:39 浏览次数： 1944

作者：MLSys2024

微信搜一搜，关注“MLSys2024”

在过去的几年中，“Prompt Engineering（提示工程）”曾一度成为大语言模型（LLM）应用开发的代名词。然而，随着模型能力和应用复杂度的不断提升，我们逐渐意识到：“Prompt”只是冰山一角，而真正决定大模型应用效果的，是更为系统、更具工程性的“Context Engineering（上下文工程）”。

一、提示工程的局限

提示工程强调的是“任务描述”本身——如何用一句话或一段文本告诉模型你想让它做什么。在日常使用 ChatGPT 或 Copilot 时，这种方式行之有效：我们给出简短命令，模型返回结果。

但在工业级应用中，现实远比“写一个好提示”复杂得多。你需要的不仅仅是“问得对”，而是“喂得对”。也就是说，要构建一个真正可靠的 LLM 应用，核心不在于你对模型说了什么，而在于你给它什么样的上下文。

二、上下文工程：连接人、任务与模型

“上下文工程”是一种关于如何填满上下文窗口的艺术与科学。它是一门科学，因为它涉及多个要素的精心编排：

•任务描述与说明（说明用户意图）

•少样本示例（Few-shot）（启发模型学习）

•RAG 检索增强生成（补充外部知识）

•多模态输入（图文、代码、表格等混合形式）

•用户操作历史与状态（对话或任务链中的连续性）

•工具调用接口与参数（函数调用、代码执行等）

•信息压缩与结构化表达（保证 token 成本可控）

如果上下文太少或形式不当，模型理解力会下降；如果填入太多无关内容，不仅成本升高，还可能让模型“迷失方向”。因此，上下文工程是一项高度非平凡的优化任务。

它又是一门艺术，因为它依赖于一种新的直觉：

你需要具备一种类似“LLM 心理学”的洞察力：模型倾向于如何“思考”？它对什么样的模式、线索更敏感？如何设计提示链条，使其沿着正确的推理路径前进？这类洞察无法完全依赖规则，需要经验、直觉和反复试验。

三、上下文工程只是 LLM 应用的一部分

上下文工程虽然重要，但它只是构建 LLM 应用中的一个模块。为了将模型从“能生成”变成“能完成业务任务”，还需要一整套系统性的能力支持：

•问题拆解与流程控制：将复杂任务拆成多步链式操作

•模型选择与调度：不同任务调用不同模型（快、便宜、强）

•上下文窗口管理：精准地组织和压缩信息内容

•UI/UX + 验证反馈环：生成结果是否准确？能否验证？如何纠错？

•安全性与合规性：防止越权、注入、幻觉带来的风险

•评测与监控：持续优化提示效果与应用质量

•异步并行与预取优化：降低响应时延，提高系统吞吐

•系统的扩展性与可组合性：支撑未来任务迁移与复用

这些构成了一个全新的软件形态层，我们可以称之为：LLM Application Orchestration Layer（大模型应用编排层）。

四、别再叫它“ChatGPT 包壳”

把这些复杂能力称为“ChatGPT wrapper（包壳）”显然严重低估了它的系统性与技术难度。真正的工业级 LLM 应用系统，更像是一个融合了编排、优化、推理与人机接口的新型中间件平台。

在这个意义上，“Ontology”（本体结构）正在成为上下文工程的核心支柱。因为你的业务流程本身就是上下文。你越能将业务对象、流程状态、工具能力编码进上下文，模型就越能融入真实业务，成为智能代理的一部分。

五、总结：新的工程范式正在成型

从提示工程到上下文工程，从人写 prompt 到系统自动编排上下文，从“能说”到“能做”，我们正在见证一种全新范式的崛起。

未来的大模型系统，不再只是 API 调用，而是一种集信息组织、任务推理、系统调度、用户交互于一体的复杂软件工程。理解并掌握上下文工程，是构建下一代智能应用的关键一步。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-11-18

如何使用Ahrefs + Claude创建关键字宇宙

2025-11-18

大模型驱动线下门店运营升级：从数据到决策的落地实践

2025-11-18

让苏东坡"复活"！我用Qwen3-8B实现了与千古文豪的跨时空对话

2025-11-18

从0到1开发一个Agent（智能体）框架

2025-11-18

Amp 上下文管理完全指南：掌控对话，精准输出

2025-11-18

你以为在训练AI,其实是暴露你对自己业务的无知

2025-11-18

AI认知 | 99%的AI Agent项目会死于“伪需求”，用OSCAR模型，成为那幸存的1%。

2025-11-18

AI、游戏双驱动，腾讯「赚麻了」

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

2025-08-21

DeepSeekV3.1 提到的 UE8M0 FP8 Scale 是什么？下一代国产芯片设计？

2025-08-21

实测 Sora 2 ：AI视频的“ChatGPT时刻”来了？八大场景教你解锁各种玩法（附邀请码）

2025-10-02

新版 GPT-5 刚刚发布，最卷 AI 连肝代码 7 小时，编程工具大洗牌开始了

2025-09-16

从需求场景出发的AI应用项目落地方法论

2025-09-19

AI大家说 | 下一代AI创业的机会在哪里？定价趋势是什么？

2025-09-08

阿里发布下一代企业级智能体开发框架AgentScope 1.0

2025-09-17

RagFLow v0.20.X全面解析！双向MCP、Agentic智能体...这次真的起飞了！（附长图）

2025-09-29

马斯克 Grok imagine 完整使用指南：工具、案例、提示词，看这一篇就够了！

2025-10-26

Qwen3-Coder与Claude Code深度对比：谁是你的AI编程助手？

2025-09-14

大家都在问

EI Search：生成式AI时代的知识探索新范式？

2025-11-18

Kosmos发布：一个让博士生“失业"的科研AI？

2025-11-18

oLLM 如何在 8GB 3060 Ti 上实现 100k 上下文推理？

2025-11-17

这种全新的交互方式，会成为未来AI应用的标配吗？

2025-11-15

Claude Skills 不就是把提示词存个文件夹吗？

2025-11-14

多智能体设计模式和智能体框架，你会了么？

2025-11-12

大模型一体机|“昙花一现”，还是必然趋势？

2025-11-10

95% 企业 AI 落地失败当下，另外 5% 的 CIO 在谈什么？

2025-11-09

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部