免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


一文带你领略大模型上下文工程,AI应用的颠覆性变革

发布日期:2025-08-23 20:45:33 浏览次数: 1532
作者:AI学习的杨同学

微信搜一搜,关注“AI学习的杨同学”

推荐语

大模型应用开发正从提示词工程迈向上下文工程,这场变革将彻底改变AI系统的智能水平和工作方式。

核心内容:
1. 上下文工程的定义与产生背景
2. 上下文工程的核心组件与技术实现
3. 在医疗、自动驾驶等领域的应用案例

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
大家好,我是AI学习的杨同学。

在大语言模型(LLM)飞速发展的今天,AI 应用开发领域正在经历一场深刻变革,从 “提示词工程” 迈向 “上下文工程”。这不仅是一个简单的概念转变,而是一场涉及理念、技术和应用的全面革新,标志着 AI 正从基础的指令响应工具,进化为复杂的智能系统。
背景与概念
01
(一)产生背景
2025 年初,Shopify CEO Tobi Lutke 在社交媒体首次提出 “上下文工程”。随着 AI 应用场景不断拓展,从简单文本生成到自动化流程、智能代理等复杂领域,单纯的提示词工程已难以满足需求。前 OpenAI 研究员 Andrej Karpathy 也认同,在工业级 LLM 应用中,上下文工程才是关键,它需要把上下文窗口精准填充下一步所需信息。
(二)定义
上下文工程是构建动态系统,以正确格式提供合适信息和工具,使 LLM 合理完成任务。它超越提示词设计,更注重管理和调度信息流,确保在恰当时间,以正确格式把准确信息提供给大模型。

上下文工程与提示词工程的区别
02


为更清晰展示两者差异,以下用表格形式对比:
简单来说,提示词工程像教我们如何向 “超级大脑” 问对问题;上下文工程则是在提问前准备好相关 “参考资料” 递给 “超级大脑”。上下文工程包含提示词工程,提示词工程是上下文工程的一部分。
上下文工程的组成与架构
03
(一)核心组件
  • 通过检索增强生成(RAG)和动态模板组装技术,实时扩展和精准注入上下文信息。传统 RAG 直接关联外部知识库,增强事实准确性,但检索噪声大,上下文冗余度高,适用于开放域问答、知识密集型任务。动态少样本示例生成能自生成示例适配任务需求,如在 ALFWorld 任务中成功率提升至 93% ,不过依赖模型初始能力,可能生成误导性示例,适用于复杂决策、多步推理任务。
在 RAG 中,嵌入模型通过特定的神经网络结构,例如 Transformer 架构,对信息块进行语义编码。它会捕捉信息块中词汇之间的语义关系,将文本信息转化为高维向量。向量数据库检索时,常采用余弦相似度算法,计算问题向量与信息块向量之间的夹角余弦值,余弦值越接近 1,说明两者语义越相似,从而找出最相关的信息块。
  • 针对长序列、多模态等复杂场景,通过长序列分层压缩和跨模态注意力机制等技术优化模型认知。Claude Code 采用递归摘要策略,在上下文窗口达到 95% 容量时自动压缩早期对话,Token 利用率提升 3 倍。在自动驾驶中,通过中期融合策略的跨模态注意力权重动态分配,实现激光雷达与视觉数据的鲁棒对齐。
以医疗领域为例,在处理医学影像(如 X 光、CT 图像)和病历文本时,跨模态注意力机制会让模型在分析影像特征的同时,关注病历中相关症状描述、诊断信息等文本内容,使两者相互补充,提升诊断准确性。
  • 通过内存架构与协同机制设计,解决生产环境中的资源瓶颈问题。如 Manus 团队通过稳定提示前缀与仅追加策略,将输入 Token 成本降至未缓存情况的 1/10 ;Git-Context-Controller 的 COMMIT/BRANCH 机制支持智能体并行探索不同解决方案,在 SWE-Bench-Lite 中实现 48% 任务解决率。
(二)技术栈
实现上下文工程最主流的技术架构是 “检索增强生成(RAG)”。
  • 加载与切分私有知识库,将其切分成小信息 “块”;使用嵌入模型将每个信息块转换成向量,存储在向量数据库中。
  • 用户提问,系统将问题转换成向量;拿着问题向量在向量数据库中进行相似性搜索,找出与问题语义最相近的几个信息块;自动构建增强后的提示词,将包含精准上下文的提示词发送给大语言模型,模型生成回答。
除 RAG 外,微调也是重要范式。微调是在模型部署前,在特定领域数据集上继续训练基础大模型,将特定知识和能力 “内化” 到模型参数权重中。比如法律科技公司收集数千份高质量合同,对模型进行微调,让 AI 助手能以专业法律文书风格起草合同。
主要应用场景
04
  • 当用户询问设备报错代码含义时,无上下文工程的通用 LLM 可能瞎猜答案;有上下文工程的系统,会先从设备手册和维修工单数据库中检索准确信息,再提供给 LLM,生成准确回答。
  • 用户询问股票投资建议,无上下文工程的 LLM 只能给笼统建议;有上下文工程的系统,接入个人投资组合数据和实时市场新闻 API,根据用户持仓和市场情况,生成个性化和时效性的建议。
  • 联影医疗大模型整合电子病历、影像报告、生命体征传感器数据,误诊率降低至 6.7%;腾讯健康采用跨模态加权策略,将 ICU 重症预测误判率从 14% 降至 6.7% 。通过动态检索增强和多模态融合技术,实现诊断准确性的提升。
  • 花旗银行分层内存设计将高频交易数据保留在缓存层,API 延迟降低 72%;银行通过 MCP 连接 CRM 与风控系统,AI 自动完成交易解析、风险评估、合规报告。
  • 在生产流程优化中,上下文工程可以结合生产设备的实时运行数据、产品设计文档以及过往的生产故障记录。当设备出现异常时,系统能快速检索相关信息,提供针对性的故障排查建议和解决方案,提高生产效率和设备的稳定性。例如,某汽车制造企业利用上下文工程技术,对生产线机器人的运行状态进行实时监控和分析,当机器人出现故障时,系统能够迅速根据历史故障数据和当前运行参数,给出准确的维修建议,减少停机时间。
  • 在智能辅导系统中,上下文工程可以根据学生的学习历史、知识掌握程度以及当前学习进度,为学生提供个性化的学习建议和解答。例如,当学生提问数学问题时,系统不仅能给出答案,还能根据学生之前的错题情况,提供针对性的知识点讲解和练习推荐,帮助学生更好地掌握知识。
未来发展
05
  • 更精细的上下文管理,让 AI 应用更好理解用户需求,提供个性化服务。
  • 上下文工程使人机协作更流畅,拓展人类能力边界。
  • 随着技术成熟,AI 将深入融入企业核心业务流程。
  • 针对不同行业和场景,将出现大量上下文工程解决方案。
  • 技术普及和标准化后,上下文工程将成为 AI 应用的基础设施。
总结
06
上下文工程是 AI 应用开发的重大范式转变,它通过动态构建上下文,有效解决了大型模型的知识截止、数据私有性、事实幻觉和上下文窗口限制等问题。与提示词工程相比,上下文工程更注重信息的全面管理和动态调度。在技术组成上,包含上下文检索与生成、处理、管理等核心组件,RAG 和微调等技术栈为其实现提供了支撑。在企业智能客服、个人财务顾问、医疗、金融、制造业、教育等多领域,上下文工程都展现出强大的应用价值。
未来,上下文工程将持续推动 AI 应用的创新发展,成为 AI 从实验室走向广泛应用的关键力量。对于企业和开发者而言,应积极关注和应用上下文工程技术,在这场技术变革中抢占先机,充分挖掘 AI 的潜力,创造更大价值。
(觉得有用?点点关注,领AI资料包✌️,转发给你身边对AI感兴趣的朋友,一起围观这场“认知革命”~)


- End -

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询