我要投稿

尽管争议不断，Manus创始人的复盘却干货满满：AI智能体上下文工程的六大黄金法则

发布日期：2025-07-19 11:17:42 浏览次数： 2165

作者：草台AI

微信搜一搜，关注“草台AI”

在人工智能飞速发展的今天，明星公司Manus无疑是聚光灯下的常客，其产品和商业模式也引发了诸多讨论与争议。然而，抛开这些纷扰，当我们审视其技术内核时，不得不承认其团队在AI智能体（Agent）领域的探索是深刻且极具价值的。

近日，Manus的创始人Yichao 'Peak' Ji发表了一篇深度复盘文章，坦诚地分享了团队在构建智能体过程中“踩过的坑”和最终沉淀下的工程哲学。这篇文章的核心观点振聋发聩：决定智能体成败的关键，或许并非无休止地追逐更强的基础模型，而是回归本源，做好“上下文工程（Context Engineering）”。

这篇复盘没有空谈理论，而是充满了来自“百万级用户真实测试”的实践智慧。对于所有致力于构建AI智能体的开发者而言，这份“干货满满”的总结，无疑是一份宝贵的战术地图。以下是我们提炼出的六条黄金法则。

法则一：围绕KV缓存进行设计——成本与效率的命脉

在生产环境中，KV缓存命中率是衡量一个AI智能体性能最核心的指标，没有之一。Ji指出，智能体的工作模式是典型的“长输入、短输出”（Manus的输入输出Token比高达100:1），上下文会随着任务的进行滚雪球式地增长。能否有效利用KV缓存，直接决定了产品的延迟和成本。以Claude Sonnet模型为例，命中缓存的Token成本比未命中的要便宜10倍。

Manus的对策：

保持前缀稳定
坚决避免在系统提示词等前置上下文中加入时间戳这类动态变量。
上下文只增不减
避免修改历史记录，并确保所有数据结构（如JSON）的序列化方式是确定且稳定的，防止“隐形”的缓存失效。
显式管理缓存
在必要时，手动标记缓存断点，确保核心指令被有效缓存。

法则二：掩蔽，而非移除——在复杂性中保持稳定

随着智能体能力增强，其工具集会爆炸式增长。一个常见的误区是动态地从上下文中移除当前不需要的工具，以期让模型更“专注”。然而，这是一种致命的错误。

错误做法的代价：

缓存灾难
工具定义通常位于上下文前部，任何改动都会导致整个KV缓存失效。
模型混淆
当历史记录引用了当前已不存在的工具时，模型会陷入困惑，导致行为异常。

Manus的对策：使用“掩蔽（Masking）”代替“移除”。他们通过一个上下文感知的状态机，在解码阶段通过操纵Token的Logits来动态“屏蔽”或“推荐”某些工具的调用，而不是物理上删除它们。这既保证了上下文的稳定性，又实现了动态的工具选择。

技术深潜：什么是“操纵Logits”？

简单来说，Logits是AI模型在决定输出下一个词（Token）前，为词汇表中所有候选词给出的原始“信心分数”，分数越高，被选中的可能性越大。

“操纵Logits”就是在模型产生这些分数后、将其转换为最终概率前，进行的外科手术式干ervention。例如，通过将非法工具的Logit值直接设为负无穷大，就能“掩蔽”该选项，使其被选中的概率变为0。这种方法不像从上下文中“移除”工具定义那样会破坏宝贵的KV缓存，因此它能在不牺牲效率的前提下，实现对智能体行为的精准、动态控制。