我要投稿

Agent 创业如何落地｜吴恩达提出的 5 个设计原则

发布日期：2025-06-18 10:43:06 浏览次数： 2063

作者：复利猫的慢思考

微信搜一搜，关注“复利猫的慢思考”

在 2025 年 5 月的 LangChain Interrupt 峰会上，吴恩达（Andrew Ng）抛出了一个核心问题：

Agent 系统，怎么才能在现实中真正跑起来？

他没讲概念，而是带着工程视角，回到五个具体判断：Agent 要多自主？评估怎么做？工具怎么接？语音系统怎么搭？标准怎么定？

这篇文章结合他的判断逻辑与 Glean、Lamini、Cognition Labs（Devin）、Reka 等案例，整理成一份 Agent 创业者可用的落地笔记。

01｜Agent 要多自主才合理？

吴恩达提出一个关键判断工具：“agenticness 是一个光谱（spectrum）”。

意思是，每一个 Agent 系统，都应被视为一个在 “自主程度” 上的滑块，而不是 “是不是 Agent” 的标签分类。

创业团队最常犯的错误，就是一上来就试图打造 “超级 Agent”，让它理解需求、主动规划、自己解决问题。

结果不是做不出来，就是做出来完全不可控。

他建议从三个角度判断该把 Agent 放在光谱哪一段：

任务结构复杂吗？简单、重复、确定性的任务适合低自主（Level 2–3）；
是否需要人类监督？高风险任务应保留 “人在环（human-in-the-loop）” 的设计，让人类在关键节点仍有决策权；
能否拆解为线性步骤？若能，就不必走高度自治路线。

Devin 是一个典型案例：它虽然被称作 “AI 工程师”，但背后有非常清晰的任务界定、计划机制和沙盒权限 —— 属于中高自主、限定域 Agent 的代表。

落地启发：

创业公司更应该在光谱中 “往低靠”，从 “高质量低自主” 的系统做起，再逐步提升复杂度。

案例参考：

Cognition Labs 如何通过任务界定与沙盒机制控制 Devin 的自主性。

02｜评估机制不是配角，是 Agent 成败的关键指标

吴恩达强调，如今大多数团队对 Agent 的评估还过于原始，改完代码就人工盯输出，不仅慢，还不系统。

他的建议是：哪怕只覆盖 5 个样本，也要为每一个失败步骤建立 “快速检测器”，哪怕初级、简陋，也要尽早上线 —— 系统是否 “可改进”，比是否 “完美” 更重要。

Lamini 就把评估机制作为产品主线之一，它提供了定制模型的 “评测流水线” ，帮助开发者在 RAG、分类等 Agent 应用场景中形成可持续迭代的数据闭环。

落地启发：

评估不是事后 QA，而是工程主干之一。

案例参考：

Lamini 如何通过评估工具链迭代 Agent 精度表现。

03｜工具系统怎么搭？先画出你的 “工具图谱”

吴恩达提出一个很有价值的视角：Agent 创业团队之间最大的差距，不是 “谁用得更熟练”，而是 “谁认得更多工具”。

就像一个会搭乐高的人，不必精通每块积木，但得知道每种颜色和形状能干什么。

这也是为什么像 Glean 这样的 Agent 平台，会强调提供多样化的组件库（Retriever、Guardrails、Multi-Tool Agent 编排等），并鼓励用户形成模块重组的能力，而非 “一条链到底” 的固定流程。

落地启发：

你的 “工具知识图谱” 边界，就是产品演化的上限。

案例参考：

Glean 如何通过模块式工具集构建高度灵活的 Agent 平台。

04｜语音 Agent 会是下一波分水岭，但别一哄而上

语音，是吴恩达在访谈中花了很大篇幅强调的新方向。他认为，语音比提示词更自然 —— 用户可以边说边想，不需要像写提示词那样一次性组织完整的结构，门槛也低得多。

但他也提醒：做语音 Agent，不能只是加上语音识别 API，而要：

加缓冲，掩盖时延：

加入像 “让我想想” 这样的缓冲语，用来填补语音生成时的停顿，让用户感觉系统仍在思考，而不是卡住了。
容跳跃，理解不清句式：

语音对话常常跳跃、不完整，Agent 需要能记住前文上下文，并从模糊的表达中还原用户真正想说的事。
边听边做，不中断流程：

用户说一句话的过程中，Agent 就开始处理指令，比如一边说 “你查下这个药的副作用”，一边就已调接口、查文档，不等用户停下才启动动作。

Reka AI 就是一个例子，它构建了语音、图像、文本的统一输入栈，打造的是 “听说读写兼备” 的多模态 Agent，而不是给文本 Agent 加个耳朵和嘴巴那么简单。

落地启发：

如果你只是改了输入方式，没有把语音作为系统设计的出发点（比如语音节奏、打断机制、模糊识别、多模态融合），那这类功能很容易被复制，难以长期保持优势。

案例参考：

Reka 如何构建跨模态输入的语音 Agent 技术栈。

05｜Agent 间怎么协作？别绕开 MCP 协议思维

什么是 MCP？

吴恩达用一句话讲得很清楚：从 “n 个 Agent × m 个服务” 的适配成本，变成 “n + m 个标准接口”。

MCP（Model-Context-Protocol）是一种标准化 Agent 接入协议，目标是在多 Agent 系统和多工具服务之间形成 “标准语言”，让组件可互换、系统可嵌套。

这不是个学术概念，而已经落地：

LangChain 推出的 Agent Protocol；
Glean 提供的 MCP 工具服务器；
AGNTCY 联盟希望打造的 “AI 时代的 TCP/IP”。

落地启发：

不要自己在接口上造轮子。MCP 可能会像 HTML 一样，成为 Agent 生态里默认的协作方式。

案例参考：

Glean 如何将 MCP 应用于多 Agent 系统接口标准化。

结语：Agent 创业，正在从炫技转向工程

吴恩达这场访谈的意义不在于 “讲 Agent 多厉害”，而是给了一次非常清醒的系统设计提醒。

Agent 系统要做得起来，这五个问题绕不开：

自主性光谱怎么控？
评估机制怎么建？
工具系统怎么搭？
语音系统怎么融？
Agent 间怎么协作？

与其讲一个 Agent 的故事，不如先构建一个真的能跑的 Agent 系统。

如果说过去一年是 Prompt 工程的时代，那接下来的三年，将属于那些真正懂架构、会做系统工程的人。

附录｜原始资料链接：

吴恩达在 LangChain Interrupt 峰会访谈视频：https://youtu.be/4pYzYmSdSH4?si=jfzhhp_PYuQcyXNF

附录｜术语 & 案例速查表：

关键词 / 案例	简要说明
Agenticness（自主性光谱）	吴恩达提出的重要概念：Agent 的 “自主性” 不是非黑即白，而是一个连续光谱，开发者需判断放在哪一段最适合系统稳定与落地。
Devin（Cognition Labs）	代码任务专用的 AI Agent，以计划系统和沙盒机制实现中高自主性代表，被认为是 “限定领域自治” 成功范例。
Lamini	面向企业的 Agent 平台，强调模型定制与评估闭环，具备完整的数据准备、RAG 架构、幻觉控制与多轮调优工具。
Glean	企业知识搜索和 Agent 编排平台，支持 Agent Protocol 和 MCP 工具服务器，为多 Agent 系统搭建标准通信层。
LangSmith	LangChain 推出的 Agent 可观测性平台，可用于追踪 Agent 决策路径、工具调用与调试日志，是系统评估的重要组件。
MCP 协议（Model-Context-Protocol）	一种标准化 Agent 接入机制，目标是降低系统工具集成的心智负担，从 “n × m 连接” 转为 “n + m 标准接口”。
Reka AI	多模态 Agent 创业公司，技术栈融合语音识别、文本生成与图像输入，支持构建 “听说读写” 一体的语音智能体。
Guardrails	一种用于约束 LLM 行为的结构化机制，常用于生成内容控制、格式验证、安全性保障，属于 Agent 工具图谱的重要一环。
LangGraph	LangChain 推出的多节点 Agent 编排框架，支持条件跳转、循环逻辑与并行链路，是流程型 Agent 构建的核心工具之一。