免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

吴恩达最新课程:别再只写Prompt了!掌握Agentic AI,让AI自主工作!

发布日期:2025-12-17 05:20:40 浏览次数: 1517
作者:水豚数智社

微信搜一搜,关注“水豚数智社”

推荐语

吴恩达新课程教你突破Prompt局限,掌握Agentic AI让AI真正自主工作!

核心内容:
1. Agentic AI如何解决传统Prompt模式在复杂任务中的局限性
2. 构建自主AI系统的四大核心设计模式解析
3. 实战案例展示Agentic AI工作流的具体应用场景

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
在各位AI大佬中,吴恩达是水豚最喜欢的一位。多少人是和水豚一样,看吴恩达的机器学习课程入门,在Coursera不断进步。我始终觉得,吴恩达的课程总能做到深入浅出,让大多数人听得懂学得会,他在普及AI这件事上做出的贡献当世数一数二。这次他带来的新课程名字非常直接,就叫做"Agentic AI"。

如果你还在写提示词(Prompt),并期望AI能完成复杂的项目,那你一定也体会过各种无奈!未来谁能用好AI,不在于提示词工程 (Prompt Engineering),而在于如何更好地编排智能体工作流 (Agentic AI Workflow)。

吴恩达这门课程,旨在教会你如何搭建一个能自我规划、使用工具、迭代改进的AI系统,真正让AI像有效的专家团队那样自主工作。本文将深入解读这门课程的核心内容,带你掌握构建Agentic AI系统的四大设计模式和实战工程化技巧。



一、为什么需要自主智能体 (Agentic AI)?

早期LLM使用中,我们通常输入Prompt,模型返回结果。这种模式在处理简单任务时非常高效,但面对复杂、需要多步决策、外部数据或操作的任务时,就会显得力不从心。
Agentic AI提供了一种全新范式。不再局限于单次响应,而是允许LLM:
  • 规划多步骤流程:将大任务拆解成可执行的小步骤。
  • 迭代执行:在每一步执行后进行检查和改进。
  • 自我优化:通过自我反思和工具使用来提升最终输出的质量。

简而言之,AI智能体的目标是让LLM能够像一位经验丰富的软件工程师或项目经理那样,自主处理复杂的业务流程。


二、Agentic AI的核心武器库:四大设计模式
本课程核心在于教授和实践四种驱动自主智能体AI系统的关键设计模式:
1. 反射 (Reflection):自动化“代码审查”

反射 (Reflection) 允许AI评估自己(或其他AI)的工作并反馈结果,让AI系统自主迭代和自我改进。大白话讲,就是将AI生成的内容作为输入,给到(不同)AI进行审查并输出审查结果。

反射能基于预设标准,也可引入外部反馈(external feedback)。比如把AI生成的代码在外部运行,将运行结果与代码一起交给AI审核,能大大提高反射的准确性和可靠性。




2. 工具使用 (Tool Use):让AI拥有“双手”和“眼睛” 
通过将AI连接到外部工具或服务,使其执行实际操作,而不仅仅是生成文本。比如工具赋予AI连接数据库、调用外部API、进行网页搜索,甚至执行代码的能力。
一种方式是,预设工具,并且明确告诉AI可用的工具和用途,让AI调用。

更加灵活的方式是,可以让AI自己写代码,并且运行

工具调用中,值得一提的是MCP,可以有效减少下图中这种重复开发Tools的浪费。



3. 规划 (Planning):复杂任务的“工作手册”
规划 (Planning) 告诉AI如何将复杂任务分解成可执行步骤。LLM可以遵循这些步骤,并在执行过程中,针对实际情况进行适应和调整。概念很简单,就是每个LLM的输出成为下一个LLM的输入。如下图右下部分。
实施中的关键在于:
  1. 步骤怎么分, 怎么编排?这不仅是技术问题,更是对业务知识和常识的考验。这也是AI时代对技术同事的新要求。课程中也提到对于部分场景,可交由LLM实时进行规划
  2. 步骤间交付/传递什么?从效果来讲,代码 > JSON格式输出 > 自然语言



4. 多智能体工作流 (Multi-Agent Workflow):团队协作的力量 
协调多个不同角色的LLM,让它们各司其职,共同处理复杂工作流的不同部分。就像组建一支由不同专家(如研究员、设计师、编辑)构成的虚拟团队。

其中的要点在于如何设计多智能体系统间的沟通模式 (Communication patterns),从而实现更高效、更深入的协作。课程中提到了四种方式:

协作模式
特点
应用场景举例
线性(Linear)
按序执行,向下游交接
发票日期提取
层级(Hierarchical)
上级智能体指挥下级
数据洞察
多层级(Deeper Hierarchy)
上级智能体指挥下级
数据洞察
多对多(All-to-All)
多智能体自由讨论和协调
头脑风暴



三、评估与优化的工程化落地
Agentic AI工作流构建中容易被忽视,但也是最重要的一点,在于必须具备严格的工程化评估和优化技能。这是Gen AI应用能脱离POC (Proof of Concept,概念验证),真正进入生产的关键。

课程中总结了一套简单的评估流程:

  1. 定义标准:明确什么是“好”输出,例如文本质量或数据准确性;

  2. 从小规模样本开始:先用 20~50 个样本快速发现问题,有时直接肉眼识别即可;

  3. 选择评估类型客观评估 - 当任务有明确标准时,编写测试代码计算准确率;主观评估 - 用另一 LLM 根据评分标准打分,如图表是否有标题、是否使用合适的图表类型

此外,评估可分为端到端和组件级。端到端测试适合体验整套工作流,但成本高;组件级评估则更有针对性,有助于快速定位问题。



这门《Agentic AI》课程总时长约6小时,包含了 31个视频课程 和 7个代码示例,由 Andrew Ng 亲自指导。主要面向:

  • 希望应用LLM构建多步骤工作流的软件开发人员

  • 具备中级Python编程技能的专业人士

  • 对LLMs和APIs有基本了解,想深化实践技能的专业人士


如果你希望构建一个能够“自主完成复杂工作”的系统,那么掌握这四大模式(反射、工具使用、规划、多智能体)是进入下一代AI软件开发的关键。非常推荐大家去看一下这门课程。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询