我要投稿

几个故事，理解AI Agent规划的不同实现方式

发布日期：2025-07-07 08:29:12 浏览次数： 1679

作者：ADaM应用数据挖掘和机器学习

微信搜一搜，关注“ADaM应用数据挖掘和机器学习”

在o1将多步推理能力内化到模型之前，Agent规划的实现，依赖开发者在外部搭建的工作流。根据工作流的构建方式，可以分为“硬”和“软”两种。

[1] 硬工作流: 系统流程

类似扣子、dify等低代码平台，由开发者根据预设任务逻辑，搭建一个包含分支、判断条件的固定流程图。模型是被动的执行器，完全遵从预设好的硬编码流程，在指定节点执行某个具体任务。

[2] 软工作流：模型提示词

开发者通过设计提示词或最佳实践提供一个指导框架，引导模型在执行时自主判断。此时模型是半自主的：初始规划由提示词提供，但具体执行时，模型能根据上下文决定是遵循还是自由发挥。

推理模型出现后，规划从基于外部工作流转向基于模型原生。模型是全自主的：同时是规划的起点和执行的终点。

[3] 生成式原生规划

这是当前Manus、扣子空间等通用Agent产品采用的主流方式。当接收到一个高层指令后，模型会利用推理能力进行任务分解，生成一个结构化的行动计划，然后根据计划，结合观测到的局部上下文，分步执行。

[4] 端到端原生规划

OpenAI的Deep Research代表了一种新的规划方式：面向任务目标对模型的规划和工作调用行为进行端到端优化。这种模型的规划是隐性的、直觉式的，它在规划和执行时，由于面向任务目标进行了训练，是基于全局上下文的，就像能“看”到未来。

下面用一组类比，来理解这四种规划方式。

系统流程：有点像潘金莲喂药的固定脚本，作为执行环节的模型就像被喂药的武大郎，别无选择，只能完全遵从。

模型提示词：西游记最后一难过通天河时，观音给老鼋的”指令”。但是否遵从指令，要结合执行时的具体上下文由老鼋自己决定。

生成式原生规划：例子是三国演义中的周瑜。周瑜有强大的推理能力，可以自主规划。但其规划还局限于已观测的信息，因此有时成功（如赤壁之战的苦肉计），有时失败（入赔了夫人又折兵），结果并不可控。

端到端原生规划：结合诸葛亮的“隆中对“来理解。诸葛亮在出山之前，已经为刘备推演了天下未来数十年的走向。因此在执行时，能结合推演和终局做出最优的规划和决策。

当然，在实际应用中，不同的规划方式适用于不同场景。比如系统流程由于确定性的特点，适合流程固化、容错率低的任务；而端到端原生由于可以支撑较长规划链条的逻辑一致性，因而适合更复杂、专业的任务。

总体来说，模型原生规划更能发挥大模型的能力，特别是端到端原生规划的理论上限是最高的。但由于训练数据获取、环境奖励设计等原因，目前的端到端原生规划还很难达到理想效果。比如基于RL训练的端到端的Kimi Researcher，很多时候生成的报告质量并不如基于多agent搭建的工作流。

在很长时间内，可以预见不同规划方式会组合出现。

嵌套：由工作流或模型原生规划出顶层框架，再根据不同节点任务特点，选择最合适的规划方式来分工实现。
反馈：由于模型基于概率的输出具有不确定性，可以通过确定性的工作流来校验和修正模型原生规划和执行的结果。
分级：构建按能力和效率分层的处理流水线。简单的、确定性的任务由工作流快速处理；当任务复杂度超出当前层级的能力时，交由更强大的模型原生规划来处理。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-08-22

深度智能体革命：为什么 LLM 应用正从浅层走向深度？

2025-08-22

万字长文预警？不，关于MCP，看这篇就够了

2025-08-22

浅谈大模型在安全运营中的落地

2025-08-22

浅谈大模型在威胁分析的落地上篇

2025-08-22

大模型工具的 “京东答案”

2025-08-22

GenAI企业应用落地，成功率 5%？

2025-08-22

别再搞多智能体了！大模型Agent开发的三大误区

2025-08-22

深度 | Anthropic内部构建AI智能体的第一性原理

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

2025-08-21

DeepSeek R1-0528 小版本升级

2025-05-29

SpringAI Alibaba实战文生图、聊天记忆功能

2025-06-01

精|知识探索新范式：深度研究Deep Research智能体全面综述，系统、方法与应用

2025-06-21

AIGC合规落地全景图 | 如何做好AIGC数据合规

2025-06-07

别再被MCP协议绕晕！一文搞懂连接流程与核心架构

2025-06-12

DeepSeek V3.1 测评

2025-08-19

能办成事的 Agent：实时与环境交互，从经验中学习

2025-06-19

聊聊AI应用架构演进

2025-06-13

这篇AI Agent漫游指南，带你建立全面的科技史观

2025-05-28

大家都在问

深度智能体革命：为什么 LLM 应用正从浅层走向深度？

2025-08-22

GenAI企业应用落地，成功率 5%？

2025-08-22

DeepSeekV3.1 提到的 UE8M0 FP8 Scale 是什么？下一代国产芯片设计？

2025-08-21

从Prompt到Context：为什么Think Tool是形式化的必然？

2025-08-20

字节跳动发布M3-Agent：当AI拥有了“记忆”，世界将如何被重塑？

2025-08-19

大模型下半场，腾讯手里还有哪“三张牌”？

2025-08-19

AI应用从“工具”到“工作流”，下一个引爆点在多智能体系统？

2025-08-18

可实时交互的AI生成世界，腾讯发布的AI框架Yan，会是元宇宙的破局者吗？

2025-08-18

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部