我要投稿

一口气讲清楚：AI Agent发展史

发布日期：2025-05-09 12:43:01 浏览次数： 2127

作者：老张的求知思考世界

微信搜一搜，关注“老张的求知思考世界”

Agent这个名词，做技术的同学都不陌生。

在IT技术领域，Agent指的是“代理”能力，这个“代理”能力概述来说可分为三部分：感知环境、自主决策和执行任务的能力。

举个例子，CICD流水线中的很多任务，都是Agent根据配置好的逻辑规则自动触发执行。包括不同的分支走不同的测试环境，调用哪些技术组件，执行任务的结果通知等。

在AI领域，Agent代指智能体，它同样具备感知环境、做出决策并执行任务的能力，通过感知、决策和行动实现目标。它的核心特征包括：

感知能力：获取外部环境信息如视觉、听觉。
决策能力：基于感知信息进行推理和规划，选择合适的行动策略。
行动能力：执行具体任务或操作，影响环境。
学习能力：通过与环境的交互不断改进策略。

AI Agent还可以被理解为“大模型 + 插件 + 执行流程”的结合体，分别对应控制端、感知端和执行端。

截至目前，AI Agent的发展历史可以分为四个阶段，分别是：裸大模型调用、简易Chatbot、多智能体、任务智能体。

一、裸大模型调用

简单理解类似于后端接口调用，直接返回response body。处理逻辑如下图所示：

二、简易Chatbot

Chatbot，即聊天机器人，最出名的应该是ChatGPT了，2022年底横空出世，自此开启了全球AI加速化的浪潮。

Chatbot的实现原理，其实就是在裸大模型调用上封装了一层，从后端接口调用，变成了界面可视化的Chatbot。当然，Chatbot的每一轮对话，都会包含系统提示词+历史对话+最新一轮的用户提示词。处理逻辑如下图所示：

三、多智能体

所谓多智能体，即Multi-agent，Manus就是采用了这种技术实现架构。

Multi-agent可以理解为多个Agent进程/线程并行工作，它们之间通过通信机制进行沟通(例如TCP)。比如metagpt，就是典型的多角色协同(多Agent并行)工作。

关于Manus的更多技术细节，可查阅这篇文章：一张图讲清楚：Manus的技术架构

四、任务智能体

任务智能体目前可以粗略分为两种类型：短任务智能体、长任务智能体。

短任务智能体：追求更快的响应时间，如虚拟人、智能音箱、车载智能座舱。
长任务智能体：即需要较长的步骤或时间才能完成任务，通常需要agentflow进行编排。

长任务智能体，还可以细分为两种：

Copilot类：常见于AI IDE领域，既可以进行人工干预、修改参数，也可以自主选择参考资料，甚至路由。
Agentic类：这种追求较高的自动化和智能化程度，需要人工干预的环节很少，比如Manus、metagpt、autogpt等。

下面是autogpt的工作流程示意图：

有一些关于AI Agent的概念需要做出澄清，避免大家混淆。

智能体这个概念最初源自Langchain。Langchain是一个很古老的智能体项目，它的重大意义在于提出了智能体的概念，以及组成部分。后面问世的智能体，大多都有Langchain最初的影子。

智能体的主要特征包含如下几个方面：

智能体Agent：一个包含AI步骤、能自动完成多不任务的智能程序。
步骤/链条Chain：一个有输入有输出，会进行任务处理的步骤链路。

典型案例：LLMChain，即大模型步骤，当然也包括其他形式的任务处理方式。

路由Router：路由规则，决定接下来该执行哪个步骤。

判断条件，可以是某些数值或者条件，也可以是LLMRouter，即直接问大模型接下来走哪个步骤。

工具Tool：基本的工具调用箱，比如日期、搜索、计算等基础功能。
Tool与Chain的区别在于，工具是在链路调用后会返回到该步骤。
Run概念：context上下文、status状态等。

最后需要明确的是，智能体和大模型是典型的上下游概念。

Manus(Agent)和DeepSeek(LLM)之间没有任何竞争和对立关系，反而与DeepSeek应用(chatbot)有竞争关系。

AI+测试全链路落地实践技术训练营，即将开课。课程大纲如下图：

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-08-07

GPT-5 即将凌晨1点进行发布，免费用户可以使用 GPT-5

2025-08-07

搞钱，还得是中医AI

2025-08-07

实测首款Agent蜂群，人人都可以造自己的视频版manus了

2025-08-07

【早阅】Claude Code最佳实践

2025-08-07

GPT-5的所有传言，以及，Sora 2？

2025-08-07

GPT-5 已通过 Copilot 发布

2025-08-07

蓝凌企业大脑·蓝博士全新升级，融合AI智能体让协同办公、业务应用更智能

2025-08-07

国内外代表性AI Agent原生企业鉴析

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek R1-0528 小版本升级

2025-05-29

高效 Agents 构建指南

2025-05-23

SpringAI Alibaba实战文生图、聊天记忆功能

2025-06-01

AIGC合规落地全景图 | 如何做好AIGC数据合规

2025-06-07

精|知识探索新范式：深度研究Deep Research智能体全面综述，系统、方法与应用

2025-06-21

别再被MCP协议绕晕！一文搞懂连接流程与核心架构

2025-06-12

2025-05-20

能办成事的 Agent：实时与环境交互，从经验中学习

2025-06-19

聊聊AI应用架构演进

2025-06-13

这篇AI Agent漫游指南，带你建立全面的科技史观

2025-05-28

大家都在问

GPT-5的所有传言，以及，Sora 2？

2025-08-07

什么编程语言更适合Vibe Coding？

2025-08-07

对话资深评标专家：AI生成的标书，我们到底看不看得上？

2025-08-07

断网后，你的 AI 还能用吗？

2025-08-06

AI竞赛下半场：为什么说“超级工厂”是最优解？

2025-08-06

AI 基础知识从 0.5 到 0.6—— Transformer 架构为何能统治AI领域？

2025-08-06

金融Agent竞赛：什么才是最实用的打开方式？

2025-08-05

独家对话火山引擎，企业级Agent落地难在哪儿？

2025-08-05

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB