微信扫码
添加专属顾问
我要投稿
从LLM到Agentic AI的进化之路,看AI如何从工具蜕变为智能伙伴。 核心内容: 1. Agent概念的历史溯源与四个发展阶段 2. LLM-Based Agent的三大演进阶段与技术突破 3. 多智能体协作与Agentic AI的未来展望
主要内容包括以下几个部分:
1. Agent 概念溯源
2. 阶段一: 裸大模型调用时期
3. 阶段二: LLM-Based Agent 探索
4. AI Agent 与 LLM-Based Agent
5. 阶段三: 从单一到多元,协作模式的探索(2023年 - 2024年)
6. 阶段四: 多智能体蓬勃发展
7. 站在 AGI 回望 Agentic AI
8. 写在最后
作者|马云起 火花思维
出品社区|DataFun
纵观技术发展史,真正改变游戏规则的从来不是单一技术的突破,而是技术组合后涌现出的新能力。
这场变革是如何发生的?让我们从 LLM 的起点开始,追溯这条通往 Agentic AI 的技术演进之路。
Agent 这个概念在人工智能领域由来已久,最早在 20 世纪 60 年代,“人工智能之父”马文·明斯基在他的研究中首次明确使用了“Agent”一词,将其定义为一种自主运行的计算或认知实体,具备感知环境、推理决策和执行任务的能力。
从马文·明斯基提出“Agent”概念至 LLM 模型诞生前,AI Agent 的发展经历了四个主要阶段,每个阶段在技术特点和应用场景上都有显著差异:
| Symbolic Agent | ||||
| Reactive Agent | ||||
| RL-based Agent | ||||
| Transfer & Meta Learning Agent |
理解了这些背景后,我们就能更好地认识到:LLM 的出现为何会成为 Agent 发展史上的分水岭。接下来,让我们正式进入从 LLM 到 Agentic AI 的演进历程。
02
阶段一: 裸大模型调用时期
2022 年 11 月 30 日,OpenAI 发布 GPT-3.5,引发全球轰动,开启了大语言模型时代。这一阶段的应用模式最为简单:裸大模型调用——类似后端 API 调用,输入提示词(Prompt),模型执行推理后直接返回结果。处理逻辑如下:
flowchart LR A[提示词: prompt<br/>最大输出: max_tokens]-->|输入| B[LLM<br/>执行推理任务] B -->|输出| C[返回结果<br/>response body] style A fill:#e1f5ff style B fill:#fff4e1 style C fill:#e8f5e9
阶段二: LLM-Based Agent 探索
不过,AutoGPT 等项目在初期也暴露出诸多问题,例如:经常调用工具失败、经常生成无效方案或陷入循环,效率低下,以及对稍复杂任务仍显力不从心。为了减少胡乱调用工具的情况,更规范函数调用,2023 年 6 月由 OpenAI 在其 GPT-4 和 GPT-3.5-Turbo 模型的 Chat Completions API 中正式推出了 LLM Function Calling。LLM Function Calling 要求模型输出结构化的函数名和参数,从而安全地调用外部 API,让 Agent 行为更加可控。至此,大模型厂商正式为 LLM 这个“大脑”装上了“手和脚”,使基于 LLM 的 AI 从一个被动的“对话者”,进化成了一个主动的“行动者”。这一举措催生了一个庞大的“LLM-Based Agent”(智能体)开发生态,也让 Agent 概念走出了研究圈子和技术圈,进入大众产品应用,从此 AI Agent 这一概念开始频繁出现在 AI 相关的宣传领域中。
04
AI Agent 与 LLM-Based Agent
从概念关系上看,LLM-Based Agent 是 AI Agent 的一个特殊子集,它继承了 AI Agent 的核心特征(自主性、任务专一性、反应性与适应性),同时通过 LLM 的强大推理能力和 Function Calling 机制,极大地改变了 AI Agent 的实现方式——让 Agent 从依赖复杂规则和训练,转变为通过自然语言理解和推理来执行任务。
随着 LLM-Based Agent 技术的快速发展和广泛应用,其在实践中的表现已经成为了 AI Agent 的典型代表。因此,在当前的 AI 应用开发领域,当我们讨论“AI Agent”时,通常指的就是基于大语言模型的智能体系统。这种术语使用的演变反映了技术发展的现实:LLM-Based Agent 继承了 AI Agent 的理论基础,并在实践中成为了 AI Agent 概念的主流实现形式。
05
阶段三: 从单一到多元,协作模式的探索(2023 年 - 2024 年)
随着智能体框架的出现,单智能体技术趋于成熟,但在实际应用中,其局限性也迅速暴露出来。
单个 AI Agent 就像一位领域专家,在特定任务上表现出色,但面对复杂问题时局限性明显。这就好比让一个人同时担任”产品经理 + 设计师 + 前端工程师 + 后端工程师”,看似高效,实则容易职责混乱、注意力分散。
强行让单个 Agent 承担多领域职责会带来以下问题:
(1)Token 爆炸与工具选择幻觉
对于跨领域的复杂任务,单个 Agent 的提示词中必须注入海量信息:系统指令、交互历史、庞大的工具库定义、多步骤执行上下文等。随着任务推进,上下文像滚雪球般膨胀,即便采用百万级长上下文窗口,也只是推迟问题的爆发。当模型陷入“信息沼泽”时,其注意力被严重稀释,关键信息被淹没,直接引发“工具选择幻觉”:混淆相似工具、错误调用 API、幻觉出不存在的参数,最终导致任务失败。
(2)维护与扩展的复杂性
当业务需求变化时,修改一个“全能型”Agent 的内在逻辑,远比调整专注于单一任务的 Agent 困难得多(牵一发而动全身)。在生产环境中,每次修改系统提示词都伴随着巨大的调试成本和不可预测的风险。
(3)单点故障风险
单个 Agent 在任务执行的任何环节出错,整个任务链就会中断。系统缺乏自我纠错和寻找替代方案的机制,鲁棒性和容错性严重不足。
面对单智能体的这些局限性,开发者和研究者们逐渐意识到多智能体的优势。通过将复杂任务分解为多个子任务,并分配给专业化的 Agent 来执行,多智能体系统能够有效克服单智能体的不足,展现出显著的优势。
(1)专业分工与注意力聚焦
将复杂目标分解为具体子任务,分配给领域专家 Agent 执行。每个 Agent 专注于自身擅长领域,“注意力”高度集中,任务执行产生的上下文内聚在领域内,只对外输出必要信息。这种专业化分工极大提升了任务质量和效率,有效降低了因任务复杂导致的幻觉风险。
(2)灵活扩展与快速迭代
当需要新功能时,只需开发专业 Agent 并接入现有协作框架,无需改造整个系统。架构清晰、维护简单,能够快速响应业务需求变化。
(3)容错机制与高可靠性
通过系统设计和流程编排构建容灾能力:某个 Agent 执行失败时,协调者可重新分配任务给备用 Agent,或调整策略继续执行。系统消除了”单点故障”,容错能力和稳定性显著提升,满足企业级关键业务要求。
在多智能体协作系统中,任务执行模式类似于一个专业团队:一个“PM Agent”统筹全局,负责任务分解、进度协调和结果整合;多个”专业领域 Agent”各司其职,分别负责产品设计、UI 设计、前端开发、后端开发等具体子任务。这种协作模式带来了一个核心挑战:如何在多个 Agent 之间高效、准确地传递上下文信息? 这直接决定了多智能体系统的成败。正因如此,在 2025 年初,AI 领域的领军人物如 Tobi Lütke 和 Andrej Karpathy 等人开始强调 Context Engineering(上下文工程)的重要性。越来越多的开发者和研究者也认识到 Context Engineering 成为多智能体系统研发中的重中之重,它不仅仅是简单的信息传递,而是一门精妙的工程与语言的艺术:
06
阶段四: 多智能体蓬勃发展
以 n8n、dify、Coze 等低代码平台为代表的工作流式平台大行其道,其核心是预先编排好的任务路径。这种模式的可控性极高、结果稳定可预测,但牺牲了系统的自主性和灵活性,更像一个高效的自动化执行器。
Workflow AI Agents(工作流式多智能体)采用确定性的流程设计:
与 Workflow AI Agents 追求确定性流程不同,一部分研究者和开发者开始探索更高层次的智能系统——一个能够像人类助手一样自主思考、动态规划、灵活执行的超级智能伙伴。这就是 Agentic AI 的核心理念:追求将所有的工作内容都交给 AI 自主完成,从任务理解、流程设计到具体实施,实现全流程的智能化代理。
2024 年 3 月,吴恩达首次公开提出 Agentic AI 概念,英伟达 CEO 黄仁勋于 2025 年 3 月将其列为生成式 AI 后的重要发展阶段,标志着 Agentic AI 从学术概念正式进入产业视野。阿里巴巴在 2025 年 11 月战略规划中明确当前 AI 技术已进入 Agentic AI 阶段。
目前对 Agentic AI 的定义主要来自两个视角:
百科定义视角(2025 年 10 月版):Agentic AI(代理式人工智能)是人工智能领域的新兴方向,其核心特征在于能够通过自主感知、推理、规划与执行,独立完成复杂多步骤任务。相较于工作流类 AI 工具,它具备主动性、自治性和环境适应性,可脱离人类直接控制进行决策与交互。
百科定义视角(2025 年 11 月版):Agentic AI(代理式人工智能)是人工智能领域的新兴方向,其核心特征在于能够通过自主感知、推理、规划与执行,独立完成复杂多步骤任务,具备主动性、自治性和环境适应性。相较于传统 AI 工具,它可脱离人类直接控制进行决策与交互,通过感知→推理→执行→学习的闭环实现持续优化,能够跨应用程序调度任务并自主执行超 50 步操作。
研究者定义视角:Agentic AI 是一种新兴的智能架构,利用多个专业化 Agent 协作来实现复杂且高层次的目标。这些系统由模块化的 Agent 组成,每个 Agent 负责更广泛目标的一个独特子组件,并通过集中式协调器或去中心化协议进行协调。
虽然各方对 Agentic AI 的定义侧重点不同,但都指向了同一个核心方向——追求更高程度的自主性和代理能力。为了更深入地理解这一概念,我们需要跳出字面定义,从本质层面来把握 Agentic AI 的核心内涵。
从本质上看,Agentic AI(代理式人工智能)追求的是最大程度的代理性和自主性,让 AI 系统能够像人类助手一样,独立代理人类思考及处理复杂事务。正如吴恩达在演讲中所指出的:“Agent” 是一个名词,代表具体的智能实体;而 “Agentic” 则是一个形容词,代表着一种程度概念——即系统具备代理能力的程度和自主性的水平。
这种“程度概念”揭示了 Agentic AI的核心特征:它不是一种固定的技术形态,而是一个从低到高的能力连续体。不同系统在这个连续体上占据不同的位置——预设流程的 Workflow AI 工作流处于连续体的较低端,具备基础的自动化能力和简单的代理能力;而 Cursor、Claude Code 等编程助手则接近连续体的高端,展现出高度的自主性和动态规划能力。结合前文的定义可以看出,只有当系统的自主性和代理能力达到一定阈值——能够自主感知、推理、规划与执行复杂任务时,才能称之为真正意义上的 Agentic AI。
根据目前业界认可的 Agentic AI 项目或者软件工具, Agentic AI 一般具有以下特征能力:
07
站在 AGI 回望 Agentic AI
正如人类从使用工具到创造工具的进化推动了文明的发展,Agentic AI 系统从工具调用到工具创造的跃迁,也标志着智能系统自主能力的质的飞跃。Agentic AI 正在通过这种持续的能力演进,逐步缩小与 AGI 愿景之间的差距。
08
写在最后
回到文章开篇的洞察:真正改变游戏规则的从来不是单一技术的突破,而是技术组合后涌现出的新能力。 从 LLM 到 Agentic AI 的演进历程,正是这一规律的生动印证。
LLM 的出现为技术组合进化提供了前所未有的可能性。当 LLM 的自然语言理解能力、基础性的软件工程能力、Function Calling 的准确执行能力、多 Agent 的协作机制、Context Engineering 的上下文管理能力逐步组合在一起时,我们看到了智能的涌现:AI 系统开始具备自主规划、动态执行、工具创造的能力,从被动的对话工具进化为主动的智能伙伴。
这种能力的叠加并非线性累积,而是质的跃迁。正如《技术的本质》所揭示的,新技术的组合会涌现出超越单个组件的系统能力,而这些新能力又会成为下一轮技术创新的基础,形成递归创造的循环。Agentic AI 正处在这样一个加速演进的轨道上。
在通往 AGI 的征途中,Agentic AI 是一个关键的前站。它的能力边界将持续扩展,不断刷新我们对“智能代理”的认知。我们或许无法精确预测其最终形态,但可以确信的是:当 AI 不仅能使用工具,还能创造工具;不仅能执行任务,还能规划任务;不仅能响应指令,还能理解意图——这种从工具到伙伴的转变,正在深刻地改变人类与智能系统的协作范式。
技术的进化不会停止,而我们正站在这场智能革命最激动人心的时刻。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-11-24
聊聊Palantir是如何将AI应用到实际的
2025-11-24
在全世界都教你写Prompt的时候,我做了个不用Prompt的AI画图产品
2025-11-24
谈LLM应用层目前推荐的新功能研发范式
2025-11-24
我来彻底说说 AI 上下文工程(下)
2025-11-24
Nano Banana Pro 完全指南!
2025-11-24
Cursor看了都要菊花一紧!Google AntiGravity 官方教程生猛来袭!
2025-11-24
不服 Gemini 3!Claude 祭出 Skills“反杀” 器!
2025-11-24
麦肯锡最新重量级报告:《The State of AI》全球企业AI应用现状——AI飞速普及,但能转化成利润的企业,只有 6%
2025-09-19
2025-10-02
2025-09-16
2025-10-26
2025-09-08
2025-09-17
2025-09-29
2025-09-14
2025-10-07
2025-09-30
2025-11-23
2025-11-19
2025-11-19
2025-11-19
2025-11-18
2025-11-18
2025-11-17
2025-11-15