我要投稿

大模型 Agent 就是文字艺术吗？

发布日期：2025-05-23 23:59:16 浏览次数： 1772

作者：ChallengeHub

微信搜一搜，关注“ChallengeHub”

最近在技术圈里有一个很有趣的争论：大模型 Agent 是不是就是各种 Prompt 的堆叠？像 Manus 这样看起来很智能的 Agent，本质上是不是就是用巧妙的 Prompt 约束大模型生成更好的输出？换句话说，这是不是一门文字艺术？

这个问题引发了业内专家的激烈讨论，观点分化明显。让我们来看看不同的声音。

两大阵营的观点碰撞

观点一：就是文字艺术，没必要遮遮掩掩

有开发者直言不讳地表示："没人敢说实话吗？是的，就是各种 Prompt 的堆叠。"另一位实战派开发者更加犀利："LLM 的 input 就是 prompt，不管什么工具或模型，都只是优化 prompt。大把人把'优化 prompt'的工具吹得云里雾里，却有意无意回避其目的还是只是生成更好的 prompt。"

这种观点认为，Agent 可以看做 prompt engineering 的升级版。核心在于如何具体设计 prompt，如何拆分，顺序是什么。其他那些复杂的架构设计，在他们看来都是在"象牙塔里扯淡"。

观点二：远不止文字游戏这么简单

但技术专家们显然不买账。有人从工程角度分析："生产级别的工程显然不仅仅是 Prompt 这么简单。"以 OpenHands 为例，对接 LLM 只是其中一个模块，真正驱动 Agent 完成复杂任务的核心，是一整套事件驱动机制，包括状态机、事件流框架、控制器等等，还用到了像 Sandbox 这样的沙箱技术。

另一位专家总结得更加全面："真正可用的 Agent = Prompt（语言接口）+ 程序化编排 + 长期状态/记忆 + 外部工具动作 + 自反馈循环。缺少任何一环，都会从'自治智能体'迅速退化成'高级聊天机器人'。"

Agent 的本质是什么？

从技术定义来看，Agent 本质上是一个循环系统。对于一个给定目标的 AI Agent，它能够自己创建任务、完成任务、创建新任务、重新确定任务列表的优先级，并循环直到达到目标。

用公式表达就是：Agent = LLM + Planning（计划）+ Tool use（执行）+ Feedback（纠正偏差）

这个定义揭示了一个关键点：Agent 让 LLM 具备了目标实现能力，通过自我激励循环来完成给定目标。

关键在于状态管理

有一个被很多人忽视的技术细节：现在几乎所有的大模型 API 都是无状态的。大模型 API 连鱼的七秒记忆都没有，它甚至记不住自己上一次的回答是什么。

那为什么我们在 AI 聊天工具里能看到它"记住"了历史对话呢？实际上，是把以前的历史会话每次都重新传给大模型一遍，让它看起来有了记忆。这就是把无状态的 API 做成有状态的样子。

随着应用复杂化，状态管理变得越来越重要。真正厉害的 Agent 拼的其实是状态管理能力。

Prompt 的真正作用

一位分析过 Manus 和 OpenManus 项目结构的开发者指出，Prompt 确实很重要，它可以在不微调大模型的情况下，根据先验知识引导大模型行为，达到期待的业务效果。

但关键是：Prompt 是 Agent 系统中大模型和其他各个组件的润滑油，而不是全部。

以 OpenManus 为例，其结构主要包括：

Agent（智能体）
Flow（流程）
Tool（工具）
Prompt（提示词）

Prompt 只是其中一个组件。

技术的进化逻辑

从技术发展的角度看，这场争论其实反映了不同阶段的认知差异：

初级阶段：确实主要靠 Prompt 工程，通过精心设计的提示词让模型表现更好。

中级阶段：开始引入工具调用、多轮对话、简单的状态管理。

高级阶段：构建完整的事件驱动系统，包含复杂的状态机、内存管理、自主规划和执行能力。

企业级阶段：需要考虑并发、容错、监控、安全等工程化问题。

结论：既是也不是

回到最初的问题：大模型 Agent 是不是文字艺术？

答案是：既是也不是。

从某种意义上说，所有与 LLM 的交互最终都要通过文字（Prompt）来实现，这确实是一门语言艺术。设计好的 Prompt 需要对语言有深刻理解，需要巧妙的措辞和精确的逻辑。

但将 Agent 简单等同于 Prompt 堆叠，就像说建筑就是砖块堆叠一样——技术上没错，但忽略了设计、结构、工程等更重要的层面。

真正的 Agent 系统需要：

精心设计的 Prompt（文字艺术）
复杂的状态管理（系统工程）
智能的任务规划（算法设计）
可靠的工具调用（接口工程）
持续的自我优化（反馈机制）

写在最后

这场争论的价值不在于谁对谁错，而在于推动我们更深入地思考 AI Agent 的本质。

对于初学者，从 Prompt 工程开始确实是一个好的起点，它能让你快速理解如何与 AI 交互。

对于有经验的开发者，则需要跳出 Prompt 的局限，从系统工程的角度思考如何构建真正可用的智能体。

技术的进步往往就是在这样的争论中螺旋上升的。无论你站在哪一边，都要承认：我们正在见证一个激动人心的技术变革时代。

你觉得大模型 Agent

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-08-22

深度智能体革命：为什么 LLM 应用正从浅层走向深度？

2025-08-22

万字长文预警？不，关于MCP，看这篇就够了

2025-08-22

浅谈大模型在安全运营中的落地

2025-08-22

浅谈大模型在威胁分析的落地上篇

2025-08-22

大模型工具的 “京东答案”

2025-08-22

GenAI企业应用落地，成功率 5%？

2025-08-22

别再搞多智能体了！大模型Agent开发的三大误区

2025-08-22

深度 | Anthropic内部构建AI智能体的第一性原理

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

2025-08-21

DeepSeek R1-0528 小版本升级

2025-05-29

SpringAI Alibaba实战文生图、聊天记忆功能

2025-06-01

精|知识探索新范式：深度研究Deep Research智能体全面综述，系统、方法与应用

2025-06-21

AIGC合规落地全景图 | 如何做好AIGC数据合规

2025-06-07

别再被MCP协议绕晕！一文搞懂连接流程与核心架构

2025-06-12

DeepSeek V3.1 测评

2025-08-19

能办成事的 Agent：实时与环境交互，从经验中学习

2025-06-19

聊聊AI应用架构演进

2025-06-13

这篇AI Agent漫游指南，带你建立全面的科技史观

2025-05-28

大家都在问

深度智能体革命：为什么 LLM 应用正从浅层走向深度？

2025-08-22

GenAI企业应用落地，成功率 5%？

2025-08-22

DeepSeekV3.1 提到的 UE8M0 FP8 Scale 是什么？下一代国产芯片设计？

2025-08-21

从Prompt到Context：为什么Think Tool是形式化的必然？

2025-08-20

字节跳动发布M3-Agent：当AI拥有了“记忆”，世界将如何被重塑？

2025-08-19

大模型下半场，腾讯手里还有哪“三张牌”？

2025-08-19

AI应用从“工具”到“工作流”，下一个引爆点在多智能体系统？

2025-08-18

可实时交互的AI生成世界，腾讯发布的AI框架Yan，会是元宇宙的破局者吗？

2025-08-18

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部