我要投稿

搭建AI智能体和工作流的门槛

发布日期：2025-05-13 07:29:32 浏览次数： 1734

作者：AI慢思考

微信搜一搜，关注“AI慢思考”

最近在短视频平台上，经常刷到教智能体搭建的直播。

有基于GPTs的，也有基于扣子（豆包的智能体搭建平台）的。

有些说得很耸动，打着变现的旗号；有些则比较务实，手把手地教学。

但无一例外，都将智能体描述成门槛低、人人可上手的工具。

扣子官网截图

上个月Force大会的第二天，我参加了扣子专场。

主办方邀请了多位嘉宾分享经验：有用扣子实现变现的个人，有将扣子应用到业务流程的企业负责人，还有利用扣子搭建应用创业的创始人。

几个月前，我尝试用扣子搭建了一个智能体，用于辅助我决定晚餐选择。不算成功，但也收获了一些心得体会。

昨天，我在公众号上线了基于扣子的AI客服，它可以结合我的公众号文章回答问题。同时，我还在开发一个帮助记录儿子每天表现的智能体。

虽然还不能自称智能体专家，但确实有一些个人见解。

智能体（如扣子）确实降低了应用开发的门槛，特别是在具备 LLM 能力的应用方面。但我不认为它毫无门槛，人人都能轻易上手。

你至少需要具备两种能力—— 逻辑和"人格分裂"。让我详细解释。

—

逻辑

在手机豆包App中也可以创建智能体，但功能有限。你只能通过智能体的人设描述来限定其功能，充其量是一个有特点的对话机器人。

而在扣子中创建的智能体则能力更强。

它可以拥有自己的知识库，通过插件获得技能（如上网搜索），还可以将对话中的结构化信息记录在数据库中。

你甚至可以通过扣子创建具有UI的应用，而不局限于对话方式。

在扣子智能体中，最关键的组成部分是工作流（Workflow）。

从名字和界面就能看出，它本质上是一个流程图，每个步骤称为节点。

工作流有始有终，上一步的输出是下一步的输入。所有节点按照特定规则和逻辑有序执行，可以分叉，也会汇合。

与传统程序所有功能都由代码实现不同，扣子工作流中的节点可以是LLM。它的输入输出都是自然语言，中间的处理部分交给LLM。

节点还可以是图像生成模型。

用企业项目流程图类比，你可以把每个LLM节点想象成项目中完成具体任务的人。

有过流程图设计经验的人都明白，这对逻辑思考能力有较高的要求。

程序员或许是逻辑能力最强的群体之一。

我在短视频平台看到的几个教智能体的博主或多或少都有程序员背景。他们也许没意识到，使用扣子虽然不需要编程语言知识，但需要通过编程培养的逻辑思考能力。

—

"人格分裂"

我承认，"人格分裂"的说法有些夸张，它指的是更细粒度的逻辑能力。

在多人协作任务中，你需要厘清不同人的任务之间的逻辑关系：一个人的输出是谁的输入，什么情况下由谁完成哪个步骤等。

前文提到，可以把扣子中的每个LLM节点想象成一个人，其实这样说还不够准确。

一个LLM节点并不能很好地完成一系列复杂工作，而是完成某一项需要人类能力的具体步骤。

这要求你能够将一个人的任务进行逻辑拆分，就像将一个人拆成多个分身，每个分身只执行其中的一步。有时甚至需要让"自己"评价审视"自己"的输出。

以我的公众号客服为例。

现实中，一个人就能胜任客服工作，看似是一个LLM就能完成的任务。但为了将智能体的回答限定在我的公众号文章范围内，我设置了4个LLM节点：

第一个判断读者的消息是否与AI相关、一般问候（如你好、谢谢）以及“其他”
第二个处理一般问候，将读者引导至AI相关的问题
第三个根据上下文改写用户问题。比如，读者先问"AI是什么"，接着问"它能做什么"，LLM需要将第二个问题改写成"AI能做什么"，以便更好地检索公众号文章
第四个结合用户问题和检索到的文章信息，组织语言回答

我将很多情形（比如“谁是世界上最美的女人”）都归类到"其他"，统一用标准回复处理（而不是，“她刚刚问了我一个问题”或者“反正不是你”）。

即便如此，这个工作流也已有11个节点。

当然，也可以将所有逻辑通过语言描述设置为一个LLM的人设，类似于SOP。

但首先，我不确定在扣子中这样做的效果；其次，在表达复杂逻辑时，二维的图形比线性的语言更具优势。

前两天看到一个视频：吴恩达的 DeepLearning 请了一位OpenAI员工演示GPT-4o1的使用方法。

他介绍了一种名为元提示（Meta Prompting）的技巧——让最新版本GPT- 4o1写了份超级详细的SOP，接着让GPT4o mini参考这份SOP扮演航空公司客服，对客户问题进行回复并选择相应操作程序（如退票）。

这份SOP甚至用到了5级编号（如3a2b2）！

由此不难理解，为什么那位企业负责人在将扣子应用到业务流程时，搭建了上百个智能体，拥有上万个节点。

—

结语

LLM的能力是把双刃剑。

它确实能在不编程的情况下完成很多任务，但其自由度和灵活性又不得不让我们通过工作流来控制它的行为，以获得符合预期的结果。

这就像在企业中拥有一名出类拔萃的员工：如何在需要她发挥创意时不限制其天马行空，又在需要她按照流程执行时不致过于信马由缰。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-08-06

Augmodo AI：零售门店智能货架管理平台

2025-08-06

dify案例分享-告别手工录入！Dify 工作流一键生成发票申请预览，对接开票系统超简单

2025-08-01

HiAgent新升级！打造与企业一起成长的智能体工作台

2025-08-01

聪明的AI硬件需要"藏拙"

2025-07-22

iPhone16 接入 Grok 4，国行果粉同步全球最强AI

2025-07-21

Dify v1.6.0：内置双向 MCP 支持

2025-07-08

微信支付这波操作把我干懵了，Agent能赚钱？

2025-07-08

OpenAI 的第一款 AI 硬件，竟然是一支笔？

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

96G显存的4060？简单聊下AI MAX 395的这颗核显8060s(gfx1151)

2025-05-20

Dify工作流：用爬虫批量把公众号文章存到AI知识库 | 保姆级教程

2025-05-29

Genspark：AI Agent 赛道的差异化突围者 | AI 智能体

2025-05-22

用MCPHub搭建本地自己的MCP平台

2025-05-18

微信支付这波操作把我干懵了，Agent能赚钱？

2025-07-08

Dify结合Echarts实现数据可视化-数据库篇

2025-06-04

深度研究「AI眼镜」

2025-06-28

“万字拆解”AI智变之道：智能体如何驱动组织进化

2025-05-19

Spring AI Alibaba 发布企业级 MCP 分布式部署方案

2025-05-21

一文讲清楚关于智能体之间的协作方式-A2A协议

2025-05-17

大家都在问

微信支付这波操作把我干懵了，Agent能赚钱？

2025-07-08

OpenAI 的第一款 AI 硬件，竟然是一支笔？

2025-07-08

企业当前适合引入大模型驱动的智能运维吗？

2025-05-27

我们是否应该用 Lite-GPU 构建 AI 集群？

2025-05-24

下一代软件交互：传统应用如何进化成AI Agent？

2025-05-17

A100、4090、RTX 6000 Ada、RTX 4000 Ada，谁是AI推理时代的真香卡？

2025-05-14

如何评测DeepSeek大模型一体机及实现业务价值？

2025-05-12

DeepSeek一体机和Qwen3一体机，选谁？

2025-05-09

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB