我要投稿

可信Agent构建之道：AI如何重塑工作流？

发布日期：2024-08-07 09:05:43 浏览次数： 2766

作者：AI小智

微信搜一搜，关注“AI小智”

在之前的博客文章中，我们探讨了基于聊天的代理用户体验，其中用户需要主动思考如何与AI进行交流。但如果AI能在后台默默为您工作，那会怎样呢？

我认为，为了让代理系统真正发挥潜力，我们需要转变观念，让AI在后台默默工作。当任务在后台处理时，用户通常更能接受较长的完成时间，因为他们对即时响应的期望降低了。这样，代理就能更自由地进行工作，往往比在聊天界面中更加细致和认真。

此外，让代理在后台运行，也使我们能够更有效地扩展我们的能力。聊天界面通常限制我们一次只能处理一个任务。但如果代理能在后台环境中运行，就可以有多个代理同时处理多个任务。

那么，这种后台代理的用户体验应该是什么样的呢？

编辑注：本文经翻译并二次整理自UX for Agents, Part 2: Ambient一文。

建立对后台代理的信任：从“人在循环中”到“人在循环上”

要让代理在后台运行，需要建立一定程度的信任。如何建立这种信任呢？

一个简单直接的方法是向用户展示代理正在做什么。展示它采取的所有步骤，并让用户能够观察整个过程。虽然这些信息可能不会立即显示（就像实时响应那样），但它应该可以让用户点击查看。

接下来，不仅要让用户看到发生了什么，还要让他们纠正代理。如果用户发现代理在10步中的第4步做出了错误的选择，他们应该能够回到第4步并进行某种方式的纠正。

这种纠正可以采取多种形式。让我们以一个具体的例子来说明，比如纠正一个错误调用工具的代理：

你可以手动输入正确的工具调用命令，让它看起来像是代理自己输出的，然后从那里继续执行。
你可以给代理明确的指示，告诉它如何更好地调用工具——比如，“使用参数X而不是参数Y”，然后让代理更新其预测。
你可以更新代理在特定时间点的指示或状态，然后从那个步骤重新开始执行。

选项2和3的区别在于代理是否意识到了自己的错误。在选项2中，代理面对自己之前的错误生成，并被要求进行纠正；而在选项3中，它并不知道自己的预测错误（只是简单地遵循了更新后的指示）。

这种方法将人类的角色从“在循环中”转变为“在循环上”。“在循环上”意味着能够向用户展示代理采取的所有中间步骤，允许用户在工作流程中途暂停，提供反馈，然后让代理继续执行。

一个已经实现了类似这种用户体验的应用是Devin，AI软件工程师。Devin可以长时间运行，但你可以看到所有采取的步骤，回溯到特定时间点的开发状态，并从那里进行纠正。

整合人类输入：代理在需要时如何寻求帮助

尽管代理可能在后台运行，但这并不意味着它需要完全独立地完成任务。总会有一些时刻，代理不知道该怎么做或如何回答。这时，它需要引起人类的注意并请求帮助。

以我正在构建的电子邮件助理代理为例。尽管电子邮件助理可以处理基本的邮件，但它经常需要我在某些任务上的输入，这些任务我不想自动化。这些任务包括审查复杂的LangChain错误报告，决定我是否参加会议等。

在这种情况下，电子邮件助理需要一种方式来告诉我它需要信息来响应。注意，它不是要求我直接回应；相反，它寻求我对某些任务的意见，然后它可以利用这些信息来制作和发送一封漂亮的电子邮件或安排日历邀请。

目前，我将这个助手设置在Slack上。它向我提出问题，我在线程中回应它，这样自然地融入了我的工作流程。如果我考虑这种类型的用户体验，而不仅仅是针对我自己的电子邮件助手，我会设想一个类似于客户支持仪表板的界面。这个界面将显示所有需要人类帮助的区域，请求的优先级，以及任何额外的元数据。

我最初用“代理收件箱”这个词来描述这个电子邮件助手 - 但更准确地说，它是一个人类协助代理完成某些任务的收件箱……这是一个有点令人不寒而栗的想法。

结论

我对环境型代理非常看好，因为我认为它们是让我们扩展自己能力的关键。

如果您正在使用环境型代理构建应用程序，请与我们联系。我们很乐意听听您的经验！

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-03

你的公司需要一个"养Agent的人"，但没人知道这个岗位叫什么

2026-05-18

你的下一位同事，可能是“管 AI 的 AI”

2026-04-29

拦截率从15%到55%：快手智能Oncall系统演进与落地实践

2026-02-11

别再让语音机器人“答非所问”：AI Force任务型语音对话技术总结

2026-01-20

用AI做物业管理与租赁助手，A16Z领投2.5亿美元，这家AI团队年营收超1亿

2026-01-19

熠智AI+Milvus:从Embedding 到数据处理、问题重写，电商AI客服架构怎么搭？

2026-01-10

智“会”锦囊：大模型重塑咨询响应新范式

2026-01-07

AI大跃进：Salesforce裁员4000人后的“科技宿醉”与一场关于生产力的集体幻觉

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

拦截率从15%到55%：快手智能Oncall系统演进与落地实践

2026-04-29

你的下一位同事，可能是“管 AI 的 AI”

2026-05-18

你的公司需要一个"养Agent的人"，但没人知道这个岗位叫什么

2026-06-03

大家都在问

熠智AI+Milvus:从Embedding 到数据处理、问题重写，电商AI客服架构怎么搭？

2026-01-19

客服领域AI Startup领头羊Sierra凭啥估值100亿美金？

2025-11-22

当 AI 走出会议室：钉钉为什么率先抓住了“多数人的场景”？

2025-11-17

AI都能看片子了，放射科医生为什么却成了香饽饽？

2025-11-10

企业AI智能化建设中，如何处理 “业务优先” 与 “技术优先” 的核心矛盾？

2025-11-02

一键抓取链接、实时更新：AI代理如何从0帮你构建智能客服知识库？

2025-08-27

钉钉这一次能硬起来吗？

2025-08-25

AI+RAG，让“AI销冠”帮我卖货？

2025-08-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部