微信扫码
添加专属顾问
我要投稿
探索智能体到用户交互协议(AG-UI)的创新解决方案。 核心内容: 1. AG-UI协议的必要性和背景介绍 2. AG-UI协议解决的智能体工具包集成问题 3. AG-UI协议技术细节与SDK支持
1智能体到用户交互(AG-UI)协议
1. MCP 标准化了Agent 到Tool 之间通信。
2. A2A(Agent2Agent )协议标准化了Agent 到Agent 通信。
但仍然缺少一块......
这就是智能体到用户通信的协议:
让我们了解为什么这很重要。
今天,我们可以使用LangGraph、CrewAI、Mastra 、dify、AutoGen、Hiagent(字节)等智能体工具工具包构建强大的多步骤智能体工作流。
但是,当您尝试将该Agent 引入实际应用程序时,事情就崩溃了:
1.您希望逐个Token流式传输LLM 响应,而无需构建自定义WebSocket 服务器。
2.您希望在工具执行进度发生时显示它,暂停以获得人工反馈,而不会阻塞或丢失上下文。
3.您希望同步大型、不断变化的对象(如代码或表格),而无需将所有内容重新发送到UI。
4.您希望让用户在智能体运行中中断、取消或回复,而不会丢失上下文。
这是另一个问题:
每个智能体后端都有自己的工具调用、ReAct 样式规划、状态差异和输出格式机制。
所以如果你使用LangGraph,前端将实现自定义的WebSocket 逻辑、杂乱的JSON 格式和特定于LangGraph 的UI 适配器。
但要迁移到CrewAI/Dify等,一切都必须进行调整。
这不会缩放。
AG-UI(智能体-用户交互协议)是CopilotKit 推出的开源协议,可解决此问题。
它标准化了后端智能体和前端UI 之间的交互层(下面的绿色层)。
可以这样想:
1.就像REST 是客户端到服务器请求的标准一样......
2.AG-UI 是将实时智能体更新流式传输回UI 的标准。
从技术上讲......
它使用服务器发送事件(SSE)将结构化JSON 事件流式传输到前端。
每个事件都有一个显式的有效负载(如Python 字典中的keys),例如:
1.TEXT_MESSAGE_CONTENT用于令牌流式处理。
2.TOOL_CALL_START以显示工具执行情况。
3.STATE_DELTA更新共享状态(代码、数据等)
4.AGENT_HANDOFF在智能体之间顺利传递控制权
并且它带有TypeScript 和Python 的SDK,使这种即插即用适用于任何堆栈,如下所示: |
在上图中,来自Agent 的响应并不特定于任何工具包。这是一个标准化的AG-UI 响应。
这意味着您需要编写一次后端逻辑并将其挂接到AG-UI 中,一切正常:
1.LangGraph、CrewAI、Mastra — 都可以发出AG-UI 事件。
2.可以使用CopilotKit 组件或您自己的React 堆栈构建UI。
3.您可以在本地将GPT-4 交换为Llama-3/DeepSeek V3,而无需更改前端中的任何内容。
这是让您的Agent 应用程序感觉像真实软件的层,而不仅仅是美化的聊天机器人。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-06-28
卷疯了!这个清华系Agent框架开源后迅速斩获1.9k stars,还要“消灭”Prompt?
2025-06-28
刚刚,马斯克宣布:Grok 4 将于7月4日后发布!
2025-06-27
Local MCP时代来临:一键集成AI的Desktop Extensions(.dxt)深度解析
2025-06-27
PaddleOCR 3.0重磅发布!OCR精度跃升13%,多场景文档解析全面升级
2025-06-26
动手学Dify:知识库与外部知识库
2025-06-26
Google刚刚开源的这个东西,让Claude慌了 | Gemini-CLI 提示词详细拆解
2025-06-26
免费!开源!Gemini CLI一比一复刻Claude Code!
2025-06-26
MiniCPM 4.0:面壁智能开源的极致高效端侧大模型(小版本、低消耗、220倍极致提速!)
2025-06-17
2025-06-17
2025-04-01
2025-04-13
2025-04-29
2025-04-01
2025-04-12
2025-04-10
2025-04-29
2025-04-29
2025-06-28
2025-06-25
2025-06-25
2025-06-21
2025-06-16
2025-06-15
2025-06-14
2025-06-10