我要投稿

Google研究发现：Multi-Agent的核心竟然是Prompt设计！

发布日期：2025-06-15 05:51:59 浏览次数： 2108

作者：Datawhale

微信搜一搜，关注“Datawhale”

在多智能体系统（MAS：multi-agent systems）中，设计有效的提示和拓扑结构面临挑战，因为单个智能体可能对提示敏感，且手动设计拓扑结构需要大量实验。

论文地址：https://arxiv.org/pdf/2502.02533

论文名称：Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies

为了自动化整个设计过程，Google & 剑桥大学首先对设计空间进行了深入分析，旨在了解构建有效MAS的因素。发现：提示设计对下游性能有显著影响，而有效的拓扑结构只占整个搜索空间的一小部分。

在数学问题上，Gemini 1.5 Pro 对比仅使用自我一致性（SC）、自我细化（reflect）和多智能体辩论（debate）进行扩展的智能体，展示了每个问题的提示优化智能体的准确率与总标记数的关系。误差条表示1个标准差。我们表明，通过更有效的提示，利用更多的计算资源可以获得更高的准确率。

使用 Gemini 1.5 Pro 的不同拓扑结构的性能与基础智能体相比，每个拓扑结构都通过 APO 进行了优化，其中“Sum.”（总结）和“Exe.”（执行器）是如图4所示的任务特定拓扑结构。我们观察到，并非所有拓扑结构都对多智能体系统（MAS）设计有积极影响。

基于这些发现，Google&剑桥大学提出了Mass框架，该框架通过三个阶段优化MAS：

块级（局部）提示优化：对每个拓扑块中的智能体进行提示优化。
工作流拓扑优化：在修剪过的拓扑空间中优化工作流拓扑结构。
工作流级（全局）提示优化：在找到的最佳拓扑结构上进行全局提示优化。

提出的多智能体系统搜索（Mass）框架通过在可定制的多智能体设计空间中交错进行提示优化和拓扑优化，发现了有效的多智能体系统设计（右侧为经过优化的拓扑结构和优化的提示），关键组件如左侧所示

实验使用了Gemini 1.5 Pro和Flash模型，并与多种现有方法进行了比较，包括链式思考（CoT）、自我一致性（SC）、自我细化（Self-Refine）、多智能体辩论（Multi-Agent Debate）、ADAS和AFlow。

性能提升：Mass在多个任务上显著优于现有方法，平均性能提升约10%以上。
优化阶段的重要性：通过分阶段优化，Mass在每个阶段都取得了性能提升，证明了从局部到全局优化的必要性。
提示和拓扑结构的协同优化：Mass通过同时优化提示和拓扑结构，实现了比单独优化更好的性能。
成本效益：Mass在优化过程中表现出稳定且有效的性能提升，与现有自动设计方法相比，具有更高的样本效率和成本效益。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-03-15

Claude 这个更新，让模型能力提升10%+！

2026-03-14

100万上下文全面上线！Claude两款4.6模型取消长文本溢价，支持直塞600张图

2026-03-13

2026年国内如何注册 Claude 账号教程

2026-03-13

1300 万人围观，龙虾「杀手」来了

2026-03-13

从IDE到Terminal：适合后端宝宝体质的Claude Code工作流｜得物技术

2026-03-13

同一个 Claude，为什么别人跑出 78%，你只有 42%？也许你需要Harness工程

2026-03-13

破除偏见：阻碍生成式AI加速落地的认知桎梏

2026-03-12

OpenAI发布GPT-5.4金融套件：顶级数据库首次向普通用户开放

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Pencil：设计和写代码，以后就全让AI干了

2026-01-24

独家实录｜唐杰、杨植麟、林俊旸、姚顺雨...All Star 对话上，大家聊了啥？

2026-01-10

2026 开年 AI 工具推荐，让你新的一年效率起飞！（建议收藏）

2026-01-01

从0到1玩转Clawdbot：我花了40小时，把这些坑都踩完了

2026-01-26

Claude赢麻了？OpenAI Codex正式支持Skills，GitHub连夜上车！

2025-12-21

终于！Gemini CLI支持Agent Skills，一键搬运Claude Code的“绝招”

2026-01-09

Claude Code Skills 国内实践全指南：从安装部署到高阶开发

2026-01-09

谷歌没想到：Antigravity 竟成了 Claude Code 的“免费充电宝”？

2025-12-30

我装了 9 个 Skill，终于看懂了 Google Antigravity 的野心

2026-01-21

深度解析——为什么Claude code CEO Dario 如此反中？

2026-01-23

大家都在问

粮厂研究员Will | 小米miclaw发布：谈谈为什么豆包手机没有撑过72小时？

2026-03-09

如果微信全面 AI 化了，会有什么后果？

2026-03-08

马斯克大赞阿里 AI，9B 参数硬刚 120B，海外网友：这叫小模型？

2026-03-03

Claude Code 的记忆机制：从CLAUDE.md到Auto Memory，它到底记住了什么？

2026-03-01

AGENTS.md 真的能帮助编码智能体吗？

2026-02-27

谷歌 Nano Banana 2 凌晨突袭！生图速度飙升，价格直接腰斩，Pro 功能竟然也免费了？

2026-02-27

Claude Code Security 的发布，会如何重塑传统网络安全企业？

2026-02-26

当软件不值钱了以后，最稀缺的资源是什么？

2026-02-24

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部