微信扫码
添加专属顾问
我要投稿
Google与剑桥大学最新研究揭示:多智能体系统的核心突破在于提示设计优化,性能提升高达10%! 核心内容: 1. 多智能体系统中提示设计对性能的关键影响 2. Mass框架三阶段优化方法解析 3. 在数学任务上相比现有方法的显著优势
论文地址:https://arxiv.org/pdf/2502.02533
论文名称:Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies
基于这些发现,Google&剑桥大学提出了Mass框架,该框架通过三个阶段优化MAS:
块级(局部)提示优化:对每个拓扑块中的智能体进行提示优化。
工作流拓扑优化:在修剪过的拓扑空间中优化工作流拓扑结构。
工作流级(全局)提示优化:在找到的最佳拓扑结构上进行全局提示优化。
实验使用了Gemini 1.5 Pro和Flash模型,并与多种现有方法进行了比较,包括链式思考(CoT)、自我一致性(SC)、自我细化(Self-Refine)、多智能体辩论(Multi-Agent Debate)、ADAS和AFlow。
性能提升:Mass在多个任务上显著优于现有方法,平均性能提升约10%以上。
优化阶段的重要性:通过分阶段优化,Mass在每个阶段都取得了性能提升,证明了从局部到全局优化的必要性。
提示和拓扑结构的协同优化:Mass通过同时优化提示和拓扑结构,实现了比单独优化更好的性能。
成本效益:Mass在优化过程中表现出稳定且有效的性能提升,与现有自动设计方法相比,具有更高的样本效率和成本效益。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-03-15
Claude 这个更新,让模型能力提升10%+!
2026-03-14
100万上下文全面上线!Claude两款4.6模型取消长文本溢价,支持直塞600张图
2026-03-13
2026年 国内如何注册 Claude 账号教程
2026-03-13
1300 万人围观,龙虾「杀手」来了
2026-03-13
从IDE到Terminal:适合后端宝宝体质的Claude Code工作流|得物技术
2026-03-13
同一个 Claude,为什么别人跑出 78%,你只有 42%?也许你需要Harness工程
2026-03-13
破除偏见:阻碍生成式AI加速落地的认知桎梏
2026-03-12
OpenAI发布GPT-5.4金融套件:顶级数据库首次向普通用户开放
2026-01-24
2026-01-10
2026-01-01
2026-01-26
2025-12-21
2026-01-09
2026-01-09
2025-12-30
2026-01-21
2026-01-23
2026-03-09
2026-03-08
2026-03-03
2026-03-01
2026-02-27
2026-02-27
2026-02-26
2026-02-24