支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


微软开源Web Agent项目:Magentic-UI!让 AI 成为真正“可控、协同、透明”的网页执行助手!

发布日期:2025-05-23 06:01:16 浏览次数: 1551 作者:AIGitHub
推荐语

探索微软最新AI项目Magentic-UI,开启网页执行新纪元!

核心内容:
1. Magentic-UI:微软新一代多智能体Web操作系统
2. 核心亮点:协同规划、协作执行、安全机制
3. 技术创新:神经样式引擎、组件DNA图谱、实时性能先知

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

当全球开发者还在为Copilot的代码生成能力惊叹时,微软的AI实验室在Build 2025 开发者大会上又甩出一张开源王炸——MAgentic-UI!

这是继 Magentic-One 后,微软推出的新一代多智能体 Web 操作系统!

它可以:

自动浏览网页、 读取文件、 写代码,还能和你配合完成任务。

但它不是全自动机器人,它是你和 AI 一起工作的小伙伴,你有最终的控制权,它只负责干活。

  • 所有操作都显示给你看,点击按钮、打开页面、发送信息,都会提前征求你同意。

  • 执行任务时,你可以随时暂停、修改计划、重启流程。

  • 你也可以设置哪些操作必须人工批准。

主要功能
    • 浏览网页自动点击、填表

    • 写代码、运行结果返回

    • 看文件内容并回答问题

    • 用户可以制定任务步骤,随时修改、暂停


    核心亮点

    协同规划:任务开始前,Magentic-UI 会生成详细的步骤计划,用户可以根据自己的需求和预期对计划进行调整和确认,保证任务按预期展开。

    协作执行:在任务执行过程中,系统会实时显示即将执行的动作,用户可随时接管控制权,确保任务执行符合需求。

    安全机制:在执行重要或不可逆的操作前,Magentic-UI 会征询用户同意,支持用户自定义审批规则,保护操作安全。有效避免了因 AI 决策失误而可能带来的损失,让用户在使用过程中更加安心。

    学习复用:任务结束后,系统会保存执行方案,用户可以在未来的任务中重复使用或修改这些方案,从而提升工作效率。随着使用次数的增加,Magentic-UI 会越来越了解用户的工作习惯和需求,提供更加个性化和高效的服务。

    技术创新
    • 神经样式引擎(NSE)采用类GPT-4的扩散模型,可将自然语言描述(如"科技感深蓝渐变")动态编译为CSS变量,同时保证多浏览器兼容性。

    • 组件DNA图谱每个组件都有可追踪的版本基因,支持跨项目的智能组件复用。某开源社区测试显示,组件重复开发率降低92%。

    • 实时性能先知在拖拽布局时,AI会预测页面加载性能,并给出优化建议。早期采用者反馈,首屏加载时间平均减少40%。



    当我们在惊叹Magentic-UI的神奇时,微软AI实验室负责人Chris Novak却说:"这仅仅是智能开发工具进化的第一个阶段。" 

    期待它将在未来的数字化生活和工作中发挥更大的作用,为我们带来更加高效、智能、安全的体验。

    GitHub:https://github.com/microsoft/magentic-ui

    53AI,企业落地大模型首选服务商

    产品:场景落地咨询+大模型应用平台+行业解决方案

    承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

    联系我们

    售前咨询
    186 6662 7370
    预约演示
    185 8882 0121

    微信扫码

    添加专属顾问

    回到顶部

    加载中...

    扫码咨询