免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

AgentCore 重磅更新!细粒度权限控制 + 双模式评测,AI 智能体开发再提速

发布日期:2025-12-09 16:19:50 浏览次数: 1538
作者:智识进化论

微信搜一搜,关注“智识进化论”

推荐语

AWS AgentCore重磅更新,细粒度权限控制+双模式评测让AI智能体开发更安全高效!

核心内容:
1. Policy模块实现毫秒级细粒度权限管控,支持参数级精准控制
2. Evaluation模块提供On-Demand和Online双模式评测,覆盖全开发周期
3. 对比竞品优势明显,重新定义企业级Agent开发标准

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
AI Agent 落地难的核心痛点终于有解了!AWS AgentCore 推出关键更新,新增 Policy(权限控制)和 Evaluation(质量评测)两大核心模块,一边用毫秒级细粒度权限筑牢安全防线,一边靠双模式评测打通开发闭环,直接对标 AgentKit、火山评测等竞品,重新定义企业级 Agent 开发标准

一、Policy 模块:给 Agent 装 “权限防火墙”,精准管控每一次工具调用


Agent 自主调用工具时的权限失控、参数误操作,一直是企业落地的最大顾虑。AgentCore 新增的 Policy 模块,直接用 “角色 + 工具 + 参数” 三维控制逻辑,把权限管理做到极致:

核心能力:细到参数级的精准管控

简单说,Policy 能明确界定 “什么角色的 Agent,在什么网关下,调用什么工具时,满足什么参数条件才能通过”。比如电商场景中,可直接设置 “仅‘退款 Agent’能调用退款工具,且单笔金额低于 200 美元才允许执行”,从源头避免越权操作和资金风险。

实用亮点拉满

    • 规则定义门槛低:无需复杂编码,支持 Cedar 策略语言或自然语言生成,可实现工具级、操作级、参数级的多层级管控

    • 智能策略校验:自动识别过宽、过严或无法满足的无效规则,规避权限漏洞与业务阻塞风险

    • 高效灵活部署:毫秒级权限评估响应,不影响 Agent 运行效率;支持生产环境强制执行与调试环境日志输出双模式,适配全开发周期

    • 按需付费模式:无预付要求与最低消费限制,单次授权请求收费 0.000025 美元,每 1000 个输入 Token 收费 0.13 美元,中小团队可轻松负担

    竞品对比:力压 AgentKit,权限管控更极致

    目前 AgentKit Gateway 尚未支持工具级、操作级、参数级的细粒度控制,仅能做基础权限管理;而 AgentCore 已实现全链路精准管控,且底层联动网关可直接落地,反观 AgentKit 还在规划权限网关 + 策略池方案,短期内难以追平差距。


    二、Evaluation 模块:双模式评测,打通 “开发 - 上线 - 监控” 全闭环

    AI Agent 质量参差不齐,上线后效果不可控?Evaluation 模块直接给出解决方案,支持 On-Demand 和 Online 两种评测模式,覆盖从开发到运维的全场景:

    两大核心评测模式

    • On-Demand Evaluation(按需评测)
      适配 CICD 场景,Agent 上线前做 “质量准出” 检测,支持轨迹评测(过程合规性)和端到端结果评测(效果达标率),避免不合格 Agent 流入生产
    • Online Evaluation(线上评测)
      基于 AgentCore 观测的日志数据,实时监控线上 Agent 运行质量,及时发现权限异常、工具调用失效等问题

    评测能力灵活适配

    内置 13 个预置评估器,覆盖合规性、准确性、效率等核心维度,还支持自定义模型评估器,满足企业个性化业务场景需求。对比来看,火山评测虽支持 50 + 预置评估器和代码评估器,但 AgentCore 的双模式评测更贴合 “开发 - 上线” 闭环,且能与自身可观测性模块深度联动,数据流转更高效。



    53AI,企业落地大模型首选服务商

    产品:场景落地咨询+大模型应用平台+行业解决方案

    承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

    联系我们

    售前咨询
    186 6662 7370
    预约演示
    185 8882 0121

    微信扫码

    添加专属顾问

    回到顶部

    加载中...

    扫码咨询