2026年6月18日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

一文看懂 Agent Skills 运行全流程:从用户请求到结果返回的 16 步拆解

发布日期:2026-06-12 12:02:05 浏览次数: 1531
作者:多模态智能体

微信搜一搜,关注“多模态智能体”

推荐语

从用户请求到结果返回,Agent Skills 如何通过 16 步精准调度完成任务?本文用一张泳道图为你清晰拆解全流程。

核心内容:
1. 全局概览:7个角色与5层职责划分
2. 流程详解:16个步骤的4个执行阶段
3. 关键模块:路由调度与执行管理的核心作用

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
你有没有想过,当你对着一个 AI 助手说"帮我分析上个月各区域的销售数据,生成一份经营报告",它背后到底在做什么?
直觉上,可能会觉得这无非就是模型接收了你的话,然后吐出一段文字。但如果这件事真的是这样完成的,那你拿到的报告大概率是一堆凭空捏造的数字。
事实上,一个真正能干活的 Agent,背后跑的是一套完整的调度链路。这篇文章就从下面这张泳道图出发,把这条链路从头到尾拆清楚。

一、先看全局:7 个角色,分 5 层
读泳道图有个窍门:先别急着看箭头,先看"泳道"本身——每一列代表一个角色,每个角色只做自己这一列里的事。
这张图里一共有 7 个角色,从左到右排开,但它们并不是平等的。按职责层次来看,可以分成 5 层:
交互决策层:用户 + Agent
用户是任务的发起方,不关心背后用了什么技能,只关心最后拿到的结果。Agent 是决策中枢,负责理解意图,判断这件事能不能自己解决,解决不了的就往下传。
路由调度层:Skill Router
这是整张图里参与步骤最多的模块——从第②步开始介入,一直到第⑮步才完成使命。它的核心职责只有一件事:找到合适的技能,并把任务交出去。
注册发现层:Skill Registry
看图会发现,Skill Registry 只出现在第④⑤两步,进来、出去,干净利落。它的角色很像一本"技能目录",被查的时候出现,查完就退场。很多文章会把它描述成一个复杂的管理系统,但从执行链路来看,它的职责其实非常单一。
执行管理层:Skill Center
技能找到了之后,真正负责把任务跑起来的是 Skill Center。它负责加载能力体、下发任务、汇总结果,是链路里的执行调度者。
能力承载层 + 底层执行层:能力体 + 工具/引擎
能力体是具体业务逻辑的载体,比如数据分析、文档总结、报告生成等等。而工具/引擎是更底层的资源,比如数据库、代码执行器、搜索接口。能力体调用工具,工具真正干活。
有了这个分层概念,再回头看泳道图,箭头的流向会清晰很多。

二、16 步流程,分 4 个阶段来看
图里的 16 个步骤乍看密密麻麻,但如果按流程阶段分组,结构马上就清楚了。

第一阶段:任务接收(步骤①②)
① 用户发送消息 → Agent
这一步没什么好说的,就是用户输入了一个请求。值得注意的是,用户输入的往往是自然语言,比如"帮我生成一份报告",这背后隐含了大量模糊性——分析哪些数据?什么维度?什么格式?
② Agent 接收请求,并向 Skill Router 发起技能请求
这一步才是真正有意思的地方。Agent 在这里需要做一个判断:这件事我自己能搞定吗?
如果是"明天天气怎么样"这类简单问题,Agent 大概率直接回答,不会触发后面那 14 步。但如果是"分析数据并生成报告",Agent 判断出这需要外部能力,于是才会把请求转发给 Skill Router。
这个判断逻辑,是 Agent 系统能不能用好的关键之一。

第二阶段:技能发现(步骤③④⑤⑥)
③ Skill Router 向 Skill Registry 发起查询
Skill Router 接手请求后,先要解决的问题是:现在系统里有哪些技能可以用?于是它向 Skill Registry 发起查询请求。
这里要注意,③是 Skill Router 发出的查询动作,而④是 Skill Registry 内部的处理动作——两者是不同主体的行为,不能混在一起说。
④ Skill Registry 查询内部技能注册表
Skill Registry 里存的是每个技能的元信息:名称、适用场景、输入输出参数、版本、权限等等。收到查询请求后,它在自己的注册表里比对,找出候选技能。
⑤ Skill Registry 返回技能列表
把匹配到的技能列表返回给 Skill Router。注意,到这里 Skill Registry 就完成使命了,后续流程里它不会再出现。
⑥ Skill Router 调用 Skill Center
Skill Router 拿到技能列表后,确定要调用哪个(或哪几个)技能,然后把请求连同目标技能 ID、任务参数、权限信息等一并转发给 Skill Center。从这一步开始,任务进入执行阶段。

第三阶段:技能执行(步骤⑦⑧⑨⑩⑪⑫)
这一阶段是整张图最核心的部分,也是原图里箭头最密集的地方。
⑦ Skill Center 加载能力体
Skill Center 收到请求后,根据技能 ID 找到对应的能力体,把它加载起来。这一步相当于把"一个抽象的技能"映射到"一个具体可运行的执行单元"。
⑧ 能力体返回能力详情
能力体加载完成后,会把自己的状态反馈给 Skill Center:当前是否可用、支持哪些参数、是否有前置条件,等等。这是一次确认握手,确保后续可以正常执行。
⑨ Skill Center 下发执行任务
确认能力体可用之后,Skill Center 正式向能力体下达执行指令。到这里,任务才算真正开始跑了。
⑩ 能力体调用工具/引擎,工具链启动
能力体在执行过程中,往往需要调用底层工具。比如数据分析能力体,可能需要先从数据库里拉数据,再调用计算模块,再调用图表生成器。
图中在这一步特意画了一个循环箭头,说明工具调用不是一次就完事的,而是可能经历多轮。这就是"工具链"的含义——一个任务可以串联多个工具依次执行。
⑪ 执行中(持续状态)
这是图中单独标注的一个状态节点,区别于⑩的"启动动作"。它表示工具/引擎正在持续运行,可能需要一段时间才能完成。这种设计在工程上很重要,因为涉及到超时控制、状态轮询、异常中断等问题。
⑫ 工具/引擎返回执行结果
工具执行完毕,把结果返回给能力体。返回内容可能是原始数据、计算结果、文件链接,也可能是报错信息。

第四阶段:结果回传(步骤⑬⑭⑮⑯)
这一阶段是正向调用的镜像——结果沿着调用链原路返回,每一层都要做自己的处理。
⑬ 能力体将结果返回给 Skill Center
能力体拿到工具返回的原始结果后,会做一层处理:格式统一、异常兜底、多工具结果合并等,然后把处理后的结果上交给 Skill Center。
⑭ Skill Center 处理结果,返回给 Skill Router
Skill Center 收到后继续处理:结果聚合、状态判断、日志记录、链路追踪等,然后交给 Skill Router。
⑮ Skill Router 将结果返回给 Agent
Skill Router 在这里会做最后一轮封装,确保返回格式符合 Agent 的预期,然后上交。
⑯ Agent 返回最终结果给用户
Agent 拿到结构化结果后,还需要做最后一件事:把它变成用户能读懂的自然语言。这不是简单转发,而是包含了语言组织、解释说明、格式调整,有时候还需要判断是否要继续追问或调用另一个技能。
最终用户看到的,是一个干净、完整、可理解的答案。而背后,是 7 个模块协作跑完的 16 步。

三、为什么要设计成这样?
看完流程之后,一个自然而然的问题是:为什么不让 Agent 直接调用工具?这中间绕了这么多层,不是多此一举吗?
这里有三个真正值得说的原因。
第一,职责边界清晰,各管各的
Skill Registry 只参与两步,Skill Router 只负责找技能,工具/引擎完全不感知上层逻辑。这种设计让每个模块都可以独立演化——你换一套工具不会影响路由逻辑,你改了注册表格式不会让能力体崩掉。
第二,Agent 和工具完全解耦
从图中可以看到,Agent 只和 Skill Router 交互,从头到尾没有直接碰过工具/引擎。这意味着:当你接入一个新工具,Agent 完全不需要改造。对于一个要持续扩展能力的 Agent 平台,这个属性非常关键。
第三,工具链支撑复杂任务
步骤⑩⑪的循环结构告诉我们,工具执行是可以迭代的,不是一次性的。这是 Agent 能处理复杂任务的底层基础——读文件、清洗数据、计算指标、生成图表、输出报告,可以是一条串联的工具链,而不需要用户一步步手动触发。

四、用一个真实场景串起来
说了这么多抽象概念,用一个具体场景把整条链路走一遍:
用户输入:帮我分析上个月各区域销售数据,生成一份经营分析报告。
①用户发送请求,②Agent 判断这需要数据分析 + 报告生成能力,向 Skill Router 发起请求。
③Skill Router 查询 Skill Registry,④Skill Registry 在注册表里找到"数据分析 Skill"和"报告生成 Skill",⑤把列表返回给 Skill Router,⑥Skill Router 携带任务参数调用 Skill Center。
⑦Skill Center 加载数据分析能力体,⑧能力体确认可用,⑨Skill Center 下发执行任务。
⑩能力体调用数据库工具拉取销售数据,工具链开始运转:拉数据 → 清洗 → 计算各区域指标 → 生成趋势图,⑪工具持续执行中,⑫执行完毕返回结果给能力体。
⑬能力体整合结果交给 Skill Center,⑭Skill Center 处理后交给 Skill Router,⑮Skill Router 返回给 Agent,⑯Agent 把结构化的分析结果组织成一份完整的经营分析报告,呈现给用户。
整个过程用户只做了一件事:说了一句话。

五、留给技术读者的几个问题
如果你是做 Agent 平台的,有几个问题值得深入想:
步骤⑧"返回能力详情"之后,如果能力体返回"不可用",系统应该如何降级?是报错,还是尝试调用备用技能?这套降级策略应该定义在哪一层?
Skill Registry 的技能元数据里,应该包含哪些字段才算足够用?只有名称和描述显然不够,但字段太多又会让注册和维护成本升高,边界在哪?
当一个用户请求需要同时调用多个技能时,Skill Center 是串行调度还是并行调度?并行的话,结果聚合的逻辑应该怎么设计?
这些问题没有标准答案,但每一个都指向真实的工程决策。

六、最后说一句
Agent 体系里,"会对话"只是入场券,真正的门槛是"会执行"。
这张 16 步的泳道图,说白了就是在回答一个问题:当用户说出那句话之后,系统怎么把它变成真实世界里发生的动作,然后再把结果送回来。
搞清楚这条链路,才算是真正理解了 Agent 从对话入口走向任务执行平台这件事背后的工程逻辑。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询