支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


一文搞懂:AI Agent 八大核心概念

发布日期:2025-05-18 10:47:51 浏览次数: 1524 作者:ToB老人家
推荐语

AI Agent的八大核心概念,带你深入了解人工智能的前沿应用。

核心内容:
1. 智能体(Agent):独立行动的AI实体及其应用场景
2. 多智能体系统:多个智能体协同工作的原理与挑战
3. RAG技术:提高智能体准确性的检索增强生成方法
4. 工作流:任务分解与智能体组件协作的业务流程

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

一、智能体(Agent


图片来源:百度

所谓智能体,指的是能独立采取行动以实现特定目标的 AI 实体。


想象你有一个贴心的小跟班,你让他干啥他就干啥。比如你让他查明天的天气,他立马就给你整得明明白白。


举个栗子,AI 面试官就是一个很棒的智能体。


它能够根据招聘要求,自主给候选人发送试邀请,然后自主进行视频面试,再自主进行面试评价,自主发送 offer。最后把招聘的统计报告发送给你。


是不是超省心?


当然了,智能体也存在很多缺陷,特别是在对准确性要求很高的场景,完全自主的智能体还存在明显的幻觉问题。


比如,某大厂发布的 DataAgent,你只需要说一句话,它就能查询数据库并生成高大上的图表。


但是仔细查看它生成的图表,就会发现很多问题,比如数据错误甚至数据编造。


在这种情况下,我们就需要使用 RAG、微调等手段减少智能体的幻觉问题。



二、多智能体系统(Multi-Agent System


图片来源:百度

多智能体系统,就是把好几个智能体凑一块儿,让他们一起合作干大事。就像一个团队,每个成员各司其职,互相配合。


比如,在智能交通系统里,路口的智能体负责收集车流量和路况信息,然后把这些信息传给控制中心的智能体。控制中心的智能体一分析,就把信号灯的时间调得刚刚好,车流一下子就顺畅了。


相比于单个智能体,多智能体系统的要求就更高了。


比如,如果其中一个智能体死机了,整个智能体系统都会停摆。


要解决这个问题,可以给每个智能体都准备一个“克隆体”,如果一个智能体死机了,“克隆体”马上顶上去。



三、RAGRetrieval-Augmented Generation


图片来源:百度

RAG的本质就是先从指定的外部知识库中检索相关信息,再利用这些信息生成回答。


由于这些信息本质上来自于企业知识库,而不是 AI 的“自由生成”,因此会更加准确可信。


RAG 就像是给智能体配了个超级知识库。


智能体要是遇到复杂的问题,它就先在这个知识库里快速搜资料。把相关的内容都找出来后,再用自己的语言整理成一篇完整的回答。


举个栗子,智能客服系统里,RAG 就非常重要。


顾客要是问一些复杂的问题,比如产品的详细使用方法,智能客服就用 RAG 快速在知识库里找答案,然后生成一份详细、准确的回答发给顾客。


当然了,RAG 也存在很多难点。


比如知识库的内容必须做好分类、分级,避免相互冲突,同时还必须实时更新,否则“进去的是垃圾,出来的也是垃圾”。



四、工作流(Work Flow


图片来源:coze

所谓工作流,是一系列相互关联的任务和步骤,按照一定的顺序执行,以完成特定的业务目标。


工作流就好比是一条流水线。把一个复杂任务分解成一个个小步骤,每个步骤由专门的工人(智能体组件)来完成。第一个工人干完了,把结果传给第二个工人,第二个工人接着干,直到最后完成整个任务。这样分工明确,质量和效果都很高。


在准确性要求很高的场景,如果让智能体自行规划任务执行步骤,可能会加重幻觉问题。


在这种情况下,我们就可以通过工作流,来固定智能体执行的步骤,从而减轻幻觉。


举个栗子,在订单处理智能体中,员工录好订单信息后,工作流自动触发库存检查。要是库存够,智能体就直接安排发货;要是不够,智能体就创建补货任务,并通知采购部门。同时,智能体还会给客户发个消息,告诉他预计发货的时间。


当然了,工作流也不是完美的。


要是工作流设计得不合理,比如步骤太多或者顺序不对,任务处理起来就会很慢。因此,需要专业的产品经理来进行梳理。



五、微调(Fine-Tuning


所谓的微调,可以简单理解为,利用一部分行业或企业数据对大模型进行训练,从而让它更理解行业或企业的特定业务。


比如,行业有大量的专业名词或者“行业黑话”,标准大模型无法理解这些名词,自然就不可能给出准确的答复。那么,基于标准大模型的智能体,肯定也就无法准确的完成业务。


在这种情况下,我们就可以通过微调,来改善智能体对行业的理解。


举个栗子,通用的质量检测模型在处理企业的特定产品数据时,检测准确率较低。


于是,企业收集了大量生产线上的产品图像数据,包括合格品和次品,并对这些数据进行了标注。然后,企业使用这些数据对质量检测模型进行微调,结果提升了 25% 的检测准确率。


当然了,微调也不是完美的,比如对数据依赖度很高,成本也很高。一般来说,用于微调的数据,需要让专业的标注人员来进行标注。



六、函数调用(Function Calling


图片来源:百度

虽然不太准确,但是我们可以把“函数”简单的理解为 “API”。


当我们有多个软件程序,就编制多个“函数“(API),这样当智能体需要使用某个程序的时候,就直接“调用”这个“函数“就可以了。


比如有个函数能算两个数的和,智能体要算 1 + 1,就直接拿这个函数出来,马上就算出 2(而不需要再写一个求和的程序)。


举个栗子,在图像处理系统里,智能体要处理一张照片,就得调用好多个函数。比如先调用边缘检测函数,把照片里物体的轮廓勾勒出来;再调用特征提取函数,分析物体的形状和纹理。这样一层一层处理下来,智能体就能认出照片里的东西。


函数调用虽然强大,但是也有很多问题。


比如,不同大模型之间的“函数调用”标准不同,导致为了适配多个大模型,可能需要写多个函数。


而 MCP就可以很好的解决这个问题。



七、MCPModel Context Protocol


MCP 是一种用于 AI 智能体与外部软件进行协作的标准开放协议。有了 MCP,一个软件只需要按 MCP 协议开发一个标准接口,即可被多个模型调用。


举个栗子,生活智能体通过 MCP 服务集成了多个软件工具,当我们要求智能体“点一杯咖啡”,它就可以自动调用“外卖程序”下单购买;当我们问智能体“今天是什么天气”,它就会自动调用“天气查询工具”。


MCP 也不是完美的,如果大家都遵循某一个大厂的 MCP 标准,就可能形成另一个“苹果税”。



八、A2AAgent-to-Agent Protocol


图片来源:百度

A2AAgent - to - Agent Protocol)是谷歌推出的一项开源通信协议,旨在为不同框架开发的 AI 智能提供标准化协作方式,使其能够跨越技术壁垒,相互协同完成复杂流程。


说白了,MCP 解决了智能体与外部软件之间的协作问题;而 A2A 则解决了智能体与智能体之间的协作问题。


举个栗子,影像分析智能体和病历信息综合智能体就可以通过 A2A 协议来交流:


影像智能体把看到的病变特征发给病历智能体,病历智能体再把相关的病历信息发回来,俩人这么一对话,诊断报告就生成得又快又准。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询