微信扫码
添加专属顾问
我要投稿
AI Agent的八大核心概念,带你深入了解人工智能的前沿应用。 核心内容: 1. 智能体(Agent):独立行动的AI实体及其应用场景 2. 多智能体系统:多个智能体协同工作的原理与挑战 3. RAG技术:提高智能体准确性的检索增强生成方法 4. 工作流:任务分解与智能体组件协作的业务流程
一、智能体(Agent)
图片来源:百度
所谓智能体,指的是能独立采取行动以实现特定目标的 AI 实体。
想象你有一个贴心的小跟班,你让他干啥他就干啥。比如你让他查明天的天气,他立马就给你整得明明白白。
举个栗子,AI 面试官就是一个很棒的智能体。
它能够根据招聘要求,自主给候选人发送试邀请,然后自主进行视频面试,再自主进行面试评价,自主发送 offer。最后把招聘的统计报告发送给你。
是不是超省心?
当然了,智能体也存在很多缺陷,特别是在对准确性要求很高的场景,完全自主的智能体还存在明显的幻觉问题。
比如,某大厂发布的 DataAgent,你只需要说一句话,它就能查询数据库并生成高大上的图表。
但是仔细查看它生成的图表,就会发现很多问题,比如数据错误甚至数据编造。
在这种情况下,我们就需要使用 RAG、微调等手段减少智能体的幻觉问题。
二、多智能体系统(Multi-Agent System)
图片来源:百度
多智能体系统,就是把好几个智能体凑一块儿,让他们一起合作干大事。就像一个团队,每个成员各司其职,互相配合。
比如,在智能交通系统里,路口的智能体负责收集车流量和路况信息,然后把这些信息传给控制中心的智能体。控制中心的智能体一分析,就把信号灯的时间调得刚刚好,车流一下子就顺畅了。
相比于单个智能体,多智能体系统的要求就更高了。
比如,如果其中一个智能体死机了,整个智能体系统都会停摆。
要解决这个问题,可以给每个智能体都准备一个“克隆体”,如果一个智能体死机了,“克隆体”马上顶上去。
三、RAG(Retrieval-Augmented Generation)
图片来源:百度
RAG的本质就是先从指定的外部知识库中检索相关信息,再利用这些信息生成回答。
由于这些信息本质上来自于企业知识库,而不是 AI 的“自由生成”,因此会更加准确可信。
RAG 就像是给智能体配了个超级知识库。
智能体要是遇到复杂的问题,它就先在这个知识库里快速搜资料。把相关的内容都找出来后,再用自己的语言整理成一篇完整的回答。
举个栗子,智能客服系统里,RAG 就非常重要。
顾客要是问一些复杂的问题,比如产品的详细使用方法,智能客服就用 RAG 快速在知识库里找答案,然后生成一份详细、准确的回答发给顾客。
当然了,RAG 也存在很多难点。
比如知识库的内容必须做好分类、分级,避免相互冲突,同时还必须实时更新,否则“进去的是垃圾,出来的也是垃圾”。
四、工作流(Work Flow)
图片来源:coze
所谓工作流,是一系列相互关联的任务和步骤,按照一定的顺序执行,以完成特定的业务目标。
工作流就好比是一条流水线。把一个复杂任务分解成一个个小步骤,每个步骤由专门的工人(智能体组件)来完成。第一个工人干完了,把结果传给第二个工人,第二个工人接着干,直到最后完成整个任务。这样分工明确,质量和效果都很高。
在准确性要求很高的场景,如果让智能体自行规划任务执行步骤,可能会加重幻觉问题。
在这种情况下,我们就可以通过工作流,来固定智能体执行的步骤,从而减轻幻觉。
举个栗子,在订单处理智能体中,员工录好订单信息后,工作流自动触发库存检查。要是库存够,智能体就直接安排发货;要是不够,智能体就创建补货任务,并通知采购部门。同时,智能体还会给客户发个消息,告诉他预计发货的时间。
当然了,工作流也不是完美的。
要是工作流设计得不合理,比如步骤太多或者顺序不对,任务处理起来就会很慢。因此,需要专业的产品经理来进行梳理。
五、微调(Fine-Tuning)
所谓的微调,可以简单理解为,利用一部分行业或企业数据对大模型进行训练,从而让它更理解行业或企业的特定业务。
比如,行业有大量的专业名词或者“行业黑话”,标准大模型无法理解这些名词,自然就不可能给出准确的答复。那么,基于标准大模型的智能体,肯定也就无法准确的完成业务。
在这种情况下,我们就可以通过微调,来改善智能体对行业的理解。
举个栗子,通用的质量检测模型在处理企业的特定产品数据时,检测准确率较低。
于是,企业收集了大量生产线上的产品图像数据,包括合格品和次品,并对这些数据进行了标注。然后,企业使用这些数据对质量检测模型进行微调,结果提升了 25% 的检测准确率。
当然了,微调也不是完美的,比如对数据依赖度很高,成本也很高。一般来说,用于微调的数据,需要让专业的标注人员来进行标注。
六、函数调用(Function Calling)
图片来源:百度
虽然不太准确,但是我们可以把“函数”简单的理解为 “API”。
当我们有多个软件程序,就编制多个“函数“(API),这样当智能体需要使用某个程序的时候,就直接“调用”这个“函数“就可以了。
比如有个函数能算两个数的和,智能体要算 1 + 1,就直接拿这个函数出来,马上就算出 2(而不需要再写一个求和的程序)。
举个栗子,在图像处理系统里,智能体要处理一张照片,就得调用好多个函数。比如先调用边缘检测函数,把照片里物体的轮廓勾勒出来;再调用特征提取函数,分析物体的形状和纹理。这样一层一层处理下来,智能体就能认出照片里的东西。
函数调用虽然强大,但是也有很多问题。
比如,不同大模型之间的“函数调用”标准不同,导致为了适配多个大模型,可能需要写多个函数。
而 MCP就可以很好的解决这个问题。
七、MCP(Model Context Protocol)
MCP 是一种用于 AI 智能体与外部软件进行协作的标准开放协议。有了 MCP,一个软件只需要按 MCP 协议开发一个标准接口,即可被多个模型调用。
举个栗子,生活智能体通过 MCP 服务集成了多个软件工具,当我们要求智能体“点一杯咖啡”,它就可以自动调用“外卖程序”下单购买;当我们问智能体“今天是什么天气”,它就会自动调用“天气查询工具”。
MCP 也不是完美的,如果大家都遵循某一个大厂的 MCP 标准,就可能形成另一个“苹果税”。
八、A2A(Agent-to-Agent Protocol)
图片来源:百度
A2A(Agent - to - Agent Protocol)是谷歌推出的一项开源通信协议,旨在为不同框架开发的 AI 智能提供标准化协作方式,使其能够跨越技术壁垒,相互协同完成复杂流程。
说白了,MCP 解决了智能体与外部软件之间的协作问题;而 A2A 则解决了智能体与智能体之间的协作问题。
举个栗子,影像分析智能体和病历信息综合智能体就可以通过 A2A 协议来交流:
影像智能体把看到的病变特征发给病历智能体,病历智能体再把相关的病历信息发回来,俩人这么一对话,诊断报告就生成得又快又准。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-05-18
告别 RAG,拥抱 CAG:知识任务的革新之路
2025-05-18
大模型幻觉是个啥?一文带你看透AI的“脑洞”
2025-05-18
RAG 是个啥?一文秒懂
2025-05-17
从零构建、100% 本地运行:Qwen 3 Local RAG Reasoning Agent
2025-05-16
解锁AI时代的核心通关密码——为什么你必须搞懂RAG、Agent、MCP?
2025-05-16
RAG-MCP:突破大模型工具调用瓶颈,告别Prompt膨胀
2025-05-16
图检索增强生成(GraphRAG):让AI真正理解复杂知识
2025-05-16
RAG往后发展的三点感触及语言文化分析的两个工作
2024-10-27
2024-09-04
2024-05-05
2024-07-18
2024-06-20
2024-06-13
2024-07-09
2024-07-09
2024-05-19
2024-07-07
2025-05-16
2025-05-15
2025-05-14
2025-05-14
2025-05-13
2025-05-11
2025-05-08
2025-05-05