微信扫码
添加专属顾问
我要投稿
RAG(检索增强生成)是一种结合了外部信息检索与大型语言模型生成能力的技术,用于处理复杂的信息查询和生成任务。在大模型时代,RAG 通过加入外部数据(如本地知识库、实时数据等)来增强 AI 模型的检索和生成能力,提高信息查询和生成质量。比如:文心一言的插件服务,支持把实时又或者私有化知识提供给LLM。
首先会思考怎样完成这个任务。
然后会把任务拆解成多个子任务分步进行。
接着评估现有工具能够帮助我们高效达成目的。
在执行任务的时候,我们会对执行过程进行反思和完善,以持续调整策略。
执行过程中思考任务何时可以终止。
2、记忆(Memory)
短期记忆,如:单次会话的上下文记忆会被短暂的储存,以用于多轮会话,在任务完结后被清空。
通过调用软件系统不同应用模块的API,获取到指定的业务信息,以及执行业务的操作权限。
通过调用外部的插件工具,来获取原本LLM并不具备的能力,如:文心的Chat files插件获取文档解析能力;扣子的ByteArtist插件获取文生图能力等。
推理1:当前知识不足以回答这个问题,需要知道当前所在方位以及附近的餐厅
行动1:使用地图工具(Tools)获取当前所在方位
结果1:得出附近餐厅列表
推理2:确定预订的餐厅,需要知道您的饮食偏好以及其余细节(如:吃饭时间、人数)
行动2:从记忆(Memory)中获取您的饮食偏好、人数、时间等信息
结果2:确定最匹配的餐厅
推理3:基于结果2,评估当前所拥有的工具能否完成餐厅预订
行动3:使用相关插件工具,进行餐厅预订(Aciton)
结果3:任务完成
第一步:通过各种方式整理汇报周期内,联系了哪些客户;商机都推进到什么阶段;哪些客户完成转化成交,成交业绩多少等行为信息
第二步:把零散的行为信息,重新梳理,转化为汇报格式(如:内容+当前进度+预期等格式)
第三步:选择汇报人,提交报告
这个过程中,员工把大部分的时间都耗在了收集与整理行为信息的工作上。
到了Agent的阶段,我们不妨以智能体的基础框架出发,构建【工作报告智能体】的框架。
规划(Planning),编写Prompt的时候,让LLM对“生成工作报告”任务进行拆解,分为了获取基础数据—整理输出报告—选择汇报人—执行提交四步。
工具(Tools),受限于LLM无法获取私有化知识的问题,通过RAG技术,接入数据中心API来获取客户联系、流转、成交等明细数据;以及接入工作报告应用API来获取“填写”与“提交”的业务执行权限。
记忆(Memory),把员工以往的汇报内容进行分析,提炼出汇报文案风格、内容格式、汇报周期、汇报人等特征信息,作为长记忆进行存储,供撰写报告时使用。
▲工作报告智能体demo
六、总结
▲人类与AI协同的三种模式
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-07-29
一小时内构建基于Gemma与Bright Data的生产级RAG应用
2025-07-28
做RAG系统到底是选MaxKB还是FastGPT
2025-07-28
企业RAG之构建 FastMCP 服务:基于模型上下文协议的智能服务体系搭建实践
2025-07-28
RAG数据准备完整实战指南:从原始文档到高质量知识库
2025-07-28
企业RAG之数据源构建:爬取巨潮资讯网上市企业年报
2025-07-28
HiRAG:一种基于层级知识索引和检索的高精度RAG
2025-07-28
长文本放提示词中还是采用 RAG?
2025-07-28
检索链路全优化:查询重写、重排与压缩如何提升 RAG 效果
2025-06-06
2025-05-30
2025-06-05
2025-05-19
2025-05-08
2025-05-10
2025-06-05
2025-05-20
2025-06-05
2025-05-09
2025-07-28
2025-07-09
2025-07-04
2025-07-01
2025-07-01
2025-07-01
2025-07-01
2025-06-30