微信扫码
添加专属顾问
我要投稿
RAG Agent如何在企业中提升AI落地效果?Douwe Kiela的10个深刻教训为你揭晓。核心内容:1. 系统优化比单一模型更重要:RAG系统的整体效果胜过顶尖LLM2. 专业知识是AI价值的核心:企业内部知识是驱动AI的关键3. 企业规模和数据是竞争优势:利用独特数据构建竞争壁垒
现在AI应用落地常用的方式是RAG(Retrieval-Augmented Generation),即检索增强生成。和Agent结合更是让RAG的应用场景更为广泛。很多企业包括我自己都在尝试使用它来提高AI在企业中落地的效果。最近RAG的创始人Douwe Kiela 在LinkedIn上分享了他对RAG Agent在企业中的10个教训,对我自己也很有启发。今天结合他的视频内容和我自己的实践体会来分享一下。
LLM 只是整个 AI 系统(特别是 RAG 系统,包括提取、检索、生成、联合优化)的一小部分(约 20%)。一个优秀的 RAG 系统配合普通的 LLM,效果可能优于一个顶尖 LLM 配合糟糕的 RAG 系统。关键是关注系统而非孤立的模型。
我曾经参与优化过一个基于RAG的知识库问答系统。当时的情况是,团队做了测试,使用GPT-4的效果会好于GPT-3.5的效果,但是回答内容的准确率仍然低于50%。后来做了一些调整,准确率提升到80%以上:
在使用上述方法后,我们替换了GPT-3.5 Turbo,以及后续发布的成本更低的GPT-4o mini。虽然模型不是最新的最高级的版本,但是综合效果却是最好的。也就是Douwe Kiela所说的,RAG系统的整体效果比单一模型的效果更重要。
企业内部积累的专业知识和机构知识(通常存在于文档和数据中)是驱动 AI 产生价值的核心燃料。必须设法解锁这些专业知识。
每个企业都有丰富的所在领域的领域知识,有一个项目是一个学校做一个AI私人教师,给每个学生提供个性化的学习方案。这个学校准备的RAG的数据,是他们自己的材料和特有的的教学方法,这也是他们和其他同行的主要区别,也是他们的行业壁垒。AI机器人基于这些数据的构建才会有能力解决这个领域的问题。而通用大模型是很难获得这么特殊的领域知识的。
企业的核心竞争力在于其独特的数据。真正的挑战在于大规模地利用这些数据,让 AI 能够处理大规模、甚至“嘈杂”的真实数据。成功做到这一点,就能构建竞争壁垒。
我经历过的项目中,最开始确实有大量和复杂的数据清洗过程,为了给AI提供高质量的数据,提高RAG的召回率和质量。不过随着从试点到推广阶段,你会发现企业大量的数据都是带有“噪音”的。如果都要进行数据清洗,工作量和效率上都是不可能完成的任务。所以与其利用大量的时间做数据清洗,倒不如想办法让AI能够接受这些带有”噪音“的已存在的数据是更契合实际的。
建立小规模试点相对容易(少量文档、用户、单一场景、低风险),但将其扩展到生产环境则面临巨大挑战(海量文档、大量用户、多场景、高安全风险、SLA 要求等)。
还是企业内部知识库的AI项目,少量文档20~50个50K~100K大小文档的内容作为知识库的基础数据,召回率以及效率都很好。不过实际企业中的数据量和单文件大小都存在很大差异。铺开后先不考虑RAG的召回率和准确率。就说索引和召回的速度都成了问题。所以在试点阶段,需要考虑到后续的规模化的系统设计和应对方案,而不是只关注眼前的体量。但考虑多少需要基于实际项目来平衡。
不要追求一开始就完美。应尽早将(哪怕不完美的)系统交给真实用户使用,获取反馈并快速迭代。通过迭代“爬山”达到目标,而不是试图一次性设计出完美方案。
这一点和第4点有冲突的感觉。如何把握快速且完美之间的平衡呢?还是分享一个实际项目中的情况:
未完待续
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-05-14
RAG常见的坑:如何让AI有效的考试作弊
2025-05-14
人人都能看懂的预训练、微调、提示词工程和 RAG(我保证)
2025-05-14
DeepSeek接入个人知识库,回答速度飞快,最新安装包即将发布!
2025-05-14
RAG提升召回准确率的解决方案——关于相似度计算与Rerank重排序的问题研究
2025-05-14
随着大模型技术的发展——RAG技术有可能会被淘汰吗?
2025-05-14
AI知识库到底是什么?不同应用场景如何调参数配置?
2025-05-13
支付宝搜索中基于LLM的生成式检索幻觉缓解技术方案
2025-05-13
AI 全栈工程体系中,Prompt Engineering、AI Agent 和 RAG 如何协同工作?
2024-10-27
2024-09-04
2024-05-05
2024-07-18
2024-06-20
2024-06-13
2024-07-09
2024-07-09
2024-05-19
2024-07-07
2025-05-14
2025-05-14
2025-05-13
2025-05-11
2025-05-08
2025-05-05
2025-04-30
2025-04-29