我要投稿

从0到1落地一个RAG智能客服系统

发布日期：2025-06-20 11:34:22 浏览次数： 3080

作者：卷心菜ai

微信搜一搜，关注“卷心菜ai”

1️⃣ 项目背景：我们为啥要做这个？

过年的时候DeepSeek火了，年后老板提出要做智能客服的项目。（主要是大模型api价格降下来了，我们中小厂也能入场了）

项目初期我调研了几种主流方案：

LangChain：LangChain 是专为复杂AI应用设计的开发框架，提供开箱即用的RAG全链路支持——从知识库构建、向量检索优化到多智能体编排，均可通过模块化组件快速实现，也是个不错的选择。
Dify：同时支持 API/代码调用和可视化拖拽的方式来实现智能体（Agent）编排，也是不错的选择。可视化的workflow不适合我们的多智能体编排场景，拖拽式在复杂逻辑下不好维护，也不好调试，异常处理也不友好。
模型微调：我们公司出新品频率高，知识库和客服数据需要经常更新，频繁微调成本太高不合适，或者微调之后再用RAG增强，但是那样成本也还是高，模型部署和api调用都有成本，训练数据标注的时间成本太高了。
Coze：Coze主打低门槛、强对话体验，适合C端用户，但是复杂任务扩展性较弱，不适合我们的项目。
阿里云百炼：提供 Agent SaaS 服务、数据库集成能力强，支持以 API 调用的方式组织智能体。

最终我选择了 阿里云百炼的 Assistant API + 自主代码调度 方案，主要基于以下几点考虑：

我把说明书整理成结构化数据，结构大概是这样：

这种结构化方式便于后续切片，同时也能做关键词 + 向量双重匹配。

聊天记录处理远比说明书复杂，挑战包括：

所以我用了“弱监督 + 大模型协助”的方式来处理：

问题描述	解决方案	相关设备型号	问题分类	用户满意度
设备无法通过2.4G模式连接	将开关拨至2.4G模式后长按连接键5秒，重启路由器	AT01、BT02、CT03	网络连接类	满意
2.4G模式连接后频繁断连	检查设备与路由器距离是否超过10米，更换信道	BT02、DT04	信号稳定性	适中
连接键长按无反应	检查电池电量是否低于20%，清洁按键触点	AT01、ET05	硬件故障类	不满意

在大模型批量数据处理方面，推荐使用阿里云百炼的批处理接口，在非高峰时段提交任务，降低成本，非常适合我们这种对时效性要求不高但成本敏感的业务场景。

Prompt 设计就像写代码，但还得多试多改，以下是我踩过的坑总结👇

💡 小技巧合集：

此外，我的实际体会是，即便是最优设计的 Prompt，也可能在实际调用中不稳定——同样的输入，有时生效有时不生效。这跟大模型服务商的底层实现有关，我怀疑部分平台在负载均衡时会调用不同版本或权重参数的模型实例。

我采用了多智能体分工协作的设计，结合阿里云百炼提供的 API 服务，构建了一套可控、可维护的智能体系统。

这种架构既保证了知识隔离，又能应对复杂的对话逻辑。

系统尚未对外正式上线，当前主要通过人工测试模拟用户行为：