我要投稿

基于Dify 知识库的实验demo：从0到1构建智能商品分类系统

发布日期：2025-07-17 08:38:34 浏览次数： 2199

作者：dify实验室

微信搜一搜，关注“dify实验室”

大家好，我是 dify 实验室的阿亚。最近接到了一个新的任务，就是实现一个商品自动分类的功能，根据商家提供的商品名称，实现商品的自动归类，本篇文章记录了各种踩坑的过程，直到实现一个验证可行demo的实验过程。

一、最初的挑战：为成千上万的商品自动“安家”

想象一下，你面对着成千上万个商品，需要为它们精准地打上三级分类标签，比如把“新款纯棉透气T恤”分到“服装 > 男装 > T恤”下。手动操作不仅枯燥，还容易出错。于是，我们自然想到了用 AI 来自动化这个过程。但问题也随之而来：商品分类体系太庞大了，AI 如何才能准确、高效地完成任务呢？

二、弯路与启示：两次失败的尝试

在找到最佳方案前，我和团队也踩了不少坑。这里分享两个典型的“弯路”，希望能帮大家在未来的项目中少走一些。

弯路一：简单粗暴的“一步到位”法

我们最开始的想法很简单：把商品名和所有三级分类的列表一起扔给大模型，让它直接选。想象很美好，现实很残酷，结果呢？模型直接“罢工”了。因为几万条分类数据远远超出了大模型的上下文长度限制。这就像让一个人一口气背下整本字典再去查字，根本不现实。

弯路二：层层递进的“逐级问询”法

既然一次性不行，那就分步走。我们尝试先让模型判断一级分类，再判断二级，最后确定三级。这个方法虽然能跑通，但体验极差：

成本高：一次分类要调用三次模型，令牌（Token）消耗飞涨。
速度慢：三次串行请求，用户等待时间太长。
不稳定：任何一步出错，后面就全错了，像多米诺骨牌一样。

这两次尝试让我们明白，单纯依赖大模型的“蛮力”是行不通的。

三、真正的突破口：“检索”与“生成”的黄金组合

在反思之后，我们找到了真正的突破口——这正是 Dify 知识库的核心价值所在，即**检索增强生成（RAG）**。

说白了，就是我们不再强迫大模型去“背诵”所有知识，而是给他一本“开卷”的参考书，让他根据问题快速“查阅”并作出判断。

我们的“智慧优选”方案分为两步：

第一步：向量检索
我们将所有的三级分类名称和描述存入 Dify 知识库。当输入一个商品名时，系统会利用向量检索，快速从知识库中找出语义上最相似的一小撮候选分类（比如10个）。
第二步：大模型精选
然后，我们把商品名和这10个候选分类一起交给大模型，让它在这个小范围内做个“优中选优”的决策。任务难度大大降低，准确率自然飙升。

这个方案不仅速度快、成本低，而且效果出奇地好，成为了我们的最终选择。

当然在实践过程中，实际也踩了很多坑，单纯导入商品名称到知识库中，召回率也比较低。后来把类目属性名称也一并导入到知识库中，在检索前使用大模型对检索词进行改写，获得了非常不错的效果。

四、让系统“活”起来：知识库的动态更新

商品分类不会一成不变，总会有新增、修改或废弃。如果知识库不能同步更新，AI 的判断就会慢慢“过时”。

为此，我们专门在 Dify 中编排了一个专用的数据管理工作流。这个工作流通过 API 接口，实现了对知识库中三级分类数据的自动化管理：

新增分类
当业务后台增加一个新品类时，自动调用 API 将其添加入知识库。
更新分类
当某个分类的描述或名称变更时，自动调用 API 更新知识库中的对应条目。
删除分类
当某个分类被废弃时，自动调用 API 将其从知识库中移除。

通过这种方式，我们的知识库与业务系统实现了实时联动，变成了一个能自我进化的“活”系统，保证了AI决策的时效性和准确性。

五、利其器善其事：我的模型推荐清单

工欲善其事，必先利其器。在“智慧优选”方案中，Embedding 模型和 Rerank 模型的选择至关重要。

1. Embedding 模型

它的任务是把文本转成向量，决定了我们能“捞”回多少相关的候选者。

开源首选
BAAI/bge-large-zh-v1.5。目前中文语义理解的佼佼者，追求极致效果的首选。

2. Rerank 模型

它能对召回的候选集进行二次排序，把最匹配的那个推到最前面。

开源首选
BAAI/bge-reranker-large。与 bge-embedding 是“黄金搭档”，配合使用效果拔群。

大家可以根据自己的业务需求和技术栈，选择合适的模型组合进行测试。

结语

回顾整个过程，从最初的屡屡碰壁，到最终找到“检索+生成”并结合动态数据维护的验证demo，我深刻体会到：构建一个强大的人工智能应用，关键在于巧妙地组合利用工具，而不是迷信单一技术。

当然从demo走向生产，还有很长的路要走。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-02

设计生产级 RAG 架构

2026-06-02

万字深度|做了8年向量数据库后，我们决定为Milvus重构AI时代的存储引擎

2026-06-02

PDF2X：教材等高知识密度文档的解析与抽取实战

2026-05-28

ragflow v0.25.6 发布：Browser 自主浏览、RAPTOR 升级、Agent 体验增强与大量稳定性修复全解析

2026-05-27

从文档到智能问答：知识库构建的九步流程

2026-05-22

四种索引，一个系统，重新定义 AI 如何理解知识

2026-05-22

腾讯云Agent Memory节省61% Token提升52%成功率的诀窍：Mermaid无限画布×上下文卸载

2026-05-22

企业知识库下半场：从 RAG 到 context architecture

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

知识基座：让“AI 越用越懂业务”的团队经验实践【天猫AI Coding实践系列】

2026-03-23

全网爆火的大模型AI知识库，保姆级教程来了

2026-04-06

从RAG到GraphRAG：货拉拉元数据检索应用实践

2026-03-18

为什么总感觉 Claude Code 比 Cursor 聪明？真正的原因根本不是模型能力！

2026-03-20

Karpathy的LLM Wiki + 3.5 万Star的Graphify：企业级 RAG 缺的真是知识图谱？

2026-04-27

OpenDataLoader：PDF文档提取的一站式方案

2026-03-31

面向手机Agent的记忆系统工程:OPPO的Agentic-RAG实战与演进

2026-03-21

RAG进化了，深扒Claude Code源码中RAG高级技巧

2026-04-02

企业AI落地三重门，用友如何破局？

2026-03-17

Codeindex · 让大模型更好地理解你的代码

2026-04-20

大家都在问

AIOps探索：给不能联网的客户做一个AI运维助手到底有多难？

2026-05-20

有多少人把Agent与RAG的检索策略，简化成了 if-else？

2026-05-18

到底是谁会相信RAG已死啊？

2026-05-11

1G内存检索2500万向量，Milvus中如何用FLAT在强标量过滤场景搞定毫秒响应？

2026-05-07

多Agent场景，子agent 之间数据读写不同步，如何解决？

2026-05-06

Karpathy的LLM Wiki + 3.5 万Star的Graphify：企业级 RAG 缺的真是知识图谱？

2026-04-27

多轮对话时，RAG反复做重复召回，模型层与Milvus层分别如何解决？

2026-04-21

企业AI落地三重门，用友如何破局？

2026-03-17

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部