我要投稿

dify应用：另类的关键词检索

发布日期：2025-06-12 12:20:28 浏览次数： 2594

作者：5ycode

微信搜一搜，关注“5ycode”

背景

在使用ragflow的时候，分片的时候，有个比较好用的功能，就是自动关键词提取功能。

我们在检索的时候，可以通过调整语义和关键词的权重来检索知识。从而实现关键词+语义的互补。

而在dify的rag中，是没有关键词的。在dify1.2.0的时候，dify新增了一个元数据的功能，我们可以给文档设置元数据，从而在检索的时候，通过元数据作为关键词，可以过滤一部分内容。

但是该功能是文档级别的，并不能匹配到分段内容。

我们先看下我接下来的检索实验。

dify中的检索实验

在dify中一共有三中模式。

• 向量检索：向量化用户输入的问题并生成查询文本的数学向量，比较查询向量与知识库内对应的文本向量间的距离，寻找相邻的分段内容。
• 全文检索：关键词检索，即索引文档中的所有词汇。用户输入问题后，通过明文关键词匹配知识库内对应的文本片段，返回符合关键词的文本片段；类似搜索引擎中的明文检索。
• 混合检索：同时执行全文检索和向量检索，通过权重或 Rerank 模型，从查询结果中选择匹配用户问题的最佳结果。

知识库配置

为了减少干扰，我使用同一个文档，同一个向量模型，4个知识库做测试。

• 知识库1：bge-m3-向量检索
• 知识库2：bge-m3- 全文检索
• 知识库3：bge-m3-混合-权重
• 知识库4：bge-m3-混合-rerank

知识库1：bge-m3-向量检索

知识库2：bge-m3- 全文检索

知识库3：bge-m3-混合-权重

知识库4：bge-m3-混合-rerank

测试文档

## 案例1：风寒感冒

- **症状描述**：鼻塞流清涕、畏寒无汗、头痛、咳嗽白痰、舌淡苔白
    
- **理论依据**：《伤寒论》太阳病理论，寒邪束表致卫阳被遏。大椎为诸阳之会可散寒解表，风门为风邪出入门户，合谷属阳明经通调肺气
    
- **配穴方案**：大椎、风门、合谷
    
- **操作流程**：先灸大椎20分钟至潮红，再灸风门15分钟，最后灸合谷10分钟。每日1次，连续3天
    

## 案例2：脾胃虚寒型胃痛

- **症状描述**：胃脘冷痛、喜温喜按、食少便溏、四肢不温、舌淡胖有齿痕
    
- **理论依据**：《针灸甲乙经》"中脘主腹胀不通"，配合胃经合穴足三里健运脾土，神阙温补元阳
    
- **配穴方案**：中脘、足三里、神阙
    
- **操作流程**：神阙隔姜灸5壮，中脘悬灸25分钟，足三里双穴各灸15分钟。饭前操作，隔日1次
    

## 案例3：寒凝血瘀型痛经

- **症状描述**：经前小腹冷痛拒按、经血紫暗有块、得热痛减、面色青白
    
- **理论依据**：《妇人大全良方》寒客胞宫理论，关元为任脉与三阴经交会穴，三阴交统调阴经，次髎温通胞宫
    
- **配穴方案**：关元、三阴交、次髎
    
- **操作流程**：经前3天开始灸，关元灸30分钟，三阴交双穴各15分钟，次髎20分钟。每日1次至经期第2天