免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


全网首发!Dify 2.0.0 图文混排上线,每个新功能都是爆款!附实战教程(建议收藏)

发布日期:2025-09-06 16:20:24 浏览次数: 1528
作者:AI早高峰

微信搜一搜,关注“AI早高峰”

推荐语

Dify 2.0.0重磅升级,图文混排+知识库重构带来全新智能体验!

核心内容:
1. 知识库全面重构,支持工作流编排和多源数据接入
2. 突破性实现图文混答输出功能
3. 7种内置模板提升知识库创建效率

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

 

dify 又偷偷更新了!

笔者上周的今天才码完 1.8.0的教程😅

这次是大版本升级 —— v2.0.0-beta.1 全新上线!


本次更新不仅支持了期待已久的“图文混答”,几乎是 重构了“知识库”,可以用工作流的方式创建“知识库”,并且支持调试,具备“工作流”的完整功能,是一个正经的”工作流“。提升了知识库开发的灵活性,与智能体的交互体验。


可以说,每个新功能都是爆款
1757058813.png

没更新的小伙伴们看过来~

新功能【一图速览】
Dify v2.0.0的知识库支持工作流编排
Dify v2.0.0的知识库支持多源数据
Dify v2.0.0 支持图文混答

更新了什么?

本次更新的核心亮点集中在 知识库模块的全面重构与升级。,笔者参考了dify官方release[1],从中提炼了以下四大核心点:

  • • ① 全新页面 & 新入口设计
  • • ②支持工作流编排的知识库
  • • ③支持多源数据:爬虫、本地文件、在线文档、云盘
  • • ④支持图文混答输出

意味着什么?

简单来说,Dify 把旧版工作流中“知识库处理”这一模块单独拎了出来,进行了全面升级与重构

  • • 在操作层面,通过①②③,让知识库的构建与使用更加灵活、直观;
  • • 在能力边界上,通过④,首次实现了图文混排输出,拓展了知识库的应用场景和表现力。

用户体验感拉满?

虽然目前功能还在 Beta 阶段,部分体验还有待完善。
因为还有bug的,先埋个坑😁


接下来,我们来逐一拆解这四大新功能,看看它们到底有多“能打”。

1. 知识库的新页面&新入口

知识库”页面新增了一种创建方式,叫做“通过知识流水线创建知识库”。

Dify 提供两种模板类型:内置管道(或者叫流水线)和自定义模板

点进来看到 1个自定义模板 和 7个内置管道模板

7个模板分别是:

  1. 1. 通用模式-ECO
  2. 2. 父子-HQ
  3. 3. 简易问答
  4. 4. 含图表的复杂PDF
  5. 5. 基于LLM的上下文增强
  6. 6. 转Markdown
  7. 7. LLM生成回答

根据Dify官方的知识库流水线说明[2],整理如下表:

序号
名称
块结构
索引方法
检索设置
描述
1
通用模式-ECO
通用
经济
倒排索引
将文档内容划分为更小的段落,直接用于匹配用户查询和检索。
2
父子-HQ
父子
高质量
混合检索
采用先进的分块策略,将文档文本划分为较大的父块和较小的子块。父块包含子块,既保证了检索精度,又维护了上下文的完整性。
3
简易问答
问答
高质量
向量搜索
将表格数据转换成问答形式
,通过问题匹配快速找到对应的答案信息。
4
包含图表的复杂 PDF
父子
高质量
混合搜索 - 加权分数
从 PDF 文件中提取图像和表格内容。
5
基于LLM的上下文增强
父子
高质量
混合搜索 - 加权分数
从文档中提取图像和表格,并使用大型语言模型自动生成描述性注释,实现智能上下文增强。
6
转换为 Markdown
父级
高质量
混合搜索 - 加权评分
专为 Office 原生文件格式(例如 DOCX、XLSX 和 PPTX)设计,将其转换为 Markdown 格式,以便更好地处理信息。⚠️ 注意:不建议使用 PDF 文件。
7
LLM 生成问答
问答
高质量
向量搜索
基于原文段落,利用大型语言模型生成结构化问答对,并通过问题匹配机制找到相关答案。

各个模板的预设功能丰富,觉得上手难度大的可以先挑一个看看,按照提示安装缺失插件,并配置APIKEY尝试。


比如这位粉丝朋友就可以用“简易问答”模板,处理他的Excel啦!


2.知识库的工作流编排

之前我们实现“1项具体任务”,才会用工作流,现在“知识库”也能用上“工作流编排”啦。

点开任意一个空白流水线,或者,模板流水线。就进入”工作流编排“。

3.支持多源数据

具体看到 “数据源” 这个节点,这里能添加12个官方插件,插件页面也要选“数据源”才能看到。

每个知识库均可支持多个数据源(这些插件都可以作为源)。

比如本地文件、在线文档、云盘和网络爬虫。也可以开发新的数据源插件。

Dify v2.0.0的知识库支持多源数据

这下 “苦数据源久矣”的小伙伴们有救了,不用因为新增/减少一种数据源而改每个任务对应的工作流啦。

4.图文混答

重磅推出图文混答”的新功能!

🔔前提是:

  1. 1. 你的知识库分段要准确!包含图片的完整链接!
  2. 2. LLM回答时,不能修改图片的链接!

看来这位粉丝朋友期待的“图文并茂”可以实现了!

5. 实战【智能图文问答】

最后,笔者这边演示一个实战案例,包括:从创建空白知识库流水线,到知识库编排,再到创建workflow,检索图文知识库,最后返回图文答案。

知识库呢,就用dify官方-Step 1: Create KnowledgePipeline[3]文档。
笔者这边翻译成中文,便于中文问答,需要的朋友自取 step1-创建知识管道.md[4]

Dfiy官方关于【知识管道编排的说明】

建立一条工厂生产线,每个工位(节点)执行一项特定的任务,然后将它们连接起来,将小部件组装成最终产品。这就是知识管道编排——一个可视化的工作流构建器,允许您通过拖放界面配置数据处理序列。
它可以控制文档的提取、处理、分块、索引和检索策略。

在本节中,您将了解知识管道流程,了解不同的节点、如何配置它们,并自定义您自己的数据处理工作流程,以有效地管理和优化您的知识库。

5.1 创建知识库

5.1.1 从知识流水线创建知识库

先创建一个空白知识库

5.1.2 编排

在开始之前,让我们了解知识管道流程,才能知道怎么如何将你的文档,转换为可搜索的知识库

【步骤1. 指定数据源】

这里指定为 "File"类型。
【步骤2. 数据处理 / 提取器】
添加 ”文档提取器“ 节点,对上传的文件进行提取。

【步骤2. 数据处理 / Chunker】
安装“通用文本分块”节点,对文本进行分块。
需要指定 分隔符 和 块长度,其他不是必填。

块长度为什么填5000?
因为md文档关于图片的代码太长了,小于5000图片链接就不完整,正常不需要这么大哈!知识库中你能调试到位就行

【步骤3. 知识库】
然后就能用 “知识库” 节点了。这个节点不用添加,默认有1个。

完整的知识库管道构建完毕,若想要更灵活的查询,可以加上“输入字段”等等。
更多详情见 知识管道编排的说明[5]

5.1.3 发布

测试成功,就能够发布啦!

点击右上角
发布“知识流水线”
意思是要么付费发布-方便日后重复使用/修改。要么免费-手动搬运。
虽然我们左上角导出,手动搬来搬去,但是官方说了“一旦发布,块结构就无法修改。“

啥意思?
就是,如果不是特别需要灵活修改 知识库流水线,免费用,就行了。
如果要给别人用,多动动手也可以。

5.1.4 上传文档

创建完”流水线“,我们还得上传文档,才能用在其他工作流中,才能检索得到内容。

因为“流水线”,只是编排了你上传文档/数据源之后,它要走的一套流程,最终生成知识片段。

相当于只是规划了旅行攻略,得安排个人去实施吧!

"知识库流水线"它还只是个壳,你得往里塞东西。

点击左侧栏的“文档”,右上角的“添加文件”,上传1个文档
这个操作界面跟旧版知识库一样,就不赘述了。

仔细看,每一个分段,必须包含完整的图片链接,才能正常显示,后面才能正常地给到大模型检索。

5.2 使用知识库,搭建智能图文问答助手

#5.1 ✈️完成创建了“知识库流水线”,创建了包含1个文档的知识库。

能看到这的朋友,应该是相当熟练了,直接贴完整的工作流截图。

其中,
知识库选择 ”Dify知识管道“

LLM提示词

你是一个Dify最新版【v2.0.0】的知识库智能助手,请总结知识库的内容来回答问题,请列举知识库中的数据详细回答,如果有图片,保持原图片的所有代码,不得删改。当所有知识库内容都与问题无关时,你的回答必须包括“知识库中未找到您要的答案!”这句话。
以下是知识库:
{上下文}
以上是知识库。

示例问答

如何创建知识管道?附图示

💡一句话总结

”知识库单节点“,到“知识库工作流”的翻新,从知识库源头处,改善了知识库的单一界面,变得更全面(支持多源数据)、更透明(支持调试),并且支持图文混答!


以上,就是今天的教程,恭喜你又比同行领先一步,了解到Dify最新版功能的特性。

新功能还包含“基于队列的图形引擎”,后续有机会再跟进


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询