我要投稿

Dify+Firecrawl本地部署RAG知识库chatbot

发布日期：2025-06-16 06:22:27 浏览次数： 2048

作者：功课笔记拾遗

微信搜一搜，关注“功课笔记拾遗”

本文用于记录和描述如何在本地通过配置dify+firecral+Ollama的方式来实现RAG知识库chatbot。

整个配置流程在macos15.5下完成，其他操作系统还请依据实际情况更改对应内容。

安装dify

git clone git@github.com:langgenius/dify.git

配置dify环境变量

 cd dify/docker cp .env.example .env

我们可以对dify参数进行调整也可以直接使用默认参数

运行dify

docker-compose up -d

默认运行在80端口

首次登陆需要配置admin密码信息

首次登陆后需要配置模型提供商，点击右上角头像图标，设置

选择模型供应商，选择你需要使用的模型，我这里配置使用ollama

选择添加模型，配置本地地址，确保你的ollama已经运行并且可以被访问。

curl http://192.168.31.157:11434/v1/models

正确的话会输出当前ollama已经下载的模型列表

配置模型

可以配置多个，并且配置embedding模型

安装firecrawl爬虫工具

使用firecrawl还需要安装nodejs和pnpm为依赖，还请提前安装

 git clone git@github.com:mendableai/firecrawl.gi

修改firecrawl参数

cd firecrawlcp apps/api/.env.example ./.envvi .env

修改两个内容

USE_DB_AUTHENTICATION=false

TEST_API_KEY=xxxxx #记录该key后续配置会用上

启动firecrawl

在firecrawl的目录下运行

docker-compose up -d

firecrawl运行成功打开本地3002/test可以看到hello,world字样

打开dify，配置数据来源

api key使用刚才在env文件中所设置的内容

随后我们创建新的知识库

选择同步自web站点，我们以https://docs.dify.ai/zh-hans/guides为例子

限制数量设置为50，深度为3，代表让firecrawl抓取网页上最先出现的10个内容并且抓取这50个链接下的3层子目录

勾选删除所有url和电子邮件地址

选择混合检索，采用权重设置（本文不涉及RAG精度优化，暂不使用rerank模型）点击保存并处理。

我们可以看到知识库已经完成了创建并在embedding

embedding完成后我可以点击前往文档查看结果

可以看到利用firecrawl抓取的网页embedding所生成的文档

现在我们来创建一个新的应用，选择chatflow

在给出的模板基础上修改，在开始和llm中间增加知识检索节点

选择引用知识库，使用我们刚才创建的库

随后修改llm模型节点

修改温度（默认0.7）降到较低的值，使其回答更为稳妥。

上下文选择知识检索节点的result

在system prompt中输入根据下面的检索结果回答用户问题调用sys.query变量并调用上下文

我们选择预览，输入一个问题

如何配置embedding模型？

可以看到在思考的过程中引用了知识库的内容

回答的内容符合预期，可以发布了

我们选择发布。

点击运行，可以看到单独的chatbot页面，我们再次提问

如何配置插件？

可以看到对应的流程，符合预期。

当然我们也可以选择把chatbot嵌入到网站中，可以在发布下获取对应的代码。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-10-31

Dify知识库从Demo到生产：RAG构建企业级私有知识库的7个关键步骤

2025-10-31

RAGFlow 深度介绍

2025-10-29

RAG—Chunking策略实战｜得物技术

2025-10-29

RAG 让你的 AI 更聪明

2025-10-28

多少做RAG的人，连分词都搞不定? Milvus Analyzer指南

2025-10-28

先分块再向量化已经过时！先embedding再chunking才是王道

2025-10-28

AI检索增强中路由模型的使用

2025-10-28

HybRAG：混合文本和知识图谱的RAG框架

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

RAG彻底爆了！一文掌握其效果优化的架构设计及核心要点

2025-09-15

从原理到落地：RAG 技术全解析，手把手教你搭建专属知识库

2025-09-02

响应速度提升300%、检索准确率90%：RAG如何让企业知识“活”起来赚钱？

2025-08-05

优化 GraphRAG：LightRAG的三大改进

2025-08-18

RAG系统全景：架构详解与落地实践指南

2025-08-25

高质量AI知识库应用的前提：选对向量数据库

2025-08-25

一文搞懂大模型：何为深入理解RAG？

2025-08-25

DeepMind爆火论文：向量嵌入模型存在数学上限，Scaling laws放缓实锤？

2025-09-03

别再往AI的知识库塞奇怪的东西了，什么样的知识适合作为RAG知识库？

2025-08-20

万字长文详解腾讯优图RAG技术的架构设计与创新实践

2025-09-08

大家都在问

Embedding与Rerank：90%的RAG系统都搞错了！为什么单靠向量检索会毁了你的AI应用？

2025-10-04

存算一体破局向量检索瓶颈，IBM放出王炸VSM：性能飙升100倍，能效碾压GPU千倍，RAG要变天？

2025-09-30

您应该为您的 RAG 系统使用哪种分块技术？

2025-09-10

关于多模态应用的几个疑问，以及多模态应该怎么应用于RAG？

2025-09-10

DeepMind爆火论文：向量嵌入模型存在数学上限，Scaling laws放缓实锤？

2025-09-03

RAG检索后如何应用更有效？

2025-08-28

一文搞懂大模型：何为深入理解RAG？

2025-08-25

别再往AI的知识库塞奇怪的东西了，什么样的知识适合作为RAG知识库？

2025-08-20

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部