支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Dify 搭建私有的RAG知识库(实操篇)

发布日期:2025-05-25 19:09:00 浏览次数: 1520 作者:不确定
推荐语

Dify平台,让AI应用开发变得简单高效,开启你的私有化AI之旅。

核心内容:
1. Dify平台简介及其对AI应用开发的影响
2. Dify的三大王牌功能:一键开发、企业级黑科技、百变场景应用
3. 手把手教程:十分钟快速部署Dify,安装必备工具及代码克隆启动

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

还在为构建私有化AI应用犯愁吗?今天给大家介绍一款强大的开源利器——dify。这款被称为'AI应用开发神器'的平台,正在悄悄改变着开发者构建AI应用的方式。

什么是Dify?

Dify 是一款开源的大语言模型(LLM)应用开发平台,专注于帮助用户快速构建、部署和管理生成式 AI 应用。通过结合 后端即服务(BaaS) 和 LLMOps(大模型运维),它简化了复杂的技术流程,让没有深厚编程背景的开发者也能轻松参与 AI 应用开发。

独家揭秘:Dify的三大王牌功能,让AI应用开发变得如此简单!

  1. 一键开发,告别代码烦恼
  • 想打造AI应用?Dify为您准备了简单易用的可视化界面!只需动动手指,拖拽一下,您就能设计出专业的AI工作流和智能助手。告别繁琐代码,轻松搞定自动化任务!?
  • 更赞的是,它还支持文字、图片、语音等多种形式,完美对接GPT-4、Claude等各路AI大咖,让您的应用更出彩!✨
  • 企业级黑科技加持
    • 智能检索升级版RAG
      :采用顶尖向量检索技术,让AI回答更准确、更专业,就像有了超强记忆力!?
    • 模型随心配
      :想用国产AI?没问题!通义千问、智谱AI应有尽有,还能私有部署,数据安全无忧!?
    • 运维零压力
      :系统性能、日志分析、版本管理,一站式解决方案让您高枕无忧!⚙️
  • 百变场景,轻松驾驭
    • 智能客服升级版
      :打造7×24小时在线的AI助手,轻松应对各类咨询,让服务更贴心!?
    • 内容创作神器
      :营销文案、专业报告、技术教程,AI一键生成,工作效率翻倍!?
    • 数据分析专家
      :复杂数据秒变清晰报告,工单处理、邮件回复自动化搞定,让决策更明智!?

    想尝试Dify?跟着教程,十分钟搞定部署!快来解锁你的AI私有化之旅吧!✨

    手把手教你安装必备工具!


    第一步:轻松搞定Git安装 ?

    1. 打开Git官网 (https://git-scm.com/downloads),选择适合你系统的版本下载
    2. 一键安装:无需纠结,默认设置就是最佳选择!
    3. 验证安装:打开终端,输入神奇咒语 git --version,看到版本号就代表成功啦!

    第二步:Docker安装就是这么简单 ⚡

    1. 访问Docker官网 (https://www.docker.com/products/docker-desktop),下载Docker Desktop神器
    2. 根据提示傻瓜式安装
    • Windows用户小贴士:别忘了开启WSL2和虚拟化哦~
    • Mac达人必读:先确认下你的处理器类型(Intel还是ARM)
  • 最后一步:terminal里输入 docker --version,完美收工!

  • 第三步:克隆Dify 代码

    $git clone [git@github.com](<mailto:git@github.com>):langgenius/dify.git

    通过Docker启动Dify

    $cd dify/dockers
    $cp .env.example .env # .env是各种配置redis,sqldatabase,vector store,etc
    $docker compose up -d

    在浏览器中输入http://localhost, 默认的port是80, 跟我的其他有冲突,所以我改成了8088.

    第四步:输入管理员的用户名和密码, 然后登录

    然后可以在网页上进行设置了


    选择大模型供应商,设置API-KEY, 我用的是硅基流动, 你也可以选择自己的。


    可以创建知识库了。

    添加文件


    分块

    Embedding的选择


    模型
    参数量
    推理速度 (tokens/s)
    MTEB 准确率
    内存占用 (GB)
    适用场景
    优势
    局限性
    BGE-M3
    340M
    1200
    91.2%
    4.8
    多语言/混合检索/长文本
    中文场景最优,支持稠密+稀疏混合检索,8K 上下文处理能力
    需中等显存(推荐 GPU 部署)
    text-embedding-3-large
    1.3B
    850
    93.5%
    6.2
    高精度文本检索
    3072 维向量,语义捕捉能力最强
    需高显存(4.8GB+),成本较高
    multilingual-e5-large
    560M
    1500
    89.7%
    3.1
    低资源多语言场景
    参数效率高,250+语言支持,训练成本低
    英语表现弱于专用模型

    Rerank选择

    维度 BCE-Reranker-base_v1
     (网易有道)
    BGE-Reranker-v2-m3
     (智源研究院)
    模型架构
    基于BERT的变体,优化双语和跨语言语义理解
    基于BGE-M3-0.5B架构,采用分层自蒸馏策略优化推理效率
    多语言支持
    中文、英文、日文、韩文
    覆盖100+种语言,重点强化中英文混合场景
    输入长度
    最大512 tokens
    最大8192 tokens(支持长网页处理)
    训练数据
    中英双语数据集+跨语言对齐数据
    多语言联合训练(含低资源语言),集成视觉token增强
    部署复杂度
    需GPU加速(显存需求较高)
    轻量化设计(0.5B参数),24G显存GPU可流畅运行
    开源支持
    仅限企业级API调用
    开源(Hugging Face/GitHub),支持商用许可

    然后,进行召回测试


    创建一个对话

    1. 设置系统消息:

    You are an AI assistant that strictly answers based on the given context. If the answer cannot be derived directly from the provided context, respond with: “I do not have enough information to answer that.”

    您是一个 AI 助手,严格根据给定的上下文进行回答。如果无法直接从提供的上下文中得出答案,请回复:“我没有足够的信息来回答这个问题。”

    1. 选择知识库
    2. 选择模型
    3. 开始提问


    通过以上步骤,我们已经成功搭建了一个基于Dify的智能知识库系统。这不仅仅是一个简单的RAG应用,更是一个能够真正理解并回答用户问题的AI助手。无论是处理企业文档、构建客服系统,还是打造专业知识库,Dify都能够帮助我们事半功倍。

    有什么问题,欢迎留言跟我交流。

    #RAG #Dify #企业知识库

    53AI,企业落地大模型首选服务商

    产品:场景落地咨询+大模型应用平台+行业解决方案

    承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

    联系我们

    售前咨询
    186 6662 7370
    预约演示
    185 8882 0121

    微信扫码

    添加专属顾问

    回到顶部

    加载中...

    扫码咨询