Dify x Oracle Database 26ai 深度集成，打造企业级 RAG 应用

发布日期：2025-11-10 18:00:19 浏览次数： 2411

作者：Dify

微信搜一搜，关注“Dify”

Oracle 与 dify 携手推出深度集成方案，将 Oracle Database 26ai 的向量存储与检索能力，与 Dify 新推出的 Knowledge Pipeline 进行融合。通过这一集成，企业能够在统一的 Oracle 数据平台上同时管理业务数据与 AI 向量数据，利用 Oracle 的企业级可靠性、PB 级扩展能力与数据安全特性，快速构建基于私有数据的 RAG 检索与智能问答应用。

统一数据平台：在 Oracle 数据库中实现向量存储

通过 Dify 的可视化工作流（Knowledge Pipeline），企业可以将文档、图片、音频等非结构化数据处理为向量并存入知识库。得益于 Oracle Database 26ai 的原生向量管理能力，这些向量数据可以直接存储在 Oracle Database 26ai 中，无需部署独立的向量数据库，也能满足企业级的数据治理与安全要求。

在性能层面，Oracle 的 Partitioning（分区）、RAC（Real Application Clusters）和 Exadata 优化技术为这一集成提供了技术保障，即使在 PB 级数据规模下也能保持高性能与稳定性。

对于已经使用 Oracle 数据库的企业，可以在同一平台上管理业务数据和 AI 向量数据，无需在多个系统间迁移和同步数据，从而降低运维成本并提升数据管理效率。

企业实操：OCI 环境部署实操步骤

以下步骤展示如何在 Oracle Cloud Infrastructure（OCI）环境下，通过 Oracle Container Engine for Kubernetes（OKE）集群部署 Dify 企业版，并将 Oracle Database 26ai 配置为向量存储。

环境要求： Kubernetes 1.26+、Oracle Database 26ai（PDB 模式）

1、网络与集群基础配置

首先，我们需要自定义 OKE 的 VCN（Virtual Cloud Network），为 Dify 的 Pod 提供安全、独立且可访问外网的网络环境。

关键步骤包括：

创建 Pod 专属网络资源

新建 Pod 私有子网及独立路由表，配置 NAT 网关以确保 Pod 能访问外网以拉取插件与依赖；同时创建安全组并开放必要端口。

集群创建与配置

使用 “Custom Create” 模式，分配相应子网给 API、Worker 与 Pod 节点；

建议配置 3 个节点以保障高可用性，并将启动盘调整至 ≥50GB；

上传 SSH 公钥以便后续节点维护。

2、部署与初始化 Dify 企业版

环境准备：

- 通过 Helm 获取 Dify 企业版安装包；

- 修改 values.yaml 配置文件，若使用自建 PostgreSQL、Redis、MinIO 等组件，需要启用 externalPostgres、externalRedis 等外部配置；

- 创建 PVC 并分配 50Gi 存储空间以持久化数据。

外部访问：

- 执行 helm install ingress-nginx 部署负载均衡 Ingress Controller；

- 当 Ingress 获取外部 IP 后配置域名解析；

- 通过浏览器访问 Dify 控制台，完成授权注册、初始用户创建以及插件安装（如 LLM 模型插件、数据库查询插件等）。

核心集成步骤：启用 Oracle DataDatabase 26ai 向量存储能力

要让 Dify 支持 Oracle Database 26ai 的向量存储与检索，需要在数据库与 Dify 两侧进行配置。

Oracle 端预配置：创建专属向量检索环境

1、切换至目标 PDB 容器：

show pdbs;alter session set container=PDB1;

2、创建 Dify 专用用户并授权：

create user dify identified by dify_123 default tablespace users quota unlimited on users;

grant db_developer_role to dify;

3、创建多语言分词器：

BEGIN CTX_DDL.CREATE_PREFERENCE('dify.world_lexer', 'WORLD_LEXER');

END;

Dify 端配置与验证

1、修改 values.yaml 文件，添加 Oracle 连接信息：

externalType: "oracle"

externalOracleVectoRS:

dsn: "Oracle_IP:1521/PDB1"

user: "dify"

password: "dify_1234"

config_dir: "/app/api/storage/wallet"

wallet_location: "/app/api/storage/wallet"

is_autonomous: "false"

2、修改 vectordb-config.yaml 与 vectordb-secret.yaml，确保环境变量正确挂载并使用 b64enc 加密密码。

3、执行 helm upgrade 更新配置，并在 API 与 Worker Pod 中验证环境变量是否生效（确认 VECTOR_STORE=oracle）。

创建 Dify 知识库并测试检索

完成部署后，企业即可利用 Oracle Database 26ai 的多模态向量存储与 Dify 的 Knowledge Pipeline 能力，快速构建企业级 RAG 应用。

1、Knowledge Pipeline 创建与数据写入

在 Dify 创建好的 Knowledge Pipeline 里上传多模态文件（如包含文本与图表的 PDF），系统会自动进行语义切分并生成向量数据。

Dify 提供了 5 个预置 Knowledge Pipeline 模板，支持从纯文本文档到包含表格的复杂 PDF 文件，覆盖常见的文档解析场景。

这些向量数据会自动存入 Oracle Database 26ai。执行以下 SQL 语句验证数据写入：

select * from cat;

验证生成的向量索引表是否写入成功：

2、 RAG 搜索验证

在 Dify 知识库的「召回测试」中输入查询关键词（如 Oracle 26ai vector features），系统将自动从 Oracle Database 26ai 检索相关向量片段并返回相似度分数。

示例结果如下：

“AI vector search built into Oracle Database and leveraging partitioning, RAC, sharding, and Exadata for industrial-grade scalability.”（得分 0.65）

“Oracle 26ai supports a variety of vector operations.”（得分 0.64）

结果表明 RAG 检索功能运行正常，查询准确且响应迅速。

关于 Oracle Database 26ai

Oracle Database 26ai 是面向 AI 时代的企业级数据平台，具备原生向量管理功能以支持多模态向量数据存储与检索（无需依赖第三方工具），凭借 Oracle 的分区、RAC、Exadata 技术支持，确保了 PB 级数据规模下的高性能与高可用性，并提供标准化接口实现 LLM 与私有数据集成，降低 AI 应用开发复杂度。

关于 Dify

Dify 是一个开源的 LLM 应用开发平台，提供低代码可视化环境，支持拖拽式搭建 Workflow ，集成模型管理、可观测性功能，覆盖从原型设计到生产部署的全过程，有效降低了技术门槛，为企业提供可靠且能持续迭代的 AI 应用基础设施，帮助用户构建稳定、可扩展的生产级 LLM 应用。