微信扫码
添加专属顾问
我要投稿
掌握MinerU 1.3.10 API部署与Dify插件接入的实用指南。 核心内容: 1. MinerU 1.3.10版本更新亮点及Web API接口支持 2. 本地部署MinerU WEB API Docker镜像的详细步骤 3. 国内环境下网络配置优化及Dify插件接入方法
最近一个多月MinerU连续发布版本,已经更新到1.3.10了。新版本的MinerU提供的Web API接口也支持Docx、Png等多种格式的文件了。上周官方也推出了教程,在dify中使用MinerU的插件。本篇文章将实现通过本地部署1.3.10版官方API,并接入Dify插件。
git拉取最新的MinerU源码,进入到projects/web_api
目录执行docker构建命令。
## 拉取最新源码
cd MinerU/
git pull
git checkout tags/magic_pdf-1.3.10-released
## 制作docker镜像
cd projects/web_api
docker build -t mineru-api:offical-1.3.10 .
如果你的网络环境相当好,上述的docker镜像很快就完成了。当然,大部分情况下速度没那么快,而且可能还会网络中断。
替换download_models.py
文件,原本的模型是通过HuggingFace下载,大概率是网络受限的,替换官方使用ModelScope下载的方式
wget https://gcore.jsdelivr.net/gh/opendatalab/MinerU@master/scripts/download_models.py -O download_models.py
在Dockerfile中添加一些镜像站,如下
## 【添加】
RUN sed -i 's@deb.debian.org@mirrors.aliyun.com@g' /etc/apt/sources.list.d/debian.sources
# Update the package list and install necessary packages
RUN apt-get update && \
apt-get install -y --no-install-recommends \
build-essential && \
apt-get clean && \
rm -rf /var/lib/apt/lists/*
# Build Python dependencies 【添加 -i https://mirrors.aliyun.com/pypi/simple/】
COPY requirements.txt .
RUN python -m venv /app/venv && \
. /app/venv/bin/activate && \
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/
另外,我们更换了download_models.py
文件,模型下载地址发生了变更,因此下面两行也需要修改
# Copy Python dependencies and models from the build stage
COPY --from=build /root/.cache/modelscope/hub/models/opendatalab/PDF-Extract-Kit-1___0/models /opt/models
COPY --from=build /root/.cache/modelscope/hub/models/ppaanngggg/layoutreader /opt/layoutreader
根据上述修改,基本上能快速构建镜像了。
为了能在Dify插件里使用本地部署的MinerU服务,因此我们直接接入到Dify的内部网络中,不对外暴露端口了。
docker run -d --gpus all --network docker_ssrf_proxy_network --name mineru-api mineru-api:offical-1.3.10
在Dify的插件市场,找到MinerU产检,点击安装。
等待安装完成后,点击授权,在授权页面填写以下信息。由于我们Dify和MinerU在一台服务器上。如果部署在不同的机器上,请填写MinerU服务器的地址及开放的端口。
配置完以后在工作流中试用会提示以下错误
对此我们可以参考MinerU官方给出的解决方案:
1.找到 Dify 部署目录,打开 .env 文件,修改 FILES_URL 配置项,依据你的部署方式填写:
-Docker Compose 部署:FILES_URL 设置为http://api:5001
-其他部署方式:FILES_URL 设置为 http://Dify宿主机IP:5001
2.确认 Dify API 服务的 5001 端口已对外暴露(可检查 docker-compose.yaml 文件的端口映射)。
3.保存 .env 文件。
4.重启 Dify 服务以使配置生效。
我们根据官方提示,修改Dify的配置文件.env
,然后重启Dify。
搭建一个简单的Dify工作流,测试下MinerU插件的效果。
我们拿官方发布的文章来试验[https://mp.weixin.qq.com/s/fLd6yzM3KttWofXCdgDomA ],打印成PDF,有22页。
上传到工作流进行测试。
成功实现了图片型PDF的识别。新版本MinerU优化以后,不仅显存占用下降了,速度也挺快。22页的图片PDF,整个工作流用了20s就解析完成了。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-07-20
用Dify,让Excel数据秒变趋势图,AI Agent来助力!
2025-07-18
别卷了!用 Dify 搭建你的专属 AI 数据分析报告助手
2025-07-17
Dify调用firecrawl工具扒取单网页信息的工作流各节点设置逐项解析
2025-07-16
是真的很卷啊!这次Dify升级到1.6.0,突然就有了很火的MCP方案了!
2025-07-12
性能提升 10 倍,零改造实现 DIFY 模式迁移至 Spring AI Alibaba 模式
2025-07-11
Dify v1.6.0:原生集成 MCP,实现 AI 能力的双向流通
2025-07-11
Dify 1.6.0 重磅上线:原生MCP 双向集成、结构化输出升级!
2025-07-11
Dify终于全面支持MCP了!就在刚刚,Dify发布V1.6.0版本,并宣布支持Anthropic 的模型上下文协议 (MCP)
2025-06-25
2025-06-04
2025-04-28
2025-06-03
2025-05-08
2025-05-08
2025-06-02
2025-05-29
2025-05-19
2025-06-29
2025-06-26
2025-06-17
2025-05-29
2025-05-28
2025-05-22
2025-04-27
2025-04-15
2025-03-20