微信扫码
添加专属顾问
我要投稿
掌握MinerU 1.3.10 API部署与Dify插件接入的实用指南。 核心内容: 1. MinerU 1.3.10版本更新亮点及Web API接口支持 2. 本地部署MinerU WEB API Docker镜像的详细步骤 3. 国内环境下网络配置优化及Dify插件接入方法
最近一个多月MinerU连续发布版本,已经更新到1.3.10了。新版本的MinerU提供的Web API接口也支持Docx、Png等多种格式的文件了。上周官方也推出了教程,在dify中使用MinerU的插件。本篇文章将实现通过本地部署1.3.10版官方API,并接入Dify插件。
git拉取最新的MinerU源码,进入到projects/web_api
目录执行docker构建命令。
## 拉取最新源码
cd MinerU/
git pull
git checkout tags/magic_pdf-1.3.10-released
## 制作docker镜像
cd projects/web_api
docker build -t mineru-api:offical-1.3.10 .
如果你的网络环境相当好,上述的docker镜像很快就完成了。当然,大部分情况下速度没那么快,而且可能还会网络中断。
替换download_models.py
文件,原本的模型是通过HuggingFace下载,大概率是网络受限的,替换官方使用ModelScope下载的方式
wget https://gcore.jsdelivr.net/gh/opendatalab/MinerU@master/scripts/download_models.py -O download_models.py
在Dockerfile中添加一些镜像站,如下
## 【添加】
RUN sed -i 's@deb.debian.org@mirrors.aliyun.com@g' /etc/apt/sources.list.d/debian.sources
# Update the package list and install necessary packages
RUN apt-get update && \
apt-get install -y --no-install-recommends \
build-essential && \
apt-get clean && \
rm -rf /var/lib/apt/lists/*
# Build Python dependencies 【添加 -i https://mirrors.aliyun.com/pypi/simple/】
COPY requirements.txt .
RUN python -m venv /app/venv && \
. /app/venv/bin/activate && \
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/
另外,我们更换了download_models.py
文件,模型下载地址发生了变更,因此下面两行也需要修改
# Copy Python dependencies and models from the build stage
COPY --from=build /root/.cache/modelscope/hub/models/opendatalab/PDF-Extract-Kit-1___0/models /opt/models
COPY --from=build /root/.cache/modelscope/hub/models/ppaanngggg/layoutreader /opt/layoutreader
根据上述修改,基本上能快速构建镜像了。
为了能在Dify插件里使用本地部署的MinerU服务,因此我们直接接入到Dify的内部网络中,不对外暴露端口了。
docker run -d --gpus all --network docker_ssrf_proxy_network --name mineru-api mineru-api:offical-1.3.10
在Dify的插件市场,找到MinerU产检,点击安装。
等待安装完成后,点击授权,在授权页面填写以下信息。由于我们Dify和MinerU在一台服务器上。如果部署在不同的机器上,请填写MinerU服务器的地址及开放的端口。
配置完以后在工作流中试用会提示以下错误
对此我们可以参考MinerU官方给出的解决方案:
1.找到 Dify 部署目录,打开 .env 文件,修改 FILES_URL 配置项,依据你的部署方式填写:
-Docker Compose 部署:FILES_URL 设置为http://api:5001
-其他部署方式:FILES_URL 设置为 http://Dify宿主机IP:5001
2.确认 Dify API 服务的 5001 端口已对外暴露(可检查 docker-compose.yaml 文件的端口映射)。
3.保存 .env 文件。
4.重启 Dify 服务以使配置生效。
我们根据官方提示,修改Dify的配置文件.env
,然后重启Dify。
搭建一个简单的Dify工作流,测试下MinerU插件的效果。
我们拿官方发布的文章来试验[https://mp.weixin.qq.com/s/fLd6yzM3KttWofXCdgDomA ],打印成PDF,有22页。
上传到工作流进行测试。
成功实现了图片型PDF的识别。新版本MinerU优化以后,不仅显存占用下降了,速度也挺快。22页的图片PDF,整个工作流用了20s就解析完成了。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-06
全网首发!Dify 2.0.0 图文混排上线,每个新功能都是爆款!附实战教程(建议收藏)
2025-09-06
Dify 参数提取器用法剖析
2025-09-06
Dify 夏日更新速递|功能概览
2025-09-06
夏日终章,Dify 放出“解暑大招”——v1.7→v1.8 升级包,专治各种“流程便秘”!
2025-09-06
Dify v2.0.0-beta.1悄悄的来啦!看看有哪些大更新?
2025-09-05
Dify 1.8.1发布了,看看带来了哪些变化?
2025-09-04
Dify发布了V1.8.1版本,专注于提升稳定性、性能和开发者体验,解决部分关键问题,让我们一起来看看吧!
2025-09-04
Dify部署避坑指南:5大方案解决PostgreSQL和Redis连接错误
2025-06-25
2025-06-30
2025-06-29
2025-06-10
2025-06-24
2025-06-09
2025-07-02
2025-06-26
2025-07-11
2025-06-25
2025-09-06
2025-09-05
2025-08-29
2025-08-18
2025-08-02
2025-07-30
2025-06-26
2025-06-17