微信扫码
添加专属顾问
我要投稿
快速掌握在Ubuntu上部署MinerU进行高效文档解析的完整指南。 核心内容: 1. 系统环境配置:CUDA检查与虚拟环境创建 2. MinerU安装流程:包管理工具与核心组件安装 3. PyTorch GPU版本适配:版本选择与兼容性解决方案
nvcc --version
sudo apt install nvidia-cuda-toolkit
nvidia-smi
python --version
conda create -n mineru python=3.12.4conda activate mineru
pip install uv
uv pip install -U "mineru[core]" -i https://mirrors.aliyun.com/pypi/simple
查看Ubuntu CUDA版本的方法
nvcc -V
CUDA 12.1 向下兼容 12.0)。以下是适配的安装命令:pip install torch==2.5.0 torchvision==0.20.0 torchaudio==2.5.0 --index-url https://download.pytorch.org/whl/cu121
pip install torch==2.8.0 torchvision==0.23.0 torchaudio==2.8.0 --index-url https://download.pytorch.org/whl/cu126
We’d prefer you install the latest version, but old binaries and installation instructions are provided below for your convenience.
# ROCM 6.4 (Linux only)
pip install torch==2.8.0 torchvision==0.23.0 torchaudio==2.8.0 --index-url https://download.pytorch.org/whl/rocm6.4
# CUDA 12.6
pip install torch==2.8.0 torchvision==0.23.0 torchaudio==2.8.0 --index-url https://download.pytorch.org/whl/cu126
# CUDA 12.8
pip install torch==2.8.0 torchvision==0.23.0 torchaudio==2.8.0 --index-url https://download.pytorch.org/whl/cu128
# CUDA 12.9
pip install torch==2.8.0 torchvision==0.23.0 torchaudio==2.8.0 --index-url https://download.pytorch.org/whl/cu129
# CPU only
pip install torch==2.8.0 torchvision==0.23.0 torchaudio==2.8.0 --index-url https://download.pytorch.org/whl/cpumineru-models-download --model_type all
输入modelscope
4.功能测试
pdf输入地址:/home/mac/wendang/pdfs
解析输出地址:/home/mac/wendang/test_output
(1)pipeline模式(速度快)
测试单个pdf文件解析(n卡可GPU加速)通过表格,公式,排版等小模型分开识别
cd /home/mac/wendang/mineru -p ./pdfs/demo1.pdf -o test_output/ --backend pipeline device cuda
(2)vlm模式(精度高,速度慢)
mineru -p ./pdfs/demo1.pdf -o test_output/ --backend vlm-transformers --device cuda
mineru -p ./pdfs -o test_output/ --backend pipeline batch-size 8
conda activate mineru
# 启动web服务界面mineru-gradio --server-name 0.0.0.0 --server-port 7860
https://aicarrier.feishu.cn/wiki/TzBcwXurRiuQZkk17licytSTnBc
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-01-23
AIPPT:图像生成 vs OOXML 两种实现方式对比
2026-01-23
发现了 4 个好玩 SKills,已经在 GitHub 上开源了。
2026-01-21
当A++成为新的“紧箍咒”:我们是否忘记了测试的初衷?
2026-01-20
字节错过 Manus 后,推出的 AnyGen 不是竞争是互补
2026-01-19
Skywork Design Agent重磅上线:非专业人士的AI设计利器,重塑办公创作效率
2026-01-18
字流 2.0 发布:我把 14 个平台的发布流程压到 10 分钟
2026-01-12
万字长文讲解:团队落地 AI 辅助编程和 Specs 实战
2026-01-06
AI对全球白领就业冲击有多大?
2025-12-11
2025-11-04
2025-11-03
2025-11-17
2025-11-13
2025-11-20
2025-11-11
2025-11-05
2025-11-21
2026-01-06