微信扫码
添加专属顾问
我要投稿
MinerU:开源文档解析神器,一键将PDF/图片转为结构化数据,支持37种语言和多种输出格式,开发者必备工具! 核心内容: 1. MinerU的核心能力与全流程解析引擎 2. 高性能解析引擎与极简部署方案 3. 开源生态扩展与五分钟快速上手指南
MinerU是一款开源的工业级文档解析工具,致力于解决非结构化文档(如PDF、扫描图像)的智能化处理难题。它通过深度学习技术将原始文档精准转换为可编辑的Markdown、JSON或HTML格式,并完整保留文字、表格、数学公式、图片等多模态元素的结构与语义。
中/英/日/韩等主流语言全覆盖,特别优化东亚文字排版识别
学术论文(参考文献/章节层级)、法律文书(条款编号)、财务报表(跨页表格)均可精准还原
零安装Web版 | ||
命令行工具 | mineru -p report.pdf -o md | |
Docker GPU加速 | docker run --gpus all mineru-sglang:latest |
# 自定义模型路径(例:加载本地OCR模型)
mineru --ocr_model_path ./custom_ppocrv5
--formula True
)、表格还原(--table True
)独立开关--source local
完全断网运行Markdown
JSON
HTML
# 基础环境配置
conda create -n mineru python=3.10
pip install "mineru[core]" # 安装核心包
# 启用SGLANG加速(需NVIDIA显卡)
mineru -p input.pdf -o outputs -b vlm-sglang-client -u http://localhost:30000
InternLM团队研发,技术论文发布于arXiv:2409.18839
2025 V2.0路线图:垂直文本支持(古文献/乐谱)、显存动态回收机制
GitHub万星项目,提供:
让数据流动,从MinerU开始! 🚀
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-07-18
看了这个开源的可以操作手机电脑的Agent框架,感觉AI黑灯办公室也马上出现了。
2025-07-18
00 后天才团队,发布全球首个 A 股金融博弈智能体应用
2025-07-17
基于Dify动态解析异构银行流水:架构拆解→风控报告生成
2025-07-17
亚马逊最新编程智能体Kiro系统提示词揭秘
2025-07-16
Kimi这把 “干翻”了 GPT-4?别闹,它们压根没在一个酒局!
2025-07-16
百度开源了文心4.5,我想说点实话
2025-07-16
微软开源 NLWeb,掘了数万伪AI创业者的坟
2025-07-16
为什么说Dify或许不是最好的选择,但一定是是目前最适合的应用构建平台?
2025-06-17
2025-06-17
2025-04-29
2025-04-29
2025-07-14
2025-04-29
2025-05-29
2025-07-12
2025-05-12
2025-05-14
2025-07-16
2025-07-15
2025-07-13
2025-07-08
2025-07-04
2025-07-03
2025-06-28
2025-06-25