免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

MinerU功能介绍

发布日期:2025-12-07 09:45:53 浏览次数: 1533
作者:小研说技术

微信搜一搜,关注“小研说技术”

推荐语

MinerU:一键将PDF转换为机器可读格式的利器,支持多种输出格式和复杂排版处理。

核心内容:
1. MinerU的核心功能:PDF转markdown/json、保留文档结构、支持复杂排版处理
2. 安装方式:pip/uv安装或源码安装,支持多种运行环境
3. 使用方式:命令行、API、WebUI三种调用方式,满足不同场景需求

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
介绍:怎么将文档转为json或markdown
步骤一:介绍
官网:https://mineru.net/
MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以方便的抽取为任意格式。
主要功能:
  • 删除页眉、页脚、脚注、页码等元素,确保语义连贯
  • 输出符合人类阅读顺序的文本,适用于单栏、多栏以及复杂排版
  • 保留源文档的结构,包括标题、段落、列表等
  • 提取图像、图片描述、表格、表格标题及脚注
  • 自动识别并转换文档中的公式为LaTeX格式
  • 自动识别并转换文档中的表格为HTML格式
  • 自动检测扫描版PDF和乱码PDF,并启用OCR功能
  • 支持纯CPU环境运行,并支持GPU(CUDA)/NPU(CANN)/MPS加速
  • ......

步骤二:安装
方式一:使用pip或uv安装MinerU
pip install --upgrade pip -i https://mirrors.aliyun.com/pypi/simplepip install uv -i https://mirrors.aliyun.com/pypi/simpleuv pip install -U "mineru[core]" -i https://mirrors.aliyun.com/pypi/simple 
方式二:通过源码安装
git clone https://github.com/opendatalab/MinerU.gitcd MinerUuv pip install -e .[core] -i https://mirrors.aliyun.com/pypi/simple
步骤三:使用
①命令行方式调用
mineru -p <input_path> -o <output_path>
eg:可以通过命令行、API、WebUI等多种方式使用MinerU进行PDF解析
②API方式调用
具体可以查看官方的接口文档
单个文件解析示例
import requests
token = "官网申请的api token"url = "https://mineru.net/api/v4/extract/task"header = {    "Content-Type""application/json",    "Authorization": f"Bearer {token}"}data = {    "url""https://cdn-mineru.openxlab.org.cn/demo/example.pdf",    "model_version""vlm"}
res = requests.post(url,headers=header,json=data)print(res.status_code)print(res.json())print(res.json()["data"])
语言为Python!再看看DeepSeek接口文档
在AI领域,Python是首选,看到这里,想起了没,读过我写的dify使用的教程的小伙伴知道,Dify中的脚本节点支持的是Python和nodejs!
MinerU的生态也挺不错的,支持Dify和Ragflow,适合小企业本地部署,完成AI应用的需求开发。
本人正在打造技术交流群,欢迎志同道合的朋友一起探讨,一起努力,通过自己的努力,在技术岗位这条道路上走得更远。QQ群号:952912771 备注:技术交流 即可通过!
加入技术群可以获取资料,含AI资料、Spring AI中文文档等,等你加入~

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询