基于MinerU的PDF解析API，支持一键启动

发布日期：2024-09-16 15:57:12 浏览次数： 3614

作者：ChallengeHub

微信搜一搜，关注“ChallengeHub”

unsetunset简介unsetunset

https://github.com/gomate-community/GoMate/blob/main/docs/mineru.md

- MinerU的GPU镜像构建
- 基于FastAPI的PDF解析接口

支持一键启动，已经打包到镜像中，自带模型权重，支持GPU推理加速，GPU速度相比CPU每页解析要快几十倍不等

unsetunset主要功能unsetunset

删除页眉、页脚、脚注、页码等元素，保持语义连贯
对多栏输出符合人类阅读顺序的文本
保留原文档的结构，包括标题、段落、列表等
提取图像、图片标题、表格、表格标题
自动识别文档中的公式并将公式转换成latex
自动识别文档中的表格并将表格转换成latex
乱码PDF自动检测并启用OCR
支持CPU和GPU环境
支持windows/linux/mac平台

unsetunset具体原理unsetunset

请见PDF-Extract-Kit:https://github.com/opendatalab/PDF-Extract-Kit/blob/main/README-zh_CN.md PDF文档中包含大量知识信息，然而提取高质量的PDF内容并非易事。为此，我们将PDF内容提取工作进行拆解：

布局检测：使用LayoutLMv3模型进行区域检测，如图像，表格,标题,文本等；公式检测：使用YOLOv8进行公式检测，包含行内公式和行间公式；公式识别：使用UniMERNet进行公式识别；表格识别：使用StructEqTable进行表格识别；光学字符识别：使用PaddleOCR进行文本识别；

unsetunset镜像地址：unsetunset

阿里云地址：docker pull registry.cn-beijing.aliyuncs.com/quincyqiang/mineru:0.2-models

dockerhub地址：docker pull quincyqiang/mineru:0.2-models

unsetunset启动命令：unsetunset

docker run -itd --name=mineru_server --gpus=all -p 8888:8000 quincyqiang/mineru:0.2-models

具体截图请见博客：https://blog.csdn.net/yanqianglifei/article/details/141979684

unsetunset启动日志：unsetunset

unsetunset输入参数：unsetunset

访问地址：

http://localhost:8888/docs

http://127.0.01:8888/docs

unsetunset解析效果：unsetunset

返回内容字段包括:dict_keys(['layout', 'info', 'content']) 其中content是一个字典列表：

{
  'type': 'text', 
  'text': '现在我们知道：价值实体就是劳动；劳动量的尺度就是劳动持续时间。', 
  'page_idx': 5
}

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-30

Context 即 Agent：下一场 AI 产品战争，是上下文之争

2026-06-30

解析Agent Loop（智能体循环）的三层分级体系

2026-06-30

Cursor、OpenClaw 同时出手，“口袋编程”时代来了：程序员只用“动嘴”！

2026-06-30

从文本到多模态：大模型非结构化数据加工与质量控制实践

2026-06-30

从Anthropic的B端战略，给迷茫中的扣子一些建议

2026-06-30

Claude最新：创始人实操手册：打造 AI 原生初创公司（中文版）

2026-06-30

本体+AI驱动的AI智能体工厂-从设计到实现

2026-06-30

微信AI，能避开豆包手机的窘境吗？

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

OpenAI Codex CLI 完整使用指南

2026-04-07

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

GPT5.5来了，最大特点解析

2026-04-24

Claude Opus 4.7 发布，全网最详细解读

2026-04-17

GPT-6，曝光了

2026-04-05

GLM-5.1 实测：面向 Agent 长程任务的国内第一模型

2026-04-02

重磅！GPT-6曝光了

2026-04-05

Hermes Agent模型配置小白指南

2026-04-14

一文读懂DeepSeek V4：1.6万亿参数、百万上下文、华为芯片

2026-04-24

大家都在问

微信AI，能避开豆包手机的窘境吗？

2026-06-30

AgentTeams 和 Claude Tag 都进入群聊模式，是新范式还是新叙事？

2026-06-27

Agent 从 Demo 到生产级，中间到底差什么？

2026-06-26

微信在金矿上孵化了啥？

2026-06-25

企业智能体的下半场，如何让智能体越用越聪明？

2026-06-18

Agent 记忆，我们全都理解错了？

2026-06-18

如何利用 Harness “一句话交付产品功能”？

2026-06-10

Loop Engineering 循环工程又是什么鬼？

2026-06-10

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw