微信扫码
添加专属顾问
我要投稿
一款基于多模态大语言模型的PDF转Markdown工具,助力文档高效转换,保留复杂排版元素。 核心内容: 1. 项目简介与功能特性:MarkPDFDown工具实现PDF到Markdown的高质量转换 2. 安装指南与使用示例:详细步骤介绍如何在不同环境下使用MarkPDFDown 3. 贡献指南与开源协议:项目开源协议介绍及如何贡献代码
基于多模态大语言模型的PDF转Markdown工具,高质量实现文档结构化转换
安装指南
conda create -n markpdfdown python=3.9conda activate markpdfdown# 克隆仓库git clone https://github.com/jorben/markpdfdown.gitcd markpdfdown# 安装依赖pip install -r requirements.txt
# 设置OpenAI API密钥export OPENAI_API_KEY=<你的API密钥># 可选设置API端点export OPENAI_API_BASE=<你的API端点># 可选设置默认模型export OPENAI_DEFAULT_MODEL=<你的模型># 运行转换程序python main.py < tests/input.pdf > output.md
# 转换指定页码范围python main.py 起始页码 结束页码 < tests/input.pdf > output.md
docker run -i -e OPENAI_API_KEY=<你的API密钥> -e OPENAI_API_BASE=<你的API端点> -e OPENAI_DEFAULT_MODEL=<你的模型> jorben/markpdfdown < tests/input.pdf > output.md
requirements.txt欢迎贡献代码!请按以下流程提交PR:
git checkout -b feature/somefeat )git commit -m 'feat: 添加XX新功能' )git push origin feature/somefeat )本项目采用 Apache License 2.0 开源协议,详见 LICENSE 文件。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-12
PaddleOCR 3.7 正式接入ONNX Runtime,一个参数换后端,轻量部署新选择
2026-06-11
本地部署OCR,可能是AI进单位的第一道门
2026-06-08
正式推出 Gemma 4 12B: 一款统一、免编码器的多模态模型
2026-05-30
还在用 MinerU 解析 PDF?这个 2B 小模型直接把 olmOCR-bench 刷到 87.6%,速度还快 3.68 倍
2026-05-30
Qwen-VLA:迈向通用具身智能的统一动作框架
2026-05-25
罗福莉说的“伪多Agent”,我试了OmniWork后发现,真全干专家长这样
2026-05-19
从画稿到代码,AI Agent 正在吃掉产品设计的中间环节
2026-05-16
PDF解析折腾半年,最后靠这套方案搞定了
2026-04-22
2026-04-01
2026-04-02
2026-03-18
2026-03-29
2026-04-21
2026-04-27
2026-04-09
2026-03-31
2026-04-15
2026-03-12
2025-12-31
2025-08-04
2025-05-26
2025-05-13
2025-04-08
2025-04-05
2025-03-30