微信扫码
添加专属顾问
我要投稿
一款基于多模态大语言模型的PDF转Markdown工具,助力文档高效转换,保留复杂排版元素。 核心内容: 1. 项目简介与功能特性:MarkPDFDown工具实现PDF到Markdown的高质量转换 2. 安装指南与使用示例:详细步骤介绍如何在不同环境下使用MarkPDFDown 3. 贡献指南与开源协议:项目开源协议介绍及如何贡献代码
基于多模态大语言模型的PDF转Markdown工具,高质量实现文档结构化转换
安装指南
conda create -n markpdfdown python=3.9conda activate markpdfdown# 克隆仓库git clone https://github.com/jorben/markpdfdown.gitcd markpdfdown# 安装依赖pip install -r requirements.txt
# 设置OpenAI API密钥export OPENAI_API_KEY=<你的API密钥># 可选设置API端点export OPENAI_API_BASE=<你的API端点># 可选设置默认模型export OPENAI_DEFAULT_MODEL=<你的模型># 运行转换程序python main.py < tests/input.pdf > output.md
# 转换指定页码范围python main.py 起始页码 结束页码 < tests/input.pdf > output.md
docker run -i -e OPENAI_API_KEY=<你的API密钥> -e OPENAI_API_BASE=<你的API端点> -e OPENAI_DEFAULT_MODEL=<你的模型> jorben/markpdfdown < tests/input.pdf > output.md
requirements.txt欢迎贡献代码!请按以下流程提交PR:
git checkout -b feature/somefeat )git commit -m 'feat: 添加XX新功能' )git push origin feature/somefeat )本项目采用 Apache License 2.0 开源协议,详见 LICENSE 文件。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-11
Qwen3-Omni新升级:声形意合,令出智随!
2025-12-11
首发实测智谱 GLM-TTS:3秒克隆我的声音,连「哎等等这bug怎么回事」都学会了
2025-12-11
硅基流动上线智谱视觉模型 GLM-4.6V
2025-12-11
GLM-TTS技术报告:基于多奖励强化学习的可控发音语音合成
2025-12-11
Qwen3-TTS全面升级:声情并茂,语通八方
2025-12-09
Ming-Flash-Omni 音视图文全模态技术报告解读 —— 一为全,全为一
2025-12-07
阿里 Qwen3-TTS 全新上线!支持9种方言+49种音色,连天津味儿都拿捏了!
2025-12-06
微软又上大分!刚刚开源一款 0.5B 轻量级实时 TTS 模型,还能边想边说!
2025-09-19
2025-11-10
2025-10-22
2025-10-31
2025-09-25
2025-12-06
2025-09-17
2025-11-03
2025-12-07
2025-11-19
2025-08-04
2025-05-26
2025-05-13
2025-04-08
2025-04-05
2025-03-30
2025-03-26
2025-03-05