微信扫码
添加专属顾问
我要投稿
一款基于多模态大语言模型的PDF转Markdown工具,助力文档高效转换,保留复杂排版元素。 核心内容: 1. 项目简介与功能特性:MarkPDFDown工具实现PDF到Markdown的高质量转换 2. 安装指南与使用示例:详细步骤介绍如何在不同环境下使用MarkPDFDown 3. 贡献指南与开源协议:项目开源协议介绍及如何贡献代码
基于多模态大语言模型的PDF转Markdown工具,高质量实现文档结构化转换
安装指南
conda create -n markpdfdown python=3.9
conda activate markpdfdown
# 克隆仓库
git clone https://github.com/jorben/markpdfdown.git
cd markpdfdown
# 安装依赖
pip install -r requirements.txt
# 设置OpenAI API密钥
export OPENAI_API_KEY=<你的API密钥>
# 可选设置API端点
export OPENAI_API_BASE=<你的API端点>
# 可选设置默认模型
export OPENAI_DEFAULT_MODEL=<你的模型>
# 运行转换程序
python main.py < tests/input.pdf > output.md
# 转换指定页码范围python main.py 起始页码 结束页码 < tests/input.pdf > output.md
docker run -i -e OPENAI_API_KEY=<你的API密钥> -e OPENAI_API_BASE=<你的API端点> -e OPENAI_DEFAULT_MODEL=<你的模型> jorben/markpdfdown < tests/input.pdf > output.md
requirements.txt
欢迎贡献代码!请按以下流程提交PR:
git checkout -b feature/somefeat
)git commit -m 'feat: 添加XX新功能'
)git push origin feature/somefeat
)本项目采用 Apache License 2.0 开源协议,详见 LICENSE 文件。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-06-11
AI提效99.5%!英国政府联手 Gemini,破解城市规划审批困局
2025-06-10
多模态 RAG VS 传统文本 RAG ,到底效果如何,从应用视角来测试下
2025-06-10
实战复盘 | 基于视觉模型的多模态 RAG 系统,我们踩过的坑与收获 (项目已开源)
2025-06-05
多模态模型在RagFlow中的应用
2025-06-04
清华首创多模态+知识图谱+RAG,问答精准度超 94%
2025-05-30
Deepseek 多模态来解析图片,结合上下文分析pdf文档
2025-05-28
Lovart再次证明:AI不是卖工具而是卖成果
2025-05-27
Dolphin-API:字节Dolphin多模态文档解析模型API化全攻略
2025-05-14
2025-03-26
2025-03-21
2025-04-27
2025-05-16
2025-05-08
2025-04-28
2025-04-05
2025-05-13
2025-05-15