我要投稿

字节开源Dolphin文档解析模型-部署指南+实战测试

发布日期：2025-06-03 19:36:10 浏览次数： 2626

作者：AI小新

微信搜一搜，关注“AI小新”

在数字化办公席卷全球的今天，文档解析技术已成为企业数字化转型的关键瓶颈。面对海量的合同、报告、论文等文档资料，传统解决方案要么速度缓慢，要么错误百出。5月22日，字节跳动开源的全新文档解析模型Dolphin横空出世，凭借仅322M参数的轻量级架构，在性能上实现了对GPT-4.1、Claude3.5等重量级模型的全面超越！

github: https://github.com/bytedance/Dolphin

在线Demo: http://115.190.42.15:8888/dolphin

下面开始部署指南：

一、安装依赖环境

# 下载代码

git clone https://github.com/ByteDance/Dolphin.git
cd Dolphin


# 创建虚拟环境
conda create -n Dolphin  python=3.11

# 激活虚拟环境
conda activate Dolphin 


# 安装uv

pip install uv -i https://pypi.tuna.tsinghua.edu.cn/simple/


# 修改numpy版本
先修改requirements.txt文件，否则会报错，报错信息放在了文末：
把numpy==1.24.4  改为  numpy==1.26.0


# 安装requirements.txt依赖包

uv pip install -r requirements.txt  -i https://pypi.tuna.tsinghua.edu.cn/simple/

二、下载模型权重

选项A：原始模型格式（基于配置）

从百度云或谷歌驱动器下载，并将它们放在。/checkpoint文件夹中。

百度网盘：

https://pan.baidu.com/share/init?surl=5zcARoX0CTOHKbW8bFZovQ&pwd=9rpx

谷歌云盘：

https://drive.google.com/drive/folders/1PQJ3UutepXvunizZEw-uGaQ0BCzf-mie

选项B：Huggingface模型格式

huggingface模型地址：

https://huggingface.co/ByteDance/Dolphin

魔搭的模型地址：

https://www.modelscope.cn/models/ByteDance/Dolphin

#从Hugging Face Hub下载模型

Git LFS安装

git clone https://huggingface.co/ByteDance/Dolphin ./hf_model

本文采用选项A：原始模型格式，百度网盘下载模型权重，放入checkpoints 目录中；

三、实战测试效果

模型推理的配置文件：

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-04

腾讯开源了 Agent Memory，让 AI 真正记住你。_tag2

2026-06-04

AionUi 统一接管 OpenClaw 与 Hermes Agent

2026-06-04

重磅！谷歌开源Gemma 4 12B：统一的、无编码器的多模态模型，16G内存笔记本就可以跑

2026-06-03

微软开源Intelligent Terminal：基于Windows Terminal、集成原生Agent能力

2026-06-02

让 Agent 拥有超强记忆，TencentDB Agent Memory 开源了！

2026-06-02

Qwen3-ASR：阿里开源的语音识别大模型，一行命令干掉 Whisper

2026-06-02

拥抱 AI Agent 时代：12条工程实践指南

2026-05-31

亲测有效！Codex桌面版免费接入DeepSeek V4

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Hermes Agent 出来了，聊聊它凭什么跟 OpenClaw 掰手腕

2026-03-30

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

Google Gemma 4 开源｜全面解读

2026-04-03

字节跳动开源 DeerFlow 2.0：下一代超级 Agent 引擎，一键搞定复杂工作流！

2026-03-23

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

刚刚，Claude Code开源了！51万行代码，全网狂欢

2026-03-31

OpenAI 刚开源了 Symphony：以后写代码，你只需要拖工单就行了

2026-03-09

龙虾绝配：Qwen 3.5 27B！跑在家里，成本为 0

2026-03-30

阿里开源龙虾组合来了：HiClaw + CoPaw，内存占用大幅降低，还能直接操作本地环境

2026-03-12

Ollama 本地部署 Gemma 4 完全指南

2026-04-18

大家都在问

企业级 AI Agent 为什么集体转向“基座 + Skills”？

2026-05-30

Hermes Agent 深度解析：为什么它能“越用越懂你”？

2026-05-16

百度把Nano Banana塞进4090，疯了？

2026-04-22

Kimi K2.6 开源了！还附送了 300 个 Agent 员工？

2026-04-21

Hermes 凭什么两个月接棒 OpenClaw？

2026-04-15

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

英伟达的NemoClaw，能帮AI代理这匹“野马”套上缰绳吗？

2026-03-17

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部