一个端到端的 OCR 模型，炸裂开源！

发布日期：2024-09-29 18:57:50 浏览次数： 3157

作者：逛逛GitHub

微信搜一搜，关注“逛逛GitHub”

GOT-OCR 2.0 是一款革命性的端到端通用 OCR 模型，它能够识别和提取文本，还能处理数学公式、分子式、图表、乐谱、几何图形等多种内容，极大地拓宽了 OCR 技术的应用范围。

模型大小仅 1.43GB，下面列出来在各个场景的效果，感兴趣的往下看。

? 项目特点

① 多语言、多模态识别：GOT-OCR 2.0 支持多种语言和模态的文本识别，无论是印刷体还是手写体，都能准确识别。

② 多样化输入输出：支持照片、文档、切片等多种输入格式，输出格式包括纯文本、Markdown、TikZ、SMILES、Kern 等，满足不同场景的需求。

③ 长文本处理能力：解码器支持 8K 最大长度的 token，能够处理长文本场景，适用于学术论文、法律文件等长文本资料。

④ 高级功能：包括交互式 OCR 功能、动态分辨率策略、多页 OCR 技术支持，提供更加灵活和高效的 OCR 解决方案。

如下是 GOT 和其他 OCR 模型的对比评分，取得了非常不错的成绩。

OCR 识别效果

公式：

大段文字：

提取文字：

提取某一坐标的文字：

论文：

特殊字符 OCR：

其他语言：

开源地址：https://github.com/Ucas-HaoranWei/GOT-OCR2.0
论文地址：https://arxiv.org/pdf/2409.01704

历史盘点

逛逛 GitHub 每天推荐一个好玩有趣的开源项目。历史推荐的开源项目已经收录到 GitHub 项目，欢迎 Star：

地址：https://github.com/Wechat-ggGitHub/Awesome-GitHub-Repo

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-07-01

在 OpenCode 中接入本地模型：Ollama 部署与配置完全指南

2026-07-01

实测腾讯开源的 BrowserSkill：让 AI 直接用你登录好的浏览器

2026-07-01

阶跃开源JetSpec，大模型推测解码提速近10倍

2026-06-30

花叔的这个神器直接让你的AI Agent出高保真原型、PPT和动画，20k stars不是盖的

2026-06-30

阿里达摩院开源语音识别：比Whisper快170倍还免费，CPU就能跑

2026-06-30

MiniMax M3 实测：第一流的模型，已经对执行层动手了

2026-06-30

DSpark：DeepSeek 如何让大模型推理提速 85%

2026-06-30

告别云端付费！3秒克隆你的声音，这款开源AI不用GPU，手机CPU就能实时跑

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

Google Gemma 4 开源｜全面解读

2026-04-03

Ollama 本地部署 Gemma 4 完全指南

2026-04-18

Google Gemini CLI 完整使用指南

2026-04-18

Agent终于有了自己的邮箱！腾讯Agently Mail详解

2026-06-22

Claude 的金融 Skills 开源了

2026-05-10

Ollama 换引擎，苹果 M5 封神了

2026-05-06

Qwen3.7来了，全球排名第13，国内第一

2026-05-20

亲测有效！Codex桌面版免费接入DeepSeek V4

2026-05-31

Kimi K2.6 开源了！还附送了 300 个 Agent 员工？

2026-04-21

大家都在问

26.1%的AI编程技能有漏洞：NVIDIA开源 SkillSpector 能扫出什么？

2026-06-16

企业级 AI Agent 为什么集体转向“基座 + Skills”？

2026-05-30

Hermes Agent 深度解析：为什么它能“越用越懂你”？

2026-05-16

百度把Nano Banana塞进4090，疯了？

2026-04-22

Kimi K2.6 开源了！还附送了 300 个 Agent 员工？

2026-04-21

Hermes 凭什么两个月接棒 OpenClaw？

2026-04-15

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw