微信扫码
添加专属顾问
我要投稿
20M小模型Texo轻松实现数学公式OCR,准确高效还能浏览器直跑,科研写作必备神器! 核心内容: 1. Texo模型的四大核心优势:轻量、高精度、浏览器直跑、易部署 2. 20M小模型突破性表现的技术原理分析 3. 数学公式OCR的三大典型应用场景
对于常写文档、做数学研究、准备学术论文的同学来说,数学公式 LaTeX 化几乎是绕不开的痛点。
不过最近我发现了一个非常轻量、却非常强大的开源数学公式 OCR 模型 — Texo。
一个只有 20M 参数的小模型,识别准确度却能达到 BLEU 0.85+,关键是还能直接在浏览器中运行,零成本在线使用。
对于一个 OCR 公式识别模型来说,这是相当夸张的表现。
Texo上手零门槛,浏览器直用或本地部署。
官方直接上线有 Demo 版本,可以直接在浏览输入以下地址使用,上传图片即可。
https://texocr.netlify.app/ocr
配置环境
git clone https://github.com/alephpi/Texo
uv sync下载模型
# model only
python scripts/python/hf_hub.py pull按经验来说,OCR + 数学公式解析是一项非常复杂的任务:
理论上,小模型很难完成,但 Texo 居然做到了。
原因大概包含以下几点:
总之,Texo 的强大不是偶然,而是合理的技术路线 + 轻量化设计的优势结合。
如果你经常与数学公式、LaTeX 打交道,那么你真的应该收藏 Texo。
它的优势非常明显:不仅轻量、准确度高、浏览器直跑,还开源、易集成。
真正把高难度的数学公式 OCR 技术拉到了大众可用的层级。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-11-19
全新AI编程工具 Google Antigravity 实测,特别适合产品经理
2025-11-18
高瓴、红杉一起投了一家出海销售Agent
2025-11-18
第一次用 Ollama 跑视觉模型:Qwen2.5-VL 7B 给了我一个意外惊喜
2025-11-18
MiroMind 最新模型发布!深度交互Scaling!模拟人类处理复杂问题的智能体基座模型 MiroThinker v1.0
2025-11-17
4.5K Star!文档管理AI神器Paperless-AI:自动分类打标签,语义搜索秒找文件!
2025-11-17
Memori:让 AI 拥有 "持久记忆" 的开源RAG引擎
2025-11-17
最详细的 DeepAgents 实战拆解:一次看懂LangChain全新深度智能体框架
2025-11-17
让白宫“破防”的阿里千问,我替你们测了...
2025-09-07
2025-08-26
2025-08-22
2025-09-06
2025-10-20
2025-08-22
2025-09-08
2025-10-27
2025-10-27
2025-10-03
2025-11-12
2025-11-10
2025-11-03
2025-10-29
2025-10-28
2025-10-13
2025-09-29
2025-09-17