微信扫码
添加专属顾问
我要投稿
DeepSeek最新OCR模型实战指南:手把手教你用n8n实现图片文字识别,效果实测分享。 核心内容: 1. 在n8n中配置DeepSeek-OCR API的详细步骤 2. 搭建图片文字识别流程的关键参数设置 3. Webhook扩展应用与效果优化建议
继 DeepSeek-R1、DeepSeek-V3 等大模型之后,DeepSeek正式开源了全新的一个3B OCR模型:DeepSeek-OCR
今天来看看在n8n里如何调用:DeepSeek-OCR
我这里用到的是硅基流动里的免费的DeepSeek-OCR,所以先得在n8n里新建Credential:
找到Openai account,填写好硅基流动的base url和你的API key
然后在n8n里新建如下流程:
首先需要设置chat里的“Allow File Uploads”参数,这样你就可以上传图片并识别里面的内容了:
在AI Agent里设置你的prompts,比如:
识别图片里的文字,适当整理段落格式,不要翻译
运行即可
但说实话,调用的硅基流动里的这个DeepSeek-OCR效果并不是很好,你不妨也试试
另外,还能搭建一个webhook流程,去识别图片里的文字
然后利用webhook的链接写一个静态网页,来读取图片文字
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-12
当 AI Coding Agent 成为基础设施:我们为什么要开源 LoongSuite Pilot
2026-06-09
CPU 跑得比 Whisper GPU还快的开源语音识别,本地部署
2026-06-09
别再问我什么是爱马仕!
2026-06-09
Open Design:开源界的 Claude Design 替代品,61.7K Star,21+ Agent 都能跑,本地第一
2026-06-08
我开源了 PPT-Library:让历史 PPT 变成 AI 可复用资产
2026-06-08
knowledge-work-plugins:Anthropic 官方开源的知识工作插件集,19,000+Star
2026-06-08
从搜索、点击、表单填写到复杂网页操作,让 AI 像人一样使用浏览器
2026-06-08
比Codex快4倍!终于有开源模型卷本地Agent执行效率了~
2026-03-30
2026-04-09
2026-04-03
2026-03-23
2026-04-01
2026-03-31
2026-03-30
2026-04-18
2026-04-18
2026-03-20
2026-05-30
2026-05-16
2026-04-22
2026-04-21
2026-04-15
2026-04-09
2026-04-01
2026-03-17