微信扫码
添加专属顾问
我要投稿
DeepSeek最新OCR模型实战指南:手把手教你用n8n实现图片文字识别,效果实测分享。 核心内容: 1. 在n8n中配置DeepSeek-OCR API的详细步骤 2. 搭建图片文字识别流程的关键参数设置 3. Webhook扩展应用与效果优化建议
继 DeepSeek-R1、DeepSeek-V3 等大模型之后,DeepSeek正式开源了全新的一个3B OCR模型:DeepSeek-OCR
今天来看看在n8n里如何调用:DeepSeek-OCR
我这里用到的是硅基流动里的免费的DeepSeek-OCR,所以先得在n8n里新建Credential:
找到Openai account,填写好硅基流动的base url和你的API key
然后在n8n里新建如下流程:
首先需要设置chat里的“Allow File Uploads”参数,这样你就可以上传图片并识别里面的内容了:
在AI Agent里设置你的prompts,比如:
识别图片里的文字,适当整理段落格式,不要翻译
运行即可
但说实话,调用的硅基流动里的这个DeepSeek-OCR效果并不是很好,你不妨也试试
另外,还能搭建一个webhook流程,去识别图片里的文字
然后利用webhook的链接写一个静态网页,来读取图片文字
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-05
FluidMarkdown 正式发布 HarmonyOS 开源 Markdown 渲染引擎,为 AI 流式交互而生
2025-12-05
WeKnora 开源重磅升级,ReACT Agent 智能任务驱动
2025-12-05
开源算法能在 2025 年击败 GPT-5 吗?DeepSeek-V3.2 / Speciale 交出了一份答卷
2025-12-05
开源了首个用于诉讼的智能体框架 SuitAgent
2025-12-05
腾讯混元OCR大模型,本地部署,实测
2025-12-04
刚刚,法国Mistral 3系列模型发布, 全部开源、全部多模态、全部能落地,对标中国模型
2025-12-04
Transformers来到了v5时代:从工具包到真理之源,AI时代的操作系统内核的极简进化论
2025-12-04
Mistral 3发布,14B多模态小模型表现优异
2025-09-07
2025-10-20
2025-11-19
2025-09-08
2025-10-27
2025-10-27
2025-10-03
2025-09-17
2025-09-29
2025-10-29
2025-11-12
2025-11-10
2025-11-03
2025-10-29
2025-10-28
2025-10-13
2025-09-29
2025-09-17