微信扫码
添加专属顾问
我要投稿
DeepSeek最新OCR模型实战指南:手把手教你用n8n实现图片文字识别,效果实测分享。 核心内容: 1. 在n8n中配置DeepSeek-OCR API的详细步骤 2. 搭建图片文字识别流程的关键参数设置 3. Webhook扩展应用与效果优化建议
继 DeepSeek-R1、DeepSeek-V3 等大模型之后,DeepSeek正式开源了全新的一个3B OCR模型:DeepSeek-OCR
今天来看看在n8n里如何调用:DeepSeek-OCR
我这里用到的是硅基流动里的免费的DeepSeek-OCR,所以先得在n8n里新建Credential:
找到Openai account,填写好硅基流动的base url和你的API key
然后在n8n里新建如下流程:
首先需要设置chat里的“Allow File Uploads”参数,这样你就可以上传图片并识别里面的内容了:
在AI Agent里设置你的prompts,比如:
识别图片里的文字,适当整理段落格式,不要翻译
运行即可
但说实话,调用的硅基流动里的这个DeepSeek-OCR效果并不是很好,你不妨也试试
另外,还能搭建一个webhook流程,去识别图片里的文字
然后利用webhook的链接写一个静态网页,来读取图片文字
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-12
深度解析 Devstral 2:Mistral 如何重新定义开源代码智能体(Agentic Coding)
2025-12-12
【开源推荐】1.4 万星爆火!Notebook LM 开源本地版
2025-12-11
一句 prompt,自动部署 AI 手机|邪修还是快
2025-12-10
豆包手机同款AutoGLM硬核开源:AI如何用“眼睛+大脑+手”接管你手机
2025-12-09
豆包手机不用买了?能操作手机的AutoGLM开源
2025-12-09
今天,AutoGLM开源:让人人都可构建手机Agent
2025-12-09
多模态文档智能解析模型进展-英伟达开源NVIDIA-Nemotron-Parse-v1.1
2025-12-09
11K+ Star!NotebookLM 最强开源平替来了,支持私有化部署!
2025-10-20
2025-11-19
2025-10-27
2025-10-27
2025-10-03
2025-09-17
2025-09-29
2025-10-29
2025-09-29
2025-11-17
2025-11-12
2025-11-10
2025-11-03
2025-10-29
2025-10-28
2025-10-13
2025-09-29
2025-09-17