我要投稿

Deepseek-R1不支持Function Call？不能搭建智能体？教你一招

发布日期：2025-03-22 07:21:45 浏览次数： 5966

作者：亦折亦顺

微信搜一搜，关注“亦折亦顺”

DeepSeek-R1没有Function Call能力

大模型的Function Call能力指的是模型能够根据用户需求，自动调用外部工具或API来完成特定任务的能力。例如，查询天气时调用天气API、执行数学计算时调用计算工具等。这种能力通过结构化输出来触发外部功能，使模型不仅能生成文本，还能执行实际任务。如果DeepSeek-R1不具备Function Call能力，那么就不能使用DeepSeek-R1搭建智能体。

Deepseek官网使用Function Call的例子

使用的模型是"deepseek-chat"，也就是DeepSeek-V3，如果你使用DeepSeek-R1，就会报类似下图的错误"function call is not supported for this model."，具备Function Call底层逻辑就是如上图兼容openai接口支持tools这个参数

如何解决

1、定制化微调：

若对 DeepSeek-R1 进行微调，可训练其输出特定格式的函数调用指令（类似 GPT 的 Function Calling 微调），但需自行构建训练数据和接口。（资源、数据可不是一般人能搞定的~）

2、外部集成：

DeepSeek-R1 可通过输出结构化指令（如JSON），再编写代码解析并调用外部工具，再将结果返回模型生成最终回答。（我理解这种实现应该最常用，但是比如Langchain这种还需要兼容openai的模型接口）

试试看还有没有别的实现方法，看到一个神奇的点子

非常类似这个开源项目：https://github.com/cameronking4/deepseek-r1-structured-outputs

项目核心提示词：

是不是很简单都看懂了~

不过我试验下来，第2个模型我是使用Qwen2.5，除了用户输入需要先经过Deepseek-R1推理再给Qwen2.5，工具返回的结果也需要先经过R1推理。如果使用Langchain/Langgraph多轮对话的场景，ToolMessage和带tool_calls的AIMessage的消息类型都需要改造，R1是不支持的。

本来想放一个搭建好的使用样例，使用Deepseek-R1支持Function call。但是数据原因不适合放上来，不过也没什么必要，就是有R1和Qwen2个模型的输出，类似R1规划，Qwen再执行。

最后，字节的扣子支持Deepseek-R1工具调用，是什么方案呢~

就到这，除了体力的苦，少数成功的人才能吃得了苦，

独立思考吃脑力的苦

克制忍耐吃自律的苦

读书学习吃孤独的苦

能屈能伸吃尊严的苦

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-14

多轮 Agent 场景下，滴滴的 EAGLE-3 训推加速实践

2026-05-06

谁说 Mac 只能写代码？Google 官宣：M 芯片本地微调 Gemma 4 时代开启！

2026-04-20

用 Unsloth 微调 Embedding 模型，让你的 RAG 检索不再答非所问

2026-04-15

ComfyUI v0.19.0 更新：大量新节点、新模型、新修复与性能优化全面落地，工作流与训练能力再升级

2026-04-13

Agent 持续学习落地路径：先做 Traces，再做 Context，最后才微调模型 | Jinqiu Select

2026-03-23

养死四只龙虾的小白有感

2026-03-22

Mistral Forge 的真正意义：企业AI从“租用”走向“拥有”

2026-03-21

马斯克再次站台Kimi，扒掉了Cursor 500亿估值的底裤

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

ComfyUI v0.19.0 更新：大量新节点、新模型、新修复与性能优化全面落地，工作流与训练能力再升级

2026-04-15

MiniMax M2.7 炸场！自己训自己，8 项基准硬刚 GPT-5 和 Opus 4.6

2026-03-19

马斯克再次站台Kimi，扒掉了Cursor 500亿估值的底裤

2026-03-21

Mistral Forge 的真正意义：企业AI从“租用”走向“拥有”

2026-03-22

养死四只龙虾的小白有感

2026-03-23

Agent 持续学习落地路径：先做 Traces，再做 Context，最后才微调模型 | Jinqiu Select

2026-04-13

用 Unsloth 微调 Embedding 模型，让你的 RAG 检索不再答非所问

2026-04-20

谁说 Mac 只能写代码？Google 官宣：M 芯片本地微调 Gemma 4 时代开启！

2026-05-06

多轮 Agent 场景下，滴滴的 EAGLE-3 训推加速实践

2026-05-14

大家都在问

DeepSeek 发布新论文，提出全新 MHC 架构，有何创新与应用前景？

2026-01-02

LoAR做Fine-Tuning微调原理到底是什么？

2025-11-19

如何将 AI 代码采纳率从30%提升到80%？

2025-09-25

大模型微调，为什么99%的企业都不应该碰这个坑？

2025-06-20

万不得已，不要对 LLM 进行微调？

2025-06-17

可以将任何符合OpenAPI规范的接口转 MCP Server吗？

2025-05-21

OpenAI发布GPT-4.1系列模型，对行业最大吸引力是什么？

2025-05-17

私有部署大模型需要多少显存？

2025-05-14

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部