我要投稿

Ollama最新版本神功能：AI思维链随你控制

发布日期：2025-06-13 04:57:24 浏览次数： 2251

作者：JAVA架构日记

微信搜一搜，关注“JAVA架构日记”

什么是思考功能？

思考功能允许AI模型在给出最终答案之前，先展示其内部的推理过程。这就像是让AI"开口思考"，用户可以看到模型是如何一步步分析问题并得出结论的。

支持思考功能的模型

ollama 目前支持思考功能的模型包括：

• DeepSeek R1 - 推理能力强大的开源模型
• Qwen 3 - 阿里巴巴推出的多语言大模型
• 更多模型正在陆续支持中

CLI命令行使用方法

基础控制命令

启用思考功能：

# 使用参数启用
ollama run deepseek-r1 --think "9.9和9.11哪个更大？"

# 交互模式中启用
/set think

禁用思考功能：

# 使用参数禁用
ollama run deepseek-r1 --think=false "快速计算10+23"

# 交互模式中禁用
/set nothink

脚本化使用

如果您想在脚本中使用思考模型但只看结果，可以使用 --hidethinking 参数：

ollama run deepseek-r1:8b --hidethinking "草莓这个词里有几个r？"

API调用示例

REST API调用

Ollama的API完全支持思考功能，通过 think 参数控制：

curl http://localhost:11434/api/chat -d '{
  "model": "deepseek-r1",
  "messages": [
    {
      "role": "user", 
      "content": "解释一下量子纠缠的原理"
    }
  ],
  "think": true,
  "stream": false
}'

响应格式：

{
  "model":"deepseek-r1",
"message":{
    "role":"assistant",
    "content":"量子纠缠是指两个或多个粒子...",
    "thinking":"用户询问量子纠缠原理，我需要从基础概念开始解释...",
    "done_reason":"stop"
}
}

Java集成库支持情况

需要特别注意的是，目前主流的Java AI集成库对Ollama 0.9的思考功能支持还不完善：

• Spring AI - 暂未支持 think 属性
• LangChain4j - 暂未支持 think 属性

如果您在Java项目中需要使用思考功能，建议直接使用HTTP客户端调用Ollama的REST API：

Modelfile高级配置

Qwen3模型的无缝思维链控制

笔者在之前的分享中发现，Qwen3模型有一个独特的能力：可以通过在提示词中携带 /nothink 关键字来控制是否进行深度推理。我们可以巧妙地利用Modelfile的TEMPLATE功能，在不修改后端代码的情况下，自动为用户提交的prompt添加控制指令。

创建默认禁用思考的Qwen3模型

FROM qwen3:latest
TEMPLATE """

...

{{- if eq .Role "user" }}
<|im_start|>user
/nothink {{ .Content }}<|im_end|> # change this line
{{ else if eq .Role "assistant" }}<|im_start|>assistant

...

"""

创建并使用模型：

ollama create qwen3-fast -f ./Modelfile
ollama run qwen3-fast "解释一下机器学习的基本概念"

这样创建的模型会自动在每个用户输入前添加 /nothink，实现默认快速响应模式。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-10-30

让Agent系统更聪明之前，先让它能被信任

2025-10-30

Rag不行？谷歌DeepMind同款，文档阅读新助手：ReadAgent

2025-10-29

4大阶段，10个步骤，助你高效构建企业级智能体（Agent）

2025-10-29

DocReward：让智能体“写得更专业”的文档奖励模型

2025-10-29

沃尔沃RAG实战：企业级知识库，早就该放弃小分块策略

2025-10-29

大模型的Funcation Calling是什么？

2025-10-29

Claude发布新功能Agent Skills，让你的Agent更专业

2025-10-29

星环科技AI Infra平台：重构企业AI基础设施

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

2025-08-21

DeepSeekV3.1 提到的 UE8M0 FP8 Scale 是什么？下一代国产芯片设计？

2025-08-21

DeepSeek V3.1 测评

2025-08-19

新版 GPT-5 刚刚发布，最卷 AI 连肝代码 7 小时，编程工具大洗牌开始了

2025-09-16

实测 Sora 2 ：AI视频的“ChatGPT时刻”来了？八大场景教你解锁各种玩法（附邀请码）

2025-10-02

AI大家说 | 下一代AI创业的机会在哪里？定价趋势是什么？

2025-09-08

阿里发布下一代企业级智能体开发框架AgentScope 1.0

2025-09-17

DeepSeek突然更新V3.1：实测后才发现的亮点与槽点

2025-08-19

RagFLow v0.20.X全面解析！双向MCP、Agentic智能体...这次真的起飞了！（附长图）

2025-09-29

DeepSeek v3.1 到底有多强？与 Claude Code 一起实测！

2025-08-20

大家都在问

大模型的Funcation Calling是什么？

2025-10-29

向量搜索已过时，混合搜索都有三大流派了！你看好哪个流派？

2025-10-29

BCG最新报告：企业如何跨越AI价值鸿沟，进入复利增长？

2025-10-28

如何用飞书多维表格快速搭建一个可落地应用？

2025-10-28

当AI学会“听”：声音识别到声音理解，AI到底是怎么听懂的？

2025-10-27

如何让你的内容出现在AI生成的答案中？

2025-10-26

2025，为何“体感上没有AI爆款应用”？

2025-10-25

Dify Agent 核心解密：三模双驱，如何选对策略让你的AI应用“开挂”？

2025-10-23

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB