我要投稿

Qwen3 与 ollama 兼容性问题

发布日期：2025-05-10 20:21:53 浏览次数： 2726

作者：生有可恋

微信搜一搜，关注“生有可恋”

新模型出来后需要和 Ollama 做适配，比如v0.6.0版本后才开始支持 Gemma3，之前的版本无法运行 Gemma3。同时新版本的 ollama 对 gblic 版本有要求，在 CentOS 7 等版本上无法运行新版本的 ollama。

推荐的运行环境是 Ubuntu 22.04 或 Ubuntu 24.04 等新出的 Linux 发行版，他们自带的 glibc 版本比较高，对新模型和Nvidia驱动的支持比较好。

昨天测试了在 v0.6.0 的 ollama 上跑 qwen3:32b。虽然可以下载模型文件，但跑不了。运行 qwen3:32b 时报错：

Error: unable to load model

目前最新版的 ollama 版本为 v0.6.6，rc 版是 v0.6.7-rc0

当新版发布时会公布支持的新模型，比如 v0.6.0 时公布支持 gemma3，v0.6.6 公布支持 DeepCoder。

目前 v0.6.7-rc 版暂未公布支持 qwen3，通过测试发现在 v0.6.7 下能把 qwen3:32b 跑起来，但稳定性存在问题。每轮会话结束 qwen3 模型都会自动卸载掉，新会话开始又重新加载模型。在应用侧会表现为响应变慢，每问一次问题都会卡好一会。

建议等新的 ollama 版本官宣支持 qwen3 后再部署，当前稳定性不足无法正常使用 qwen3。

qwen3 各尺寸模型文件大小为：

本地部署可以考虑 qwen3:30b-a3b 和 qwen3:32b，他们大小相似但模型不同，qwen3:32b 属于密集模型，qwen3:32b-a3b 属于混合专家（Moe）模型。qwen3 最强大的模型是142G的 qwen3:235b-a22b，它与 qwen3:32b-a3b 同属 Moe 模型。

如果是4卡v100或3060显卡，可以考虑部署 qwen3:32b 和 qwen3:30b-a3b。如果是8卡的A800，可以考虑上 qwen3:235b-a22b。

秀一下昨天刚装好的 A800 的机器：

全文完。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-09-25

如何将 AI 代码采纳率从30%提升到80%？

2025-09-24

一位淘宝工程同学的大模型LoRA微调尝试

2025-09-20

在Colab中微调Qwen3-4B模型实战指南

2025-09-09

微调Qwen2.5模型的完整指南

2025-09-07

阿里云Qwen3系列模型部署微调评测

2025-09-04

如何将公司内部数据制作成大模型训练用的数据集

2025-08-25

手把手教你用LLaMA‑Factory微调医疗问答模型：从小白到专家的实战之路

2025-08-23

微调实战之上手训一个7b小模型

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

模型微调是啥？有哪些方法？小白也能看懂的通俗讲解

2025-07-03

飞桨 AI Studio：一步步微调你的大模型

2025-07-28

10分钟微调，让0.6B模型媲美235B模型！免费体验进行中

2025-07-22

大模型微调的数据成本到底有多吓人？丨实战笔记

2025-07-09

AI学会反思后智商飙升，分享我训练AI干活的3个方法

2025-07-09

微调之后还能做什么？大模型后训练全链路技术解析

2025-07-31

Unsloth微调Qwen3实战：让大模型训练飞起来的神器

2025-07-30

大模型微调技巧：LoRA 与 QLoRA讲解

2025-07-20

大模型微调，解锁AI的专属超能力！

2025-08-07

英伟达：专门微调后的小模型才是Agentic AI的未来

2025-07-16

大家都在问

如何将 AI 代码采纳率从30%提升到80%？

2025-09-25

大模型微调，为什么99%的企业都不应该碰这个坑？

2025-06-20

万不得已，不要对 LLM 进行微调？

2025-06-17

可以将任何符合OpenAPI规范的接口转 MCP Server吗？

2025-05-21

OpenAI发布GPT-4.1系列模型，对行业最大吸引力是什么？

2025-05-17

私有部署大模型需要多少显存？

2025-05-14

软件公司如何为AI的下半场做准备？

2025-05-10

LoRA为何成为大模型微调不可或缺的核心技术？

2025-05-07

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部