微信扫码
添加专属顾问
我要投稿
Ollama v0.12.0带来革命性更新,本地与云端模型无缝融合,让开发者轻松调用超大模型资源。核心内容:1. 重磅推出云端大模型预览功能,支持数据中心级硬件推理2. 新增BERT和Qwen3系列模型架构支持3. 多项GPU兼容性优化和API行为改进
2025年9月18日,Ollama 发布了 v0.12.0 版本更新,本次更新带来了一个重量级的新特性——云端模型(Cloud Models)预览功能,使开发者不仅能在本地运行模型,还能直接调用云端算力运行超大模型,实现本地与云端的无缝协同。同时,本版本也对多种模型架构的支持、GPU 兼容性以及 API 行为做了重要优化。
在 v0.12.0 中,Ollama 首次提供了云端推理能力,开发者可以运行体量更大的模型,而无需担心本地机器显存容量不足。云端模型通过 数据中心级别硬件 提供推理计算,同时保持了 Ollama 一贯的隐私与安全政策——不保留用户数据。
通过云端模式,你可以直接调用如 qwen3-coder:480b-cloud
、gpt-oss:120b-cloud
、DeepSeek-v3.1:671b-cloud
等超大模型,并与本地工具链无缝集成。
示例运行命令:
.
ollama run qwen3-coder:480b-cloud
当前可用的云端模型包括:
ollama create
导入失败的 bug。/api/generate
接口,如果提示中包含初始 <think>
标记,将不会进行重复解析,避免响应异常。下载最新 v0.12.0 版本后,即可使用云端功能。
云端推理需要在 Ollama 平台进行账号登录:
.
ollama signin
退出登录:
.
ollama signout
CLI 方式运行:
.
ollama run gpt-oss:120b-cloud
查看已拉取的模型列表:
.
ollama ls
输出示例:
.
NAME ID SIZE MODIFIED
gpt-oss:120b-cloud 569662207105 - 5 seconds ago
deepseek-v3.1:671-cloud d3749919e45f - 2 days ago
qwen3-coder:480b-cloud 11483b8f8765 - 2 days ago
JavaScript
.
import ollama from "ollama";
const response = await ollama.chat({
model: "gpt-oss:120b-cloud",
messages: [{ role: "user", content: "天空为什么是蓝色的?" }],
});
console.log(response.message.content);
Python
.
import ollama
response = ollama.chat(
model='gpt-oss:120b-cloud',
messages=[{'role': 'user','content': '天空为什么是蓝色的?'}]
)
print(response['message']['content'])
cURL
.
curl http://localhost:11434/api/chat -d '{
"model": "gpt-oss:120b-cloud",
"messages": [{
"role": "user",
"content": "天空为什么是蓝色的?"
}],
"stream": false
}'
Ollama v0.12.0 的发布,标志着该平台从本地推理走向了云端与本地融合的新阶段。这不仅解决了本地硬件性能不足的问题,还统一了 API 调用方式,使得开发者能够像使用本地模型一样,轻松调用超大规模云端模型。
我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。
欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-21
别再纠结向量数据库选型了!支撑企业 AI 落地,你需要的是知识库
2025-09-20
RAGAS深度解析:引领RAG评估新时代的开源技术革命
2025-09-20
我的开会焦虑,被腾讯会议和腾讯元宝治好了
2025-09-20
Seedream 4.0 发布!不输 Nano Banana,这些提示词一用就上头
2025-09-20
技术对话:AI搜索如何变革信息获取方式?
2025-09-20
腾讯AI的“三板斧”,首先砍向智能体
2025-09-20
Lemon AI Evolving V0.2.3版本更新:支持 HTML 结果云部署,升级大文件解析能力
2025-09-20
我去!全球 10 亿人用 AI 的真相。
2025-08-21
2025-08-21
2025-08-19
2025-09-16
2025-07-29
2025-09-08
2025-08-19
2025-09-17
2025-08-20
2025-09-14
2025-09-20
2025-09-19
2025-09-19
2025-09-18
2025-09-18
2025-09-17
2025-09-17
2025-09-16