免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

ollama v0.13.1 发布:全新 Ministral-3 与 Mistral-Large-3 模型,增强工具调用与GPU

发布日期:2025-12-04 04:38:23 浏览次数: 1551
作者:福大大架构师每日一题

微信搜一搜,关注“福大大架构师每日一题”

推荐语

Ollama v0.13.1带来两大全新模型家族与多项性能优化,为AI开发者和企业用户提供更强大的本地部署能力。

核心内容:
1. Ministral-3和Mistral-Large-3两大新模型系列的特色与应用场景
2. 引擎工具调用、GPU兼容性等核心功能改进细节
3. 错误处理、API响应等用户体验优化措施

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

 

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

Ollama 2025年12月3日发布了 v0.13.1 版本更新,本次更新重点引入了两个新的模型家族,并带来了多项功能增强、错误修复及底层改进,进一步提升了模型的部署灵活性与运行稳定性。

一、 全新模型登场

  1. 1. Ministral-3 系列:此系列模型专为边缘部署设计,能够在广泛的硬件设备上高效运行,为资源受限的环境提供了强大的本地AI能力。
  2. 2. Mistral-Large-3 系列:这是一个通用的多模态混合专家(MoE)模型,旨在处理生产级任务和企业级工作负载,在复杂场景下表现出色。

二、 核心功能与改进

  1. 1. 引擎与工具调用
  • • nomic-embed-text 模型现在默认使用 Ollama 自身的引擎运行。
  • • 为 cogito-v2.1 模型新增了工具调用(tool calling)支持。
  • • 同样为 cogito-v2.1 模型添加了思维链(thinking)解析功能。
  • 2. GPU 与系统兼容性修复
    • • 修复了 CUDA VRAM 发现的相关问题。
    • • 解决了在仅配备 CPU 的系统上,模型可能被错误驱逐(evict)的问题。
    • • 修复了在某些旧款 GPU 上无法检测到 CUDA 的问题。
    • • 改进了对 CUDA 计算能力(CC)与目标库版本的兼容性验证。
    • • (Windows系统)增加了对 PATH 中潜在不兼容库文件(如 ggml-base.dll)的检测与警告。
  • 3. 错误处理与用户体验
    • • Ollama 现在能够更好地呈现和渲染错误信息,而非简单地显示 “Unmarshal: errors”。
    • • API 客户端 (api/client) 增强了对非 JSON 格式流式错误响应的处理能力。
  • 4. 应用与文档
    • • 修复了应用内连接打开逻辑,优化了用户体验。
    • • 更新了应用内帮助链接,使其指向官方文档网站。
    • • 清理了文档中已弃用参数(如 mirostatmirostat_etamirostat_tau)的说明。

    三、 重要代码变更摘要

    本次更新包含了 18个提交,涉及 33个文件 的更改,由 12位贡献者 共同完成。部分关键变更包括:

    • • API/客户端:增强了错误处理逻辑,当服务器返回非JSON格式的错误响应(如纯文本或HTML)时,能正确传递状态码和错误信息。
    • • 应用层:优化了 macOS 和 Windows 系统上处理自定义 URL 协议(如 ollama://)的逻辑。
    • • 模型支持
      • • ministral-3:模型支持现已集成,并添加了相应的测试。
      • • DeepSeek2:升级以支持运行 v3+ 版本的模型。
      • • 模型解析器:新增了针对 cogito-v2.1 模型的专用解析器,以支持其独特的工具调用和思维格式。
      • • mistral3 模型结构:在转换逻辑中增加了对 LLAMA 4 缩放因子等新 rope 参数的支持。
    • • 底层与发现
      • • GPU 发现:改进了设备发现机制,避免库路径重叠,并加入了对 NVIDIA Jetson Jetpack 版本的更精确匹配要求。
      • • KV 缓存:测试现在同时覆盖使用和不使用 PermutedV 的情况。
      • • LLM 服务器:修正了在仅有 CPU 的系统上进行模型布局验证的逻辑,防止不必要的模型驱逐。

    四、 其他调整

    • • 将 Vulkan 着色器文件标记为“已供应”文件。
    • • 更新了 .gitattributes 以正确归类相关文件。
    • • 移除了代码检查工具中的 gocritic 规则。

    总结

    代码地址:github.com/ollama/ollama

    Ollama v0.13.1 版本是一个以模型扩展和系统稳固性为主的更新。它不仅为用户带来了适用于边缘和企业场景的新模型选择,还通过一系列关键的缺陷修复和兼容性改进,显著提升了软件在各类硬件环境下的可靠性和用户体验。特别是对 cogito 和 ministral 系列模型支持的增强,展现了 Ollama 生态持续扩展对多样化模型架构的兼容能力。

     

    ·

    我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。


    欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

    ·

    53AI,企业落地大模型首选服务商

    产品:场景落地咨询+大模型应用平台+行业解决方案

    承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

    联系我们

    售前咨询
    186 6662 7370
    预约演示
    185 8882 0121

    微信扫码

    添加专属顾问

    回到顶部

    加载中...

    扫码咨询