免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

Kimi 发布并开源 K2.5 模型,带来全新视觉理解、代码和 Agent 集群能力

发布日期:2026-01-27 15:14:51 浏览次数: 1574
作者:月之暗面 Kimi

微信搜一搜,关注“月之暗面 Kimi”

推荐语

Kimi K2.5模型开源发布,视觉理解与Agent集群能力带来10倍效率革命,让AI办公与编程触手可及。

核心内容:
1. 原生多模态架构支持视觉与文本输入,突破文字表达限制
2. Office中高阶技能支持,直接生成准专业办公文档
3. 首创Agent集群能力,实现团队协作式AI任务处理

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

The soul never thinks without a mental image. 灵魂如果没有图像,就无法思考。

Aristotle De Anima
今天,我们发布并开源 Kimi K2.5 模型:
  • 它是 Kimi 迄今最智能的模型,在 Agent、代码、图像、视频及一系列通用智能任务上取得开源 state-of-the-art 表现。

  • 也是 Kimi 迄今最全能的模型,原生的多模态架构设计,同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务。

我们相信,更智能、更全能,代码能力更强的模型,有助于推动技术平权,让更多人从中受益:
  • Kimi K2.5 让智能更加触手可及。通过将视觉理解与推理、代码、Agent 等能力结合,K2.5 降低了用户与 AI 的交互门槛:当语言难以准确描述时,可拍照、截图或录屏传给 Kimi,突破文字表达的限制。

  • Kimi K2.5 让人人精通 Office。K2.5 模型将 Kimi Agent 能力扩展到日常办公领域,开始掌握 Word、Excel、PPT、PDF 等常用软件的中高阶技能,助用户直接交付准专业水平的办公文档。

我们相信,AI Agent 将赋予每个人「超能力」。就像人类社会一样,要处理真正复杂的工作需要协作一样。K2.5 首次引入了「Agent 集群」能力,让 K2.5 学会自主创建自己的「分身」,按需组成不同角色的团队,并行工作,团队作战,获得 10 倍、100 倍的效率提升。
Kimi K2.5 现已登陆 kimi.com最新版Kimi AppKimi API 开放平台和我们的编程助手产品 Kimi Code,欢迎体验。
关于 Kimi K2.5 模型的更多技术细节和基准测试结果,请关注我们的技术博客和后续发布的技术报告。
代码 × 视觉
让智能触手可及
Kimi K2.5 进一步提升了开源模型的代码水平,尤其是在前端开发领域。K2.5 模型支持从简单的自然语言对话生成完整的前端界面,并能有效处理交互式布局及滚动触发等动态效果。以下展示了 K2.5 在图像生成工具的辅助下,仅凭单条 Prompt 实现的网站开发实例:
通过融合视觉能力,K2.5 也真正降低了编程的门槛:你可以直接传一段录屏。Kimi K2.5 能自动拆解背后的交互逻辑,并用干净、专业的代码将其从头到尾复现出来。
Kimi K2.5 模型先进的视觉理解和编程能力,也从 API 早期内测客户的反馈中得到了印证:
其中,Keep AI 教练 Kaka 基于 Kimi K2.5 模型的视频动作识别、评估等功能,即将上线,敬请期待。
Agent 集群
赋予你「超能力」
半年前,我们发布了首个万亿参数开源 Agent 模型 Kimi K2。随后推出的 Kimi K2 Thinking,通过增加思考时间,具备了独立完成长达 300 步操作的长程任务能力。但这还不够。处理真实世界的复杂难题,不能只靠单打独斗,更需要团队协作。
今天,我们发布 Kimi K2.5 的全新探索:Agent 集群。这一次,我们从单一 Agent 进化到了 Agent 集群。
面对复杂任务,K2.5 不再是一个包揽一切的「全能专家」,而是化身为一支即时组建的「专业团队」。它能根据任务需求,现场调度多达 100 个分身,并行处理 1500 个步骤。所有的角色分配与任务拆解,无需预设,全由 K2.5 现场决策。
我们来看一个例子。给 Kimi Agent集群投喂 40 篇关于心理学和 AI 的论文。Kimi 先是通过多次调用工具,按顺序把这 40 篇论文通读一遍,以此确保上下文里完整保留了所有必要信息。紧接着,它衍生出几个子agent,本质上是 Kimi 的「分身」,分别负责不同章节撰写。最后,主 agent 负责把关验收,将所有内容汇总生成了一份长达几十页的专业 PDF 综述:
虽然 K2.5 在主流 Agent 评测中已达先进水平,但我们更看重它为用户节省的每一分钟。在大规模搜索(wide search)场景下,与单 Agent 执行相比,Agent 集群将达成目标性能所需的最少关键步骤减少了 3 到 4.5 倍,且随着目标要求的提升,节省幅度进一步扩大;通过并行化,实际运行时间(wall clock)最高可缩短 4.5 倍:
此外,Agent 集群的规模化训练极具挑战。为此,我们重构了强化学习基建,并专门优化了训练算法,以确保能达到极致的效率和性能。目前,这一实验性功能已开启 Beta 测试,并将于近期逐步开放。我们期待 Kimi K2.5 的协作能力,能帮你攻克更多难题。
Kimi Code
正式发布
Kimi K2 系列模型发布以来,因为在软件工程领域的出色表现,受到国内外开发者的喜爱。从 Kimi 开放平台的后台数据看,大量开发者将 Kimi K2 系列模型与 Claude Code、Cline、Roo Code、Kilo Code 等 Coding Agent 产品搭配使用。同时 Coding Agent 产品,也越来越展现出更加通用的能力,使用人群正在向非技术人员扩散,未来有巨大的想象空间。
今天,我们正式介绍来自 Kimi 的编程工具:Kimi Code。它不仅能在终端里直接运行,还能无缝集成到 VSCode、Cursor、JetBrains 和 Zed 等主流编辑器中。Kimi Code 可充分发挥 K2.5 的多模态优势,支持直接输入图片和视频进行编程辅助,并能自动发现并将你现有的技能迁移到新的工作流中。
Kimi Code Bench 是我们内部的代码能力评测基准,涵盖从构建、调试、重构、测试到脚本编写等多种端到端任务,支持多种编程语言。在我们的评估中,搭载了 K2.5 的 Kimi Code,相比之前的 Kimi 模型有了大幅度的提升。
欢迎将 Kimi K2.5 模型 API 搭配 Kimi Code 使用,或通过 Kimi 会员的包月计划(kimi.com/code)使用。
此外,Kimi Code 背后的 Agent SDK 也将开源发布,帮助大家自定义自己的 Agent 体验。我们在 Github 提供了更多信息,详情可至 https://github.com/MoonshotAI/kimi-agent-sdk/tree/main/examples 了解。
开始使用
Kimi K2.5
从今天起,大家就可以在 Kimi.com 或者 Kimi App 上使用 K2.5 模型。作为 Kimi 最全能的模型,K2.5 提供了四种模式:
  • 快速模式:提供最快的响应体验;

  • 思考模式:可以用来解答复杂问题;

  • Agent 模式:擅长深度研究、PPT、Excel、Word、PDF和网页生成等任务;

  • Agent集群模式:适合需要并行处理的复杂任务。

对于编程用户,我们推荐你把 K2.5 和 Kimi Code 搭配使用。
企业和开发者则可以通过 Kimi 开放平台调用 K2.5 模型的 API。我们在提供 Turbo 级别速度的同时,大幅降低了 API 的价格。
即日起 Kimi 开放平台开始为期 7 天的充值赠送活动,详情可到这里了解
期待听到你的反馈,我们会加速迭代。


最近更新

90%腾讯工程师在用的CodeBuddy编程助手,现已内置Kimi K2 Thinking模型

7万金融投研人在用的AlphaEngine,Agent模型升级Kimi K2 Thinking

2025 我们这样用 Kimi Agent 新技能,你也可以

全球估值最高AI搜索应用Perplexity上线 Kimi K2 Thinking模型

Kimi K2 Thinking 模型发布并开源,全面提升 Agent 和推理能力

请查收你的1024节日礼物:Kimi For Coding包月套餐

都是Kimi K2,表现却不同?我们测了多家服务商ToolCall性能,并开源了测试集

「OK Computer」,Kimi Agent 模式开启内测

2026 校招启动|Kimi 邀你一同探索月之暗面

模型即 Agent,Kimi-Researcher(深度研究)开启内测

Kimi 与财新传媒达成合作,为你提供更专业、可信的财经内容

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询