我要投稿

实测Kimi K2.5，这是一款厌丑的开源模型

发布日期：2026-01-27 20:52:58 浏览次数： 6299

作者：空格的键盘

微信搜一搜，关注“空格的键盘”

今天，Kimi K2.5 模型上线了，我也是第一时间放下手中其他活，给大家带来一手测试。

kimi 的产品一如既往的设计的有自己的调性，在产品命名、体验、交互都有一些小创新、惊喜点。

这次的 K2.5 可以看到许多闪光点，比如Agent 集群下的拟人的子代理（subagent）的设计，每个代理有头像、有名字、有岗位描述，光看设计就觉得很有意思。

官方说的这次更新的四大亮点：

可视化编程：扔张图片或视频过去，直接生成可交互网页。看到哪里不对，圈一下就能改。
Agent 集群（Agent Swarm）：一个任务拆成几十个 AI 分身并行执行。批量搜索、下载、长流程操作，一个人干一个项目组的活。
Office Agent：专家级办公助手，能看懂图表，输出的 PPT、Word、Excel 不再是"能用但丑"的水平。
Kimi Code：开源的 Coding Agent 终端，在本地项目里自动读写代码、跑测试，开发者可以自由魔改。

下面我就用几个实用的案例来测试一下效果如何。

01 可视化编程

图片复刻

先用一张图片测试。我把之前在 Gemini 里做的词云卡片截图发给 Kimi 2.5 Thinking，简单描述一句，就复刻出了一个一模一样的小应用。

生成了页面如下，输入不同的词语，就能制作渐变色的词云卡片，能看到设计出来的卡片前端样式很精美好看。效果和 Gemni3 Pro 的一致。

上传视频，复刻产品

再来一个更复杂的。朋友发给我一个在 Gemini 3 Pro 里做的创意小产品，交互流程是：输入个人信息 → 上传图片 → 选择风格 → 生成 3D 卡片。

我录制了一个 40 秒的视频发给 Kimi。它把视频截取成几张图片，得益于 K2.5 的视觉理解能力，对产品的分析相当准确，设计和开发效率都有明显提升

对比效果如下：左边是原产品，右边是 Kimi 复刻。

客观评价下，整个复刻质量不输配置了 Claude 4.5 的 v0、Replit，就是少了生图的 API。

不过这个结果可以帮我完成产品的前端设计稿，后续再导出到 Cursor 做更复杂的后端和 API 开发。

手势控制应用

再来一个前段时间在小红书爆火的手势控制应用。

我做了一个"奇异博士火焰圈"：张手火焰变大，移动手掌火焰跟随，握拳火焰变小。

可以看下面的效果，小红书上这类应用的案列都可以用 kimi2.5 实现了，成本低体验好。

Kimi 2.5 的前端代码能力相比上代有了极大提升，理解强了，审美更好了，

测试下来，可以说基本追平 Gemini 3 Pro。

更关键的是价格，Kimi 2.5 输入 4 元、输出 21 元/百万 tokens，比海外模型便宜 5 倍不止。

以前你用 Gemini 3 Pro 做的应用，现在 Kimi 2.5 基本都能实现，而成本只要五分之一。

02 Agent 集群

这是这次更新的最大亮点。简单说就是把多个 Agent 集合在了一起。先说一个核心区别：

单 Agent 像执行力超强的助手，你说"帮我做个 PPT"，它就做个 PPT。一个任务，一条线，干净利落。

Agent 集群更像一个项目组，你说"帮我研究竞品"，它会自动拆成几个子任务：一个扒官网，一个翻融资新闻，一个看用户评论，最后汇总报告。

简单说：单 Agent 适合"我知道要什么"，Agent 集群适合"我想搞明白一件事"。

新能源汽车行业报告

我做个一个复杂的长任务，输入

调研中国新能源车企前20名，列出市值、202销量、主力车型、近期新闻，输出对比表格，最后制作成可视化的网页

可以根据任务分配制作近百个 Subagent（子代理）并行执行任务。它创建了四个 Agent：财务、市场、新闻、产品分析师，并行任务，互通信息，最后整合出下面这份报告，我截了几张报告的图：

上面报告中所有的汽车的配图是 Agent 搜索网络实现的，完全超出我的预期。

我还发现，在预览网页的窗口，有个功能是指定区域修改，

点击编辑按钮，进入编辑模式，输入要修改的元素，可视化修改内容，以前需要写一大串页面位置区域的描述，在这里都不需要了。

批量生图

Kimi 的 Agent 是支持制作图片的，使用 Agent 集群能实现批量生图。

下面这个例子，我输入：

为咖啡品牌生成30张莫兰迪色系营销图，包含产品图、场景图、海报，风格统一

kimi 拆解了 30 个Subagent 来制作。最后输出了一系列咖啡品牌相关的图片。

和顶尖的生图模型出图质量有差距的，可它好在快和多，适合头脑风暴、快速出稿和方案演示。

论文研究

这个场景我很感兴趣——过去两年 AI Agent 领域的优秀论文搜索，想看看和我自己读到的是否有差异。

对于过去两年 AI Agent 优秀论文的搜索，我挺想看看搜的结果和我过去两年读到的优秀论文是否有差异，输入：

搜索下载"LLM Agent"相关50篇论文(2024-2025)，并对每篇论文做概要简介,按研究方向、基座模型、创新点分类整理

获取到了一篇排版严谨美观的 word 文档，分析并整理了 59篇 LLM Agent相关论文（2024-2025年）。

在上面这篇文档，我看到了很多篇我之前注意到的论文标题，对 Agent 发展感兴趣的，可以在飞书文档下读这篇报告：

https://my.feishu.cn/wiki/HTlrwFmu3i1xFgkEZX5c4QfBnR9?from=from_copylink

03 Office Agent

最近有朋友问我做 PPT 用哪个产品，我首推 Kimi Agent。第一效果顶尖且支持修改，第二不用担心网络问题，整体体验流畅。

比如输入一张柱状图，要求输出 PPT 并加上文字分析：

客观来说，PPT、Word、Excel 的交付物都具备专业的审美和结构。

Kimi 在办公提效这块想得很细，官方首页提供了很多案例可以参考：https://www.kimi.com/

04 Kimi Code

最后，再来看下 Kimi 推出的 CLI，地址https://www.kimi.com/code

这个还没来得及深度体验，但从官方介绍看，和 Claude Code 功能类似，不过会和 Kimi 官方模型结合得更紧密。

过去一年，Vibe Coding 让"写代码"这件事变得异常简单。

但代码生成的门槛降下来了，"AI 味儿"成了新的瓶颈。

对模型来说，稀缺的不再是"实现功能的能力"，而是"定义美感的能力"。

K2.5 让我觉得有意思的地方是它融合了视觉理解能力，像是"懂设计的程序员"。

你给它一张截图、一段视频，不需要复杂的提示词，它就能理解你的意图，产出具有设计感的产品。

以前，只有雇得起专业设计团队的公司才能拥有"产品审美"。

现在，K2.5 把这种能力 Agent 化了，哪怕你不懂设计，也能通过它模型的理解，和 Agent 拆解任务来产出像素级还原的作品。

Code is cheap, taste is luxury.

写在最后

过去两年，各个模型厂商追追赶赶，一会儿 GPT 登顶，一会儿 Gemini 又成第一。

但国产模型奋力追赶的步伐一直没停，那个差距也在逐渐缩小。

虽然海外的模型还会增强，但这个时刻我们到了一个节点，

而且我相信今年我们会看到越来越多次这样的节点：

国产模型能力追平了海外顶级模型（暂时性）。

这次 K2.5 的更新，我认为是一个真正的"可用拐点"：

基座模型：K2 → K2.5，视觉理解和前端审美显著提升
Agent 交付：PPT、Word、Excel、网页都具备专业水准
Agent 集群：近百个子代理并行，交付复杂研究结果，应对"一个人干不完"的场景

单点能力追平海外顶级模型，协作能力开始形成差异化优势。

以前你用 Gemini 3 Pro 做的应用，现在 Kimi 2.5 基本都能实现，成本只要五分之一。

对于用户来说，肯定是好事，有更多丰富丰体验和选择。

对于国内开发者和产品经理来说，不再需要在能力和成本之间做取舍了。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-09

CPU 跑得比 Whisper GPU还快的开源语音识别，本地部署

2026-06-09

别再问我什么是爱马仕！

2026-06-09

Open Design：开源界的 Claude Design 替代品，61.7K Star，21+ Agent 都能跑，本地第一

2026-06-08

我开源了 PPT-Library：让历史 PPT 变成 AI 可复用资产

2026-06-08

knowledge-work-plugins：Anthropic 官方开源的知识工作插件集，19,000+Star

2026-06-08

从搜索、点击、表单填写到复杂网页操作，让 AI 像人一样使用浏览器

2026-06-08

比Codex快4倍！终于有开源模型卷本地Agent执行效率了～

2026-06-08

Anthropic 开源 Agent Skills 参考库，大模型定制化时代开启

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Hermes Agent 出来了，聊聊它凭什么跟 OpenClaw 掰手腕

2026-03-30

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

Google Gemma 4 开源｜全面解读

2026-04-03

字节跳动开源 DeerFlow 2.0：下一代超级 Agent 引擎，一键搞定复杂工作流！

2026-03-23

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

刚刚，Claude Code开源了！51万行代码，全网狂欢

2026-03-31

龙虾绝配：Qwen 3.5 27B！跑在家里，成本为 0

2026-03-30

Ollama 本地部署 Gemma 4 完全指南

2026-04-18

Google Gemini CLI 完整使用指南

2026-04-18

ollama v0.18.2 发布！OpenClaw 安装优化、Claude 加速、MLX 量化全面升级

2026-03-20

大家都在问

企业级 AI Agent 为什么集体转向“基座 + Skills”？

2026-05-30

Hermes Agent 深度解析：为什么它能“越用越懂你”？

2026-05-16

百度把Nano Banana塞进4090，疯了？

2026-04-22

Kimi K2.6 开源了！还附送了 300 个 Agent 员工？

2026-04-21

Hermes 凭什么两个月接棒 OpenClaw？

2026-04-15

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

英伟达的NemoClaw，能帮AI代理这匹“野马”套上缰绳吗？

2026-03-17

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw