免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

实测Kimi K2.5,这是一款厌丑的开源模型

发布日期:2026-01-27 20:52:58 浏览次数: 1562
作者:空格的键盘

微信搜一搜,关注“空格的键盘”

推荐语

Kimi K2.5开源模型实测惊艳亮相,不仅功能强大还"颜值在线",成本仅为竞品的五分之一!

核心内容:
1. 可视化编程能力测试:图片/视频直接生成可交互网页
2. Agent集群创新设计:拟人化子代理提升工作效率
3. Office Agent与Kimi Code:专业办公助手与开源编程终端

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

今天,Kimi K2.5 模型 上线了,我也是第一时间放下手中其他活,给大家带来一手测试。

kimi 的产品一如既往的设计的有自己的调性,在产品命名、体验、交互都有一些小创新、惊喜点。

这次的 K2.5 可以看到许多闪光点,比如Agent 集群下的拟人的子代理(subagent)的设计,每个代理有头像、有名字、有岗位描述,光看设计就觉得很有意思。

飞书文档 - 图片

官方说的这次更新的四大亮点:

  • 可视化编程:扔张图片或视频过去,直接生成可交互网页。看到哪里不对,圈一下就能改。
  • Agent 集群 (Agent Swarm):一个任务拆成几十个 AI 分身并行执行。批量搜索、下载、长流程操作,一个人干一个项目组的活。
  • Office Agent:专家级办公助手,能看懂图表,输出的 PPT、Word、Excel 不再是"能用但丑"的水平。
  • Kimi Code:开源的 Coding Agent 终端,在本地项目里自动读写代码、跑测试,开发者可以自由魔改。
下面我就用几个实用的案例来测试一下效果如何。
01 可视化编程
图片复刻

先用一张图片测试。我把之前在 Gemini 里做的词云卡片截图发给 Kimi 2.5 Thinking,简单描述一句,就复刻出了一个一模一样的小应用。

飞书文档 - 图片

生成了页面如下,输入不同的词语,就能制作渐变色的词云卡片,能看到设计出来的卡片前端样式很精美好看。效果和 Gemni3 Pro 的一致。

飞书文档 - 图片
上传视频,复刻产品

再来一个更复杂的。朋友发给我一个在 Gemini 3 Pro 里做的创意小产品,交互流程是:输入个人信息 → 上传图片 → 选择风格 → 生成 3D 卡片。

我录制了一个 40 秒的视频发给 Kimi。它把视频截取成几张图片,得益于 K2.5 的视觉理解能力,对产品的分析相当准确,设计和开发效率都有明显提升

飞书文档 - 图片

对比效果如下:左边是原产品,右边是 Kimi 复刻。

客观评价下,整个复刻质量不输配置了 Claude 4.5 的 v0、Replit,就是少了生图的 API。

不过这个结果可以帮我完成产品的前端设计稿,后续再导出到 Cursor 做更复杂的后端和 API 开发。

手势控制应用

再来一个前段时间在小红书爆火的手势控制应用。

我做了一个"奇异博士火焰圈":张手火焰变大,移动手掌火焰跟随,握拳火焰变小。

可以看下面的效果,小红书上这类应用的案列都可以用 kimi2.5 实现了,成本低体验好。

Kimi 2.5 的前端代码能力相比上代有了极大提升,理解强了,审美更好了,

测试下来,可以说基本追平 Gemini 3 Pro。

更关键的是价格,Kimi 2.5 输入 4 元、输出 21 元/百万 tokens比海外模型便宜 5 倍不止。

以前你用 Gemini 3 Pro 做的应用,现在 Kimi 2.5 基本都能实现,而成本只要五分之一。

飞书文档 - 图片
02 Agent 集群

这是这次更新的最大亮点。简单说就是把多个 Agent 集合在了一起。先说一个核心区别:

单 Agent 像执行力超强的助手,你说"帮我做个 PPT",它就做个 PPT。一个任务,一条线,干净利落。
Agent 集群 更像一个项目组,你说"帮我研究竞品",它会自动拆成几个子任务:一个扒官网,一个翻融资新闻,一个看用户评论,最后汇总报告。

简单说:单 Agent 适合"我知道要什么",Agent 集群适合"我想搞明白一件事"。

新能源汽车行业报告

我做个一个复杂的长任务,输入

调研中国新能源车企前20名,列出市值、202销量、主力车型、近期新闻,输出对比表格,最后制作成可视化的网页
飞书文档 - 图片

可以根据任务分配制作近百个 Subagent(子代理)并行执行任务。它创建了四个 Agent:财务、市场、新闻、产品分析师,并行任务,互通信息,最后整合出下面这份报告,我截了几张报告的图:

飞书文档 - 图片
飞书文档 - 图片

上面报告中所有的汽车的配图是 Agent 搜索网络实现的,完全超出我的预期。

我还发现,在预览网页的窗口,有个功能是指定区域修改,

点击编辑按钮,进入编辑模式,输入要修改的元素,可视化修改内容,以前需要写一大串页面位置区域的描述,在这里都不需要了。

飞书文档 - 图片
飞书文档 - 图片
批量生图

Kimi 的 Agent 是支持制作图片的,使用 Agent 集群能实现批量生图。

下面这个例子,我输入:

为咖啡品牌生成30张莫兰迪色系营销图,包含产品图、场景图、海报,风格统一

kimi 拆解了 30 个Subagent 来制作。最后输出了一系列咖啡品牌相关的图片。

和顶尖的生图模型出图质量有差距的,可它好在快和多,适合头脑风暴、快速出稿和方案演示。

飞书文档 - 图片
飞书文档 - 图片
论文研究

这个场景我很感兴趣——过去两年 AI Agent 领域的优秀论文搜索,想看看和我自己读到的是否有差异。

对于过去两年 AI Agent 优秀论文的搜索,我挺想看看搜的结果和我过去两年读到的优秀论文是否有差异,输入:

搜索下载"LLM Agent"相关50篇论文(2024-2025),并对每篇论文做概要简介,按研究方向、基座模型、创新点分类整理

获取到了一篇排版严谨美观的 word 文档,分析并整理了 59篇 LLM Agent相关论文(2024-2025年)。

飞书文档 - 图片

在上面这篇文档,我看到了很多篇我之前注意到的论文标题,对 Agent 发展感兴趣的,可以在飞书文档下读这篇报告:

https://my.feishu.cn/wiki/HTlrwFmu3i1xFgkEZX5c4QfBnR9?from=from_copylink

03 Office Agent

最近有朋友问我做 PPT 用哪个产品,我首推 Kimi Agent。第一效果顶尖且支持修改,第二不用担心网络问题,整体体验流畅。

比如输入一张柱状图,要求输出 PPT 并加上文字分析:

飞书文档 - 图片
飞书文档 - 图片

客观来说,PPT、Word、Excel 的交付物都具备专业的审美和结构。

Kimi 在办公提效这块想得很细,官方首页提供了很多案例可以参考:https://www.kimi.com/

飞书文档 - 图片
04 Kimi Code

最后,再来看下 Kimi 推出的 CLI,地址https://www.kimi.com/code

这个还没来得及深度体验,但从官方介绍看,和 Claude Code 功能类似,不过会和 Kimi 官方模型结合得更紧密。

飞书文档 - 图片

过去一年,Vibe Coding 让"写代码"这件事变得异常简单。

但代码生成的门槛降下来了,"AI 味儿"成了新的瓶颈。

对模型来说,稀缺的不再是"实现功能的能力",而是"定义美感的能力"。

K2.5 让我觉得有意思的地方是它融合了视觉理解能力,像是"懂设计的程序员"。

你给它一张截图、一段视频,不需要复杂的提示词,它就能理解你的意图,产出具有设计感的产品。

以前,只有雇得起专业设计团队的公司才能拥有"产品审美"。

现在,K2.5 把这种能力 Agent 化了,哪怕你不懂设计,也能通过它模型的理解,和 Agent 拆解任务来产出像素级还原的作品。

Code is cheap, taste is luxury.

写在最后

过去两年,各个模型厂商追追赶赶,一会儿 GPT 登顶,一会儿 Gemini 又成第一。

但国产模型奋力追赶的步伐一直没停,那个差距也在逐渐缩小。

虽然海外的模型还会增强,但这个时刻我们到了一个节点,

而且我相信今年我们会看到越来越多次这样的节点:

国产模型能力追平了海外顶级模型(暂时性)。

这次 K2.5 的更新,我认为是一个真正的"可用拐点":

  • 基座模型:K2 → K2.5,视觉理解和前端审美显著提升
  • Agent 交付:PPT、Word、Excel、网页都具备专业水准
  • Agent 集群:近百个子代理并行,交付复杂研究结果,应对"一个人干不完"的场景

单点能力追平海外顶级模型,协作能力开始形成差异化优势。

以前你用 Gemini 3 Pro 做的应用,现在 Kimi 2.5 基本都能实现,成本只要五分之一。

对于用户来说,肯定是好事,有更多丰富丰体验和选择。

对于国内开发者和产品经理来说,不再需要在能力和成本之间做取舍了。

我是空格,有什么好的想法欢迎在评论区告诉我。有用的话,点赞转发支持一下

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询