微信扫码
添加专属顾问
我要投稿
Kimi K2.5开源模型实测惊艳亮相,不仅功能强大还"颜值在线",成本仅为竞品的五分之一!核心内容: 1. 可视化编程能力测试:图片/视频直接生成可交互网页 2. Agent集群创新设计:拟人化子代理提升工作效率 3. Office Agent与Kimi Code:专业办公助手与开源编程终端
今天,Kimi K2.5 模型 上线了,我也是第一时间放下手中其他活,给大家带来一手测试。
kimi 的产品一如既往的设计的有自己的调性,在产品命名、体验、交互都有一些小创新、惊喜点。
这次的 K2.5 可以看到许多闪光点,比如Agent 集群下的拟人的子代理(subagent)的设计,每个代理有头像、有名字、有岗位描述,光看设计就觉得很有意思。
官方说的这次更新的四大亮点:
先用一张图片测试。我把之前在 Gemini 里做的词云卡片截图发给 Kimi 2.5 Thinking,简单描述一句,就复刻出了一个一模一样的小应用。
生成了页面如下,输入不同的词语,就能制作渐变色的词云卡片,能看到设计出来的卡片前端样式很精美好看。效果和 Gemni3 Pro 的一致。
再来一个更复杂的。朋友发给我一个在 Gemini 3 Pro 里做的创意小产品,交互流程是:输入个人信息 → 上传图片 → 选择风格 → 生成 3D 卡片。
我录制了一个 40 秒的视频发给 Kimi。它把视频截取成几张图片,得益于 K2.5 的视觉理解能力,对产品的分析相当准确,设计和开发效率都有明显提升
对比效果如下:左边是原产品,右边是 Kimi 复刻。
客观评价下,整个复刻质量不输配置了 Claude 4.5 的 v0、Replit,就是少了生图的 API。
不过这个结果可以帮我完成产品的前端设计稿,后续再导出到 Cursor 做更复杂的后端和 API 开发。
再来一个前段时间在小红书爆火的手势控制应用。
我做了一个"奇异博士火焰圈":张手火焰变大,移动手掌火焰跟随,握拳火焰变小。
可以看下面的效果,小红书上这类应用的案列都可以用 kimi2.5 实现了,成本低体验好。
Kimi 2.5 的前端代码能力相比上代有了极大提升,理解强了,审美更好了,
测试下来,可以说基本追平 Gemini 3 Pro。
更关键的是价格,Kimi 2.5 输入 4 元、输出 21 元/百万 tokens,比海外模型便宜 5 倍不止。
以前你用 Gemini 3 Pro 做的应用,现在 Kimi 2.5 基本都能实现,而成本只要五分之一。
这是这次更新的最大亮点。简单说就是把多个 Agent 集合在了一起。先说一个核心区别:
简单说:单 Agent 适合"我知道要什么",Agent 集群适合"我想搞明白一件事"。
我做个一个复杂的长任务,输入
可以根据任务分配制作近百个 Subagent(子代理)并行执行任务。它创建了四个 Agent:财务、市场、新闻、产品分析师,并行任务,互通信息,最后整合出下面这份报告,我截了几张报告的图:
上面报告中所有的汽车的配图是 Agent 搜索网络实现的,完全超出我的预期。
我还发现,在预览网页的窗口,有个功能是指定区域修改,
点击编辑按钮,进入编辑模式,输入要修改的元素,可视化修改内容,以前需要写一大串页面位置区域的描述,在这里都不需要了。
Kimi 的 Agent 是支持制作图片的,使用 Agent 集群能实现批量生图。
下面这个例子,我输入:
kimi 拆解了 30 个Subagent 来制作。最后输出了一系列咖啡品牌相关的图片。
和顶尖的生图模型出图质量有差距的,可它好在快和多,适合头脑风暴、快速出稿和方案演示。
这个场景我很感兴趣——过去两年 AI Agent 领域的优秀论文搜索,想看看和我自己读到的是否有差异。
对于过去两年 AI Agent 优秀论文的搜索,我挺想看看搜的结果和我过去两年读到的优秀论文是否有差异,输入:
获取到了一篇排版严谨美观的 word 文档,分析并整理了 59篇 LLM Agent相关论文(2024-2025年)。
在上面这篇文档,我看到了很多篇我之前注意到的论文标题,对 Agent 发展感兴趣的,可以在飞书文档下读这篇报告:
https://my.feishu.cn/wiki/HTlrwFmu3i1xFgkEZX5c4QfBnR9?from=from_copylink
最近有朋友问我做 PPT 用哪个产品,我首推 Kimi Agent。第一效果顶尖且支持修改,第二不用担心网络问题,整体体验流畅。
比如输入一张柱状图,要求输出 PPT 并加上文字分析:
客观来说,PPT、Word、Excel 的交付物都具备专业的审美和结构。
Kimi 在办公提效这块想得很细,官方首页提供了很多案例可以参考:https://www.kimi.com/
最后,再来看下 Kimi 推出的 CLI,地址https://www.kimi.com/code
这个还没来得及深度体验,但从官方介绍看,和 Claude Code 功能类似,不过会和 Kimi 官方模型结合得更紧密。
过去一年,Vibe Coding 让"写代码"这件事变得异常简单。
但代码生成的门槛降下来了,"AI 味儿"成了新的瓶颈。
对模型来说,稀缺的不再是"实现功能的能力",而是"定义美感的能力"。
K2.5 让我觉得有意思的地方是它融合了视觉理解能力,像是"懂设计的程序员"。
你给它一张截图、一段视频,不需要复杂的提示词,它就能理解你的意图,产出具有设计感的产品。
以前,只有雇得起专业设计团队的公司才能拥有"产品审美"。
现在,K2.5 把这种能力 Agent 化了,哪怕你不懂设计,也能通过它模型的理解,和 Agent 拆解任务来产出像素级还原的作品。
Code is cheap, taste is luxury.
过去两年,各个模型厂商追追赶赶,一会儿 GPT 登顶,一会儿 Gemini 又成第一。
但国产模型奋力追赶的步伐一直没停,那个差距也在逐渐缩小。
虽然海外的模型还会增强,但这个时刻我们到了一个节点,
而且我相信今年我们会看到越来越多次这样的节点:
国产模型能力追平了海外顶级模型(暂时性)。
这次 K2.5 的更新,我认为是一个真正的"可用拐点":
单点能力追平海外顶级模型,协作能力开始形成差异化优势。
以前你用 Gemini 3 Pro 做的应用,现在 Kimi 2.5 基本都能实现,成本只要五分之一。
对于用户来说,肯定是好事,有更多丰富丰体验和选择。
对于国内开发者和产品经理来说,不再需要在能力和成本之间做取舍了。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-01-27
Office 是 2026 Agent 的主战场|Kimi K2.5 开源,Agent 先下一城
2026-01-27
Kimi 发布并开源 K2.5 模型,带来全新视觉理解、代码和 Agent 集群能力
2026-01-26
Clawdbot 的真正创新是网关:一篇了解架构、权限和风险
2026-01-26
MiniMax M2.1 × Clawdbot :打造开源 AI 助手,构建超级智能体工作流
2026-01-26
还得是腾讯,Claude Code迎来最强中国对手!企业Agent有救了~
2026-01-26
终于来了!首款可视化 Skills 神器开源,Claude/Cursor/Codex 一键同步!
2026-01-26
Clawdbot爆火:Karpathy点赞的开源AI助理,到底是什么?
2026-01-25
GLM-4.7-Flash无审查版发布:30B MoE模型,仅3B激活参数
2025-11-19
2025-12-22
2025-11-17
2025-12-10
2025-11-07
2025-12-23
2026-01-06
2025-11-06
2026-01-12
2025-11-03
2026-01-26
2026-01-21
2026-01-21
2026-01-20
2026-01-16
2026-01-02
2025-12-24
2025-12-22