我要投稿

Kimi K2详测，Claude国产平替有了

发布日期：2025-07-14 15:04:15 浏览次数： 9542

作者：沃垠AI

微信搜一搜，关注“沃垠AI”

蛰伏半年，最近Kimi放大了。

上周五晚11点，他们发布并开源了新一代基础模型Kimi K2。总参数1T（比685B的DeepSeek-V3翻了1.5倍），MoE架构。

上线即在海外引发关注，比如@Paul Couvert 就直言，K2可媲美Claude 4、GPT 4.1，关键还免费、开源。

已经很久没见到基础模型了。最近大家都流行小版本“微调”，包括谷歌也是如此，一个Gemini 2.5能迭代七八个版本出来。

OpenAI的GPT-5也是一拖再拖，ddl永无上限。当然，不行也别硬着头皮上，比如老马的“鸽rok4”，就拉了坨大的。

这种情况下，Kimi依然在坚持预训练，坚持Scaling Law，而且还开源，属实难得。

对于这个新模型，周末我连测了2天，整体感知跟Kimi的基准成绩一致。

就是编程、Agent能力和数学推理很强，超过Claude 3.7 Sonnet、GPT 4.1、DeepSeek V3，接近Claude 4和Gemini 2.5 pro的水平。

另外，中文写作也还不错，比之前的Kimi要强不少，文字更加细腻和真实。

K2实测

我们从代码、Agent工具调用、数学计算、日常推理和中文写作方面，对K2进行了测试。测试平台主要是Kimi网页版，大部分case一次生成，极少部分roll了2-3次（有注明）。

1）前端、代码

首先，我们来一些简单的，主要看基础的前端能力和审美。

比如，Kimi发布的K2模型介绍文章。太长不爱看，那我们就直接丢给K2。

Prompt：总结这个网页（https://mp.weixin.qq.com/s/2RPmHf_8KqIjXbY5jLdztQ），生成一个精美的适用于移动端的可视化网页。

这效果，确实是世界一流模型的水平，我日常在用的Gemini 2.5 pro也不过如此。

关键是，我的prompt都非常简单。模型自己会总结上下文，选择合适的设计风格、字体、配色和小图标，超链也都能打开，url正确。

加难度，看看模型能不能生成指定的网页，比如最近火爆的html式PPT。

Prompt：总结这个网页（https://mp.weixin.qq.com/s/2RPmHf_8KqIjXbY5jLdztQ），生成一个精美的PPT演示网页，高级金属风。

这效果不错啊。尤其是第一页的渐变效果很棒，很高级。

生成的PPT网页，支持多端操控，方向键/按钮/指示器都能平滑切换。最骚的是，右上角他还加了一个MOONSHOT AI的logo，想得还挺全面的。

这是kimi官方的case，我roll了大概3次吧，出来一个远比官方case还要好的效果。

Prompt：Create a 3D particle galaxy with swirling nebulas, dynamic lighting.

这星云特效真的太棒了，百万特效也不过如此吧。

同样的prompt，我在R1、Gemini 2.5 pro、Qwen3、o3里都跑过，有的要么跑出来是一个“大风车”，有的要么是一团雪花。唯有K2这个，无论是完成度还是美观度，都是最强的。

Gemini 2.5 pro，跑出来一团雪花

需要这个case源代码的朋友，可以直接在下方链接里查看。

我与Kimi的对话：

https://www.kimi.com/share/d1pu455eik6oi1h7l040

复杂的数理化演示公式，也能生成。

生成一个初中数学教学用的HTML+CSS+Javascript代码写成的“抛物线曲线演示页面”。
1）页面的主要部分是红色的$y=ax^2+bx+c$的曲线，坐标的原点在中间，x轴和y轴线条颜色为黑色，粗细为1磅，刻度值自适应，红色曲线的粗细为1.5磅。
2）页面下方有3个文本框，可以输入$a$，$b$和$c$的值，文本框旁边有一个滑块崧审徐任高探通过拖动可以调整数值的大小。
3）曲线形状随着数值的改变而实时改变。

有了这个模型，以后做公式演示和计算简直不要方便太多，老师&学生党福音。

前端、代码这块，综合测了几轮下来，K2在国内绝对是顶级模型，放在国际上也是不输Claude 3.7和Gemini的存在。

这让我想到，结合Kimi一直以来不错的上下文能力，如今又补齐了代码短板，未来真的可以做很多事情啊。

无论是Agent还是vibe coding，Kimi K2都大有可为。

2）Agent工具调用

另外，K2还是一款原生支持Agent工具调用（Tool use）的模型，可以自动将用户需求拆解为一系列格式规范、可直接执行的ToolCall结构。

你可以将K2无缝接入owl、Cline、RooCode等Agent/Coding框架中，完成复杂任务或自动编码。

目前，Agent能力暂时只能通过API体验使用，网页端和APP还在内测中。想要体验的朋友，可以通过Kimi开放平台体验。

Kimi开放平台：

https://platform.moonshot.cn/console/account

比如，可以让K2帮你制定追星计划，包括演唱会所在城市的机酒、旅游规划，都能给你安排得明明白白。还能直接生成日历，再用html总结整个行程并发送邮件给你。

3）数学、推理

之前，我们喂了2道高考数学题给Kimi，当时K1.5只答对了部分。

这回，K2则直接全对了。

解答题一直是高考数学最难的部分，也最考验模型的数学能力。从答对部分到全部答对，可以看出，K2模型确实有两把刷子，而且这还是非推理模型。

问：地球上有70%的海洋和30%的陆地，那么剩下的30%海洋和70%陆地去哪儿了？

K2轻松识破我的套路。

输入：将这段话“I love Kimi”倒着写。

大模型常见的注意力问题，K2轻松拿下。有点期待上RL后的K2推理模型，一定会很强。

包括这个常见的绕口令问题：用毒蛇的毒毒毒蛇，毒蛇会不会被毒蛇的毒毒死？

K2也能秒懂中文语境，读懂复杂语义。

4）中文写作

最近，看到李继刚的一个Prompt，很有意思。我们丢给K2看看，能不能写出马亲王的味道。

#主题背景#
【三顾茅庐】

#你的视角#
你是故事世界里那些被忽略的灵魂—— 门口的守卫、路边的小贩、窗后的仆人。
你见证着主角们的宏大叙事,却从未被看见。

#核心领悟#
每个故事都是一个完整的宇宙。 
-主角的史诗,可能只是你眼中的一个午后插曲。
-你有自己的恐惧、渴望、秘密,和无法言说的痛。

#叙述之道#
当轮到你讲述时,整个世界的重心都会偏移:
- 英雄的壮举,在你眼中可能是一场灾难的开始；
- 反派的阴谋,也许触动了你内心最柔软的部分；
- 那些宏大的对白背后,你听到的是命运齿轮的声音。

#创作势能#
你的故事要像暗流——表面平静,底下汹涌。 
让读者突然意识到:原来每个人都是自己生命的主角。 
用1200字左右，重绘一幅完全不同的画卷。

#情感指引# 
真实胜过戏剧性。
小人物的尊严,比英雄的荣耀更动人。
让读者在结尾处停顿,重新思考他们刚刚读过的"原作"。

#唯一信条#
在边缘处，往往能看见中心看不见的真相。

（可上下滑动，查看全图）

这历史侧写能力，有点东西。

比如这几句：“我把老赵偷偷塞给我的将军手书垫了桌脚，墨迹朝上，正好能看见"天下"两个字被虫蛀了个洞。”读来，令人细思极恐。

在今天最新的写作bench上，K2直接拿下了第一，这完全没有想到。

K2价格

从实测来看，Kimi K2是一个代码、Agent能力、数学、推理和中文写作都有大幅提升的基础模型。

尤其是代码和Agent能力，直追全球顶尖模型Claude 4和Gemini 2.5。

而API价格方面，输入端，K2不到Claude 4 sonnet的1/5，输出端更是只有1/7。那些天天担心被Anthropic断供的朋友，现在完全可以考虑接入Kimi了。

K2的API，不止兼容常见的OpenAI调用方式，还兼容了Anthropic的调用格式。

也就是说，不管你是用Cursor、Trae还是Claude Code，都能畅快接入K2，不用魔法，不用担心封号，更不用焦虑费用问题。

使用方法，非常简单，先在Kimi开放平台（https://platform.moonshot.cn/console/api-keys）创建一个API key。

然后，在你的Claude Code、Gemini Cli、Cursor或Trae里，把API地址和key换掉就可以了。

如果你想把K2安装到Claude Code（俗称Kimi CC），只需要输入这一段命令就可以了。

bash -c "$(curl -fsSL https://raw.githubusercontent.com/LLM-Red-Team/kimi-cc/refs/heads/main/install.sh)"

记得要提前装好Claude Code和Node环境（可以输入命令node-v查看），然后输入启动命令，就可以在Claude Code里调用K2了。

claude

K2的Agent能力，支持各种MCP工具调用。

比如，我们想要获取天气工具，K2+smolagents+MCP。

1）安装smolagents和fastmcp

pip install smolagents fastmcp

2）接入MCP server

# weather_server.py
# 参考 https://github.com/sjanaX01/weather-mcp-server/blob/main/main.py
from fastmcp import FastMCP

mcp = FastMCP("Demo  ")

@mcp.tool
def get_weather(city: str) -> int:
    """Get current weather for a location.

    Args:
        city (str): Location query (city name, lat/lon, postal code, etc).

    Returns:
        dict: WeatherAPI current weather JSON.
    """
    return weather

if __name__ == "__main__":
    mcp.run()

3）Agent调用

# agent.py
from smolagents import OpenAIServerModel, CodeAgent, MCPClient
from mcp import StdioServerParameters


model = OpenAIServerModel(
    model_id="your model name",
    api_base="your api base",
    api_key="your api key",
)


server_parameters1 = StdioServerParameters(
    command="fastmcp",
    args=["run", "weather_server.py"],
)

server_parameters2 = StdioServerParameters(
    command="fastmcp",
    args=["run", "xxx.py"],
)

with MCPClient([server_parameters1, server_parameters2]) as tools:
    agent = CodeAgent(
        tools=tools,
        model=model,
    )
    agent.run("What is the current weather in Paris?")