免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

Office 是 2026 Agent 的主战场|Kimi K2.5 开源,Agent 先下一城

发布日期:2026-01-27 17:14:49 浏览次数: 1535
作者:十字路口Crossing

微信搜一搜,关注“十字路口Crossing”

推荐语

Kimi K2.5开源,AI Agent在Office场景实现重大突破,职场效率革命即将到来!

核心内容:
1. Kimi K2.5模型的多模态能力升级:文本/图片/视频处理与决策一体化
2. Office场景深度整合:Excel多表联动、PPT结构理解等职场刚需功能
3. 1500+步复杂任务处理能力:在Agent集群Benchmark中超越Gemini 3.0

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


loading

1 月 10 日,清华园里一场对谈突然被放大。


唐杰、杨强、杨植麟、姚顺雨同台交流,甚至被不少观众称为中国 AI 领域的「基模四杰」。原定是圆桌讨论,结果在 AGI-Next 会上,聊成了 70 多分钟的持续追问。会上的结论也很清楚:只做 ChatBot、靠 Benchmark 拉开差距的路,已经很窄了,快走不通了。


问题就变得很直接,那下一步该往哪走?


答案是:

行动(Action)。


Kimi 的杨植麟反复说了一件事:AI 不能长期停在对话框里,只输出文字。真正有价值的,是能调用工具、跑完整流程,把一件复杂任务从头做到尾。


在这个判断下,再看 Kimi 最近的变化,就很有指向性了。


4 个月前,我们在《Agent「OK Computer」今日发布" data-itemshowtype="0" linktype="text" data-linktype="2">Kimi 的“OK”,O 不 OK?|月之暗面 Agent「OK Computer」今日发布》中,实测了 Kimi 推出的 Agent:OK Computer


接下来的 4 个月里,这个 Agent 持续进化和升级,今天, Kimi 正式发布并开源了 Kimi K2.5 模型,能处理文本、图片 / 截图、录屏 / 视频,视觉理解、推理、写代码和决策是一起发生的。


代码能力的重点,也从「模型会不会写」,转向了 Agent 会不会做真实场景下的任务。通过内部的 Agent 集群,K2.5 可以处理 1500+ 步的复杂任务,在多个 Agent 场景的 Benchmark 上,已经跑赢了 Gemini 3.0 Flash / Pro



Kimi Agent 功能则融入了该模型的这些能力,扩展了职场人群迫切需要的 Office 功能。


升级后的 Kimi Agent, 开始系统理解 Office 的运作方式:表格里的单元格关系、PPT 的结构层级、PDF 的排版逻辑,通过在 Web 端直接产出文件,进入 Office 这个仍是大多数人工作的底层场景里,

🚥

接下来分享,我们对 Kimi Agent在 Office 场景下能力的实测。

1)多表联动的 Excel 能力

我这段时间自己用下来,一个很直观的感受是:Kimi 的 Agent 已经能把 Excel 玩得挺深了。


不只是简单填表。它在做复杂表格的时候,会尽量把数字格式、文字格式都保留对,而且还能主动用函数,把同一个文件里的多张表连起来用。


我试过一个比较重的场景:让它给一家 B2B 的 AI 公司,直接搭一个三年期的动态财务预测模型,最后输出成一个 Excel 文件。


这个 Excel 里是多张表一起用的,比如收入、成本、现金流、假设条件分开做,但彼此是联动的。改一处假设,其他表的数据也会跟着变。


下面是我当时用的提示词:




**Role Setting (角色设定):**你是一名专注于 TMT 行业(科技、媒体、通信)的顶级风险投资分析师,深谙 SaaS 估值体系与 AI 企业的成本结构(Token Economics)。**Mission (任务):**请为一家名为 "GenWriter AI" 的 B2B 生成式 AI 公司构建一个 **3年期动态财务预测模型**。 输出格式为 **Excel****Logic Constraints (逻辑约束):*** 模型必须反映“规模效应”:假设随着用户量增加,通过微调(Fine-tuning)自研模型,单位 Token 成本在 2027 年开始显著下降。**Output (输出文件):**[GenWriter_AI_Financial_Model_v1.xlsx]


其实也不用等很久,Kimi Agent 很快就把核心结构搭出来了,一共 5 个 sheet。


假设条件那一页把客户增长、Token 使用、运营成本都单独列出来,而且所有能手动改的输入项都会用黄色标好。


损益表是按 36 个月拉开的,第三方 API 费用和云算力成本分得很清楚。


loading


因为这些表之间是联动的,如果分散在好几个工作表里,其实来回切着看还是有点费劲,不够直观。于是我又让 Kimi Agent 直接帮我把这 5 张表的核心内容汇总到一张表里


它理解得也很快,把关键指标抽出来放在一起,这样一打开就能看到整体情况,改动某个输入项,汇总页里的结果也会跟着一起变:


loading


然后在这张汇总表里,有一个变量特别关键,就是 AI 成本的驱动项。对这种 AI 公司来说,成本变化往往是从 Token 成本开始的,一旦这个数变了,后面会带出一整串反应。


我当时就直接动了一下 Token 成本的年下降幅度,整张表里的财务预测都跟着一起变了,整个模型是连着在跑的:


loading


2)排版和精准修改、添加能力

我后来发现 Kimi Agent 在处理 PDF,尤其是长文本 PDF 的排版上,表现也挺稳的


去年年底,上海浦东美术馆办过一场关注度很高的展,主题是卢浮宫里印度、伊朗和奥斯曼相关的艺术杰作。


我就顺手试了一下,让 Kimi Agent 直接帮我做一份上海浦东美术馆的策展导览 PDF,看它能不能把内容和结构一起处理好。


提示词如下:




**Role Setting (角色设定):**你现在是一名深谙伊斯兰艺术史、精通符号学的卢浮宫高级策展人,同时也是一位极具审美水准的资深艺术出版编辑。你刚刚在上海浦东美术馆(MAP)完成了《图案的奇迹》大展的布展工作。**Mission (任务):**你的任务是为这次展览制作一份 **深度导览 PDF (Exhibition Guidebook)**。 核心目标是:**“教会观众阅读图案”**。你要打破“装饰即肤浅”的偏见,通过图像和文字,让观众理解图案是如何作为一种通用的外交语言、权力的象征以及精神的寄托,流转于印度、伊朗和奥斯曼三大帝国之间。**Output Requirement (输出强制要求):**直接以生成 **PDF** 文件的逻辑来组织内容(请在最后提供下载链接或生成文件)。


我随便截了几张图出来,一张是首页封面,后面也截了一些正文页。整体看下来,这份 PDF 的完成度其实挺高的。


你能看到它在同一个文件里用了多种排版方式,标题、正文、不同层级的文字区分得很清楚,英文部分会用斜体或加粗来区分,引文也有单独的格式,还会用黑色底框、边框这些元素来做强调


loading
loading
loading


我后来又仔细翻了一下这份 PDF,它在正文里用了不少表格,而且是那种标准的三线表,用来整理展览信息的时候还挺合适的,不会显得乱。


另外在引用块那一部分,排版也做得比较到位,层级清楚,和正文区分得很明显:


loading
loading


当然,这一版里它其实没有放图片,因为我一开始也没让它加。


后来我就特意加了一个要求,让它在不改动原有结构的前提下,往原 PDF 里插入图片,看看它对现有文件的修改能力怎么样。


结果还挺稳的。


图片加进去了,但原来的文字、表格和引用格式基本都没被破坏,整体排版几乎没有出现明显错乱:


loading
loading
loading

3)超长文本能力

最后再说一个点,是我在实际用的过程中慢慢感受到的。


现在的 Kimi Agent 对超长文本的适应能力已经挺强了,不管是上万字的 Word 文档,还是同样体量的 PDF,它都能比较稳定地处理。


我当时先让它帮我做了一份关于全球具身智能 AI 的白皮书,用的是 Word 文档格式,主要就是想看看在篇幅拉得很长、结构很复杂的情况下,它还能不能把格式和内容一起弄完。


提示词如下:




**Role Setting (角色设定):**你是一名科技行业的资深咨询顾问,擅长撰写深度行业洞察报告(Whitepaper),风格对标麦肯锡(McKinsey)或 Gartner。**Mission (任务):**撰写一份题为 **《2026 全球具身智能产业发展白皮书》** 的深度报告。 输出格式为 **Word****Output (输出文件):**[Embodied_AI_Whitepaper_2026.docx]


接着用下来一个很直观的感受是,Kimi Agent 的工作速度确实很快。哪怕是在 Word 这种对格式要求比较细的文档里,它给出的排版也依然还可以,标题层级、正文间距、引用和列表都处理得比较干净。


你也能看到,在左下角,它很快就生成了一整份完整的文档,差不多 42 页、两万字左右:


loading


而且这份文档里的内容结构感很强,所有标题都已经和目录连好了,你可以直接在目录里点某一节,就跳到对应的位置,用起来很顺。


loading


甚至连页眉和页脚这种细节,它也一起处理好了,标注很清楚,页码、章节信息都对得上:


loading


而且我还发现一个挺实用的变化,现在的 Kimi Agent 已经可以直接在 Word 文档里做修改和批注了,这点在实际干活的时候真的加分。


比如我让它不要重写全文,而是在原来的 Word 里,找合适的位置,用一个行业专家的口吻去插入详细的修改意见:


loading


这时候它就会直接在原来的 Word 文档里,在对应的位置插入详细的修改批注:


loading


甚至如果文档里有一些数据表格,你也可以让它单独把表格做成图片,再插到合适的位置。整个过程是在原文件里完成的,不需要你来回导出重排。


loading


当然,它也可以把同样的内容直接做成一整套 PPT。我当时还特意指定了一种我自己比较喜欢的咨询风格,就是偏贝恩咨询那一套。


下面我截了不少 PPT 的页面,你能看到整体的可视化做得比较统一,颜色搭配也还可以。


这是我下载到本地之后的 PPT 文件,基本没有出现明显的排版错位问题:


loading
loading
loading
loading
loading
loading
loading


当然,上面那些还只是万字量级。


最近,我在看莫言的一部小说,就把那份小说的 PDF 直接传给它。这个 PDF 章节很多,我的要求也很直接:整本书全部转成 Word,前两个小节先翻译成英文,后面的内容保留中文,方便我之后再核对。


提示词如下:




把莫言的《丰乳肥臀》小说的前 2 个小节,先翻译成英文,后面保留中文,我还需要再对一遍


结果你会发现,它在处理这种超长文本的时候依然很稳。


PDF 一开始的封面就已经做了基本的排版,章节也被清楚地拆开,用标题结构整理好。左下角能看到,PDF 转成 Word 之后,整份文件大概有 1500 页,差不多 16 万字


loading


我后来又仔细翻了一下,整本内容基本都被完整保留下来了,尤其是小说里人物说话的格式,它都会按原来的样子处理,该换行的换行,该留空行的地方也都会留着:



再往下看,我发现它是真的把前两个章节完整翻完了,直接就是五万字左右的英文内容,这个工作量本身就已经很大了,而且还是在保持原有结构的情况下完成的


loading


基于它在长文本上的这种能力,我后来又想到一个挺实用的用法。


比如我让它直接当一次「剧本杀编剧」,一次性给我做一整套内容,包括一份 DM 手册,加上六个人物的独立剧本。每一份剧本我都要求用比较成熟的排版来做,是要有图片、有清楚的结构划分。


提示词如下:




**Role Setting (角色设定):**你是一名金牌剧本杀(LARP)编剧,擅长“本格推理”和“硬核还原”风格。你的逻辑极其严密,擅长埋藏伏笔。**Mission (任务):**请创作一个名为《暴风雪中的山庄》的 6 人封闭式剧本杀游戏剧本。**核心诡计**:利用“时间差”和“房间结构”制造的不在场证明。**Output Requirements (输出强制要求):**你需要生成一个 **PDF 合集**,包含以下独立部分(请用分页符隔开):1.**【DM 手册(主持人版)】**    * 上帝视角的案件真相全解(凶手是谁、手法、时间线)。    * 游戏流程控制表(第一幕搜证、第二幕公聊、结局复盘)。2.**【6 份独立的人物剧本】**    ***角色 A(凶手)**:剧本中必须包含对其行凶过程的隐晦描述(不能直接写“我杀了人”,要写“我举起了花瓶...”),以及如何撒谎的策略。    ***角色 B-F(嫌疑人)**:每个人都有自己的秘密任务(支线),和特定的视角盲区。    ***关键要求**:所有角色的时间线(Timeline)在逻辑上必须是互斥且能拼凑出真相的。例如:A 在 20:00 离开房间,B 必须在 20:05 看到走廊有人影。**Style:*** 文风要悬疑、有代入感。* 每个角色的剧本封面要设计不同的“人物小传”和“初始属性”。**Output:**[Script_Blizzard_Mountain_Full_Kit.pdf]


你会发现,Kimi Agent 后面其实是按它自己先设定好的六个角色来走的,每个角色都会单独生成对应的头像图片,而且风格是统一的:


loading


最后它会花一点时间把整套东西跑完,然后一次性给你六个角色各自的 PDF 文件。每一份里都会包含完整的角色档案、故事正文,还有各自的秘密任务:


loading


这里我截了其中两个人物当例子看了一下。每个角色都会有一份完整的封面,而且封面不是随便糊的,排版做得很规整。


右侧是角色本人,用的是 AI 生成的形象图,左侧放的是剧本主题和人物信息,层次很清楚。


翻到第一页,就是这个角色的角色档案,再往后才是正式的剧本内容:


loading
loading


把这些体验串在一起看,其实会发现一个很一致的方向:一段本来很长、很碎的工作流程,是可以被 Agent 慢慢压缩掉的。


传统流量生意的底层逻辑,是尽可能多地占用用户时间:刷得越久、停得越长,商业价值越大。而 Agent 产品是反着来的,它存在的意义,是帮你把时间省下来


这一点,正在被 Kimi Agent 这类产品验证。


可以说,如果一个 Agent,能在 5 分钟内完成你过去需要 5 小时才能做完的工作,那么即便你只用它 5 分钟就关掉,它依然是一款极好的产品。

🚥

文章最后,我们再把视线拉回到 1 月 10 日的清华园。


在那场对话里,杨植麟提到了一个让他「着迷」的不行的东西:最美的 Loss 曲线。这代表着模型智能持续、稳定的增长。但对普通用户来说,或许还有另一条同样重要、甚至更重要的曲线:个人效率提升的曲线。


2026 年,Kimi 正在尝试让这两条曲线交汇。


在这个新阶段,人可能不再像之前那样,需要要学习如何操作复杂的软件,AI 本身,正在成为最通用、也最自然的界面。


虽然还没实现,但进展值得期待。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询