2026年6月11日 周四晚上19:30,报名腾讯会议了解“业务抓夹如何成为前线部署工程师(FDE)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

从腾讯文档升级看腾讯在Agent赛道上的节奏_tag2

发布日期:2026-06-05 19:37:28 浏览次数: 1509
作者:卫夕指北

微信搜一搜,关注“卫夕指北”

推荐语

腾讯文档与WorkBuddy实现“人机双写”,打破传统AI办公的对话式交互,让AI真正融入工作流。

核心内容:
1. 腾讯文档“人机双写”新模式的创新体验
2. AI办公赛道当前主流产品的瓶颈分析
3. AI办公产品从工具到助手的演进阶段

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

2025 年,姚顺雨写过一篇传播很广的文章,叫《The Second Half》。

核心观点就一句话——

AI 的上半场,模型在拼在各种有明确标准的 Benchmark,但下半场,该拼在标准没有辣么确定的真实世界如何干活。

一年后,这位《AI 下半场》的作者,成了腾讯的首席 AI 科学家。

最近腾讯文档的升级,其实就是在回答那个下半场的问题:AI如何更高效地干活?

正好最近在Twitter刷到一条推文——

没错,今天的话题聊的就是腾讯文档和WorkBuddy的化学反应。

 

废话少说,先看东西——

我打开升级后和WorkBuddy合体后的腾讯文档,给它布置了一个任务:

帮我写一份Claude Code和Codex的发展对比分析报告。

注意:我说的不是打开一个对话框跟AI聊天,让它一坨一坨地往外吐文字,然后复制粘贴到文档里,那是很久以前的玩法。

我说的是,在同一个文档编辑器里,先写了一个大纲框架,列了几个我关心的维度:产品定位、用户规模以及商业模式等。

然后WorkBuddy直接在我的腾讯文档里动手了——

写完之后可以即见即所得一段下达指令无论格式还是内容可以快速修改

两个人好吧,一个人一个AI在同一份文档里同时写,互相能看见对方在干嘛,写到某个节点觉得写得不对,直接改。

这个体验,怎么说呢,的确有点东西。

过去所有的AI办公产品,交互模式基本上都一个样:我问,AI答,我不满意,AI重新生成。

很显然,腾讯文档的这次做了创新,他们管这个叫:人机双写。

 

要更深入理解腾讯文档这次升级,我们先先看看AI办公这条赛道过去两年到底在卷什么。

2023年3月,微软推出Microsoft 365 Copilot。

三年过去了,结果怎么样呢?

截至2026年1月,Copilot付费用户1500万。

听着不少对吧?

但Office 365的总用户数是4.5亿,付费转化率:3%。

3%。

微软自己都急了。

2026年4月,CEO纳德拉亲自下场重组Copilot工程团队,提拔高管组建12人精锐小队。

计划把OpenClaw那套Agent能力塞进Copilot里,试图在6月的Build大会上放大招。

再看Google,Gemini的确接入Google Workspace,但你说Workspace因此体验或存在感提升了吗?

好像也木有。

在我看来,原因在于——所有人都在做AI办公,但大多数产品的交互范式都停留在同一个阶段:对话式。

用户提需求,AI生成内容,用户决定要不要。

这个模式在我看来有一个缺陷:AI是一个外挂,木有真正地融进产品。

 

我一直觉得,AI办公产品的演进,可以分成三个阶段——

第一阶段是工具期。

AI帮你润色一段文字、生成一页PPT,本质上是一个高级版的自动补全,市面上绝大多数产品都处在这个阶段。

第二阶段是助手期。

AI能理解你的意图,能根据上下文做更复杂的任务。比如把表格里的数据做成图表,它能选合适的图表类型,Copilot最近能做到这一步。

第三阶段是协作期。

AI进入你的工作环境,和你在同一个空间里一起干活,能看到你在做什么,做到实时响应。

腾讯文档这次做的人机双写,就属于这个阶段。

那么它是如何做到这一点的呢?

答案是:它靠的是一整套能力的聚合。

文档编辑器是前台,WorkBuddy是Agent引擎,混元大模型是底层算力,腾讯网盘是记忆底座。

"WorkBuddy 是 Agent 引擎"这句话,其实还能再往下挖一层。

这就要说到这次升级很硬核的部分——技术底座。

业界雀食有很多产品是套壳滴,但腾讯文档这次走得更深:它原生采用了 WorkBuddy 的统一Agent内核。

但光有统一的Agent能力内核还不够,腾讯文档在内核之上,又叠了两样自己的东西——

一样是自研的高性能编辑引擎,这是让Agent 实现精准编辑文档、PPT、表格的关键。

另一样是丰富的品类专业Skill,这些Skills专门针对文档类的特定任务进行了定向优化。

统一内核叠加自研引擎,再加上品类 Skill,融合后的新版文档Agent,在任务拆解、工具调用、上下文记忆这几个核心能力上,都有明显提升。

这也是人机双写操作起来非常自然且顺手的重要原因。

 

人机双写是这次升级里的重点,另外两个同样值得说——

第二个升级,是文档企业版全面 AI 化。

文档、表格、PPT 各个品类全面接入 AI 助手,企业版同步接进 WorkBuddy。

这一步的意义在于:一个能力先在 C 端几亿用户那里跑顺,再原封不动地延伸到企业场景里去。

这条从个人到企业的路,腾讯文档走得比较稳。

毕竟,它本来就是国民级产品。

第三个升级,是端内 Agent 升级。

文档端内的 Agent 调用 WorkBuddy 的框架能力并做了深度优化,文档、表格、PPT 支持了自然语言操作,一句话就能生成并操作整份方案、整张表格、整套 PPT。

腾讯文档的这次升级,生态开放也是重点——

具体而言,开放了两个通道:Skill(基于MCP协议)和OpenAPI。

接入MCP协议意味在任何支持MCP的智能体产品里,用自然语言就能调用腾讯文档的全部能力。

不需要打开腾讯文档的网页或者App,直接在日常使用的AI工具中下达需求,腾讯文档执行后,结果直接返回到工作流里。

OpenAPI更加开放:面向企业和个人开发者,不需要企业资质就能接入腾讯文档的全部能力。

这在国内同类产品中算是比较激进的策略了。

大多数厂商的API开放都要求企业认证、审核流程一堆事情,个人开发者基本被挡在门外。

一个值得注意的细节是:ima也已经宣布接入WorkBuddy。

也就是说,腾讯正在把WorkBuddy的Agent能力向自己生态内的更多产品辐射。

当Agent能力渗透到腾讯整个C端和B端产品矩阵中,这个串起来的能量还是很大的。

腾讯为什么要把文档能力开放得这么彻底?

在我看来,原因在于:在Agent时代,文档的角色变了。

以前的文档你写完了,存起来,发给别人看。

现在的文档变成了AI工作流中被反复调用的组件。

AI Agent在执行任务的过程中,随时需要创建文档、修改文档以及基于文档内容做决策。

这个角色转变,直接改变了文档产品的定位。

谁的文档能力被更多的Agent调用,谁就成了AI办公生态的基础设施。

 

我再展开说一个实操场景,进一步说明这套体系到底能干什么。

假设你是一个运营负责人,手上有一份上个月的用户增长数据表格,存在腾讯网盘里。

你需要做三件事——

第一,基于数据做一份增长分析报告。第二,从报告中提炼关键结论做成一套汇报PPT。第三,把PPT分享给团队。

现在用腾讯文档加WorkBuddy操作起来就很简单了:

第一步,在WorkBuddy里说一句话:把网盘里上个月的用户增长数据拉出来,做一份增长分析报告。

WorkBuddy直接从腾讯网盘调取文件,它知道你的文件在哪、什么内容,然后在腾讯文档里创建一份新文档,开始写报告。

第二步,报告初稿出来之后,你在文档里直接改。觉得某个结论的论据不够充分?自己补一段或者重写,你和AI在同一份文档里协作。

第三步,报告定稿后,你再说一句:基于这份报告生成一套汇报PPT,突出三个核心数据结论,直接产出一份完整的PPT。

然后就可以一键分享给团队,全程在一个环境里完成,不需要在多个工具之间跳来跳去。

我还试了一个场景——

让WorkBuddy在腾讯文档里创建一份表格,把我过去三个月发布的文章按阅读量、转发量、评论数做了一个汇总。

然后基于这些数据识别出哪类选题表现最好,哪个发布时间段的数据最高,最后输出一份选题优化建议。

它大概用了五六分钟——当然,中间有两个数据它漏掉了,我在文档里直接改了,但整体的分析逻辑、结论提炼都没毛病。

从这个意义上,升级后的腾讯有点像一个有判断力的同事,你给方向,它干活。

它把80%的脏活累活先扛了,你只需要聚焦在最重要的那20%上。

这也是腾讯文档和一些散装AI办公产品最大的区别。

关于这一点,用的时间越长,感受越明显。

 

还有一个逻辑也必须说一说——

6月这次腾讯云的AI产业应用大会上,腾讯做了一件之前没做过的事:首次发布效率智能体工具集。

什么意思呢?

就是腾讯把分散在各个产品线里的AI能力,沉淀成了一套可协同的完整工具。

模型服务、Agent应用、开发工具、效率智能体应用,全部打包,面向个人、办公、企业三大场景,覆盖办公协同、代码研发、知识管理、设计创作、营销客服、数据分析等高频场景。

这个工具集的核心框架是这样的,具体分三层——

底层是混元模型持续迭代提供算力支撑。

中间层是WorkBuddy加CodeBuddy的Agent框架。

应用层是腾讯文档、腾讯会议、企业微信、腾讯网盘等一系列产品。

腾讯庞大的 C 端和 B 端生态,让它天然具备场景红利,而场景和连接,决定一个Agent能进化到多高。

这一点,是腾讯的家底,别人羡慕不来。

 

最后说说我自己的感受。

我用腾讯文档加WorkBuddy一阵时间,除了开头说的那份Claude Code和Codex对比报告,我还试过让它帮我做行业数据整理、选题分析、AI论文抓取等。

整体体验下来就两个字:靠谱。

我喜欢用它,其中一个原因是它比较省心,交互上比较自然,成本也可控,不需要怎么折腾。

我想,经常整文档、PPT和Excel的白领,腾讯文档加WorkBuddy就是实用之选。

当然,也不是什么都好,有时候它的格式审美让人一言难尽,同时它对某些专业领域的理解深度和Claude和GPT的模型相比还有差距。

但方向对了。

AI办公的竞争已经走到了一个关键拐点。

很多单点的能力,大家都能做,接下来比的是:你的AI能在真实工作流里端到端把活干完并且完成交付吗?

从散装AI到套件级融合——这条路腾讯文档开了一个不错的头。

如果我们从更高一些的视角来看腾讯,会发现混元基座补齐、效率工具集成、Agent深度接入。

这些放在一起看,腾讯在AI办公这个战场上,确实在找到自己的节奏。

下一步就看混元的下一个大版本能不能在模型能力上再上一个台阶,以及人机双写这个品类能不能在用户端得到大规模验证了。

的确,为什么真正靠谱好用的AI Agent产品并不多?

原因其实很简单:Agent需要的技术栈要求太全面,缺一环,基本上就只能做个聊天机器人换皮。

腾讯这次的策略,就是是多层推进——

混元Hy3做基座,WorkBuddy做框架,腾讯文档做场景,网盘做数据底座,MCP加OpenAPI做开放通道。

有人可能会说,这不就是因为腾讯家大业大嘛,什么都有,拼起来就行了。

我倒是不这么看。

原因在于拼好也是有难度的:这些东西分属不同的产品线、不同的团队、不同的技术栈。

要让它们真正打通,需要顶层设计和执行力。

对于腾讯这样大厂而言,确实是不容易滴。

从这次腾讯文档的升级来看,至少在效率办公这个方向上,腾讯的劲在往一块使。

 

结语

我个人对厂商造词一向警惕,人机双写这个词能不能在行业里立住,还得看用户用脚投票。

但我愿意给它一个不错的评价,原因在于:对于没有极其复杂需求的日常办公一族,这是一个非常实用的工具。

腾讯这次给我的感觉,是终于在 Agent 这个战场上,找回了自己的手感。

它就守着自己的家底,把AI一点一点地原生融进去。

慢半拍没关系,关键是这一拍,踩在了点上。


——End——

作者简介:卫夕,公众号“卫夕指北”出品人,科技专栏作者,专写长文,专写不一样的,专注剖析AI、广告及互联网的底层逻辑;不关注这个账号,你都不知道你会错过神马!

图片

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询