免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

我下班后,Agent 继续替我上班。

发布日期:2026-01-21 12:28:28 浏览次数: 1529
作者:AI产品银海

微信搜一搜,关注“AI产品银海”

推荐语

下班后让AI替你工作?MiniMax Agent 2.0让这成为现实,从文件整理到内容创作,真正实现自动化办公。

核心内容:
1. MiniMax Agent 2.0如何高效整理本地混乱文件
2. 自动拆解公众号文章为多平台适配内容
3. 智能读取文档并生成专业级PPT演示文稿

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


过去一年,我们其实已经被各种 AI 工具“教育”得很充分了。


会写、会总结、会生成内容,模型能力几乎每天都在刷新上限。


但真正回到工作现场,你还是得在浏览器、本地文件、后台系统之间来回切换,AI 只能永远停在对话框里,而你负责把现实世界一点点搬给它。


但注意看,这个Agent正在帮我批量观看B站视频,并且帮我总结分析内容。


这正是 MiniMax Agent 2.0 这次更新最想解决的问题。


体验地址:https://agent.minimaxi.com/


我这一次直接是下载使用了 MiniMax Agent Desktop,我先是没有急着测试复杂场景,而是从一个非常日常的小事开始:整理本地文件。


在安装完成后的步骤介绍里面,我看到它是作为桌面级应用可以直接读取本地文件,那么我让它直接扫描一个长期没整理过的素材文件夹,里面混着图片、视频、表格、零散文档等。


它做的事情并不“浮夸”,只是安静地把文件按内容、时间和用途归好类,标出重复项,把真正可用的素材单独拎出来。


作为终端级别的 Agent ,最重要的就是“授权”,它是可以对你的文件进行编辑操作的。


文件整理完成后,它并没有停下来,而是顺着我给的目标,继续往下走,整整齐齐的帮我整理好了


比如我里面的有些素材本来就是为内容创作准备的,它会直接问是否需要进入拆解、改写或发布阶段。


这种感觉很像一个已经理解你工作上下文的同事,而不是一个只等你下指令的工具。


所以我觉得内容创作是另一个非常典型的场景。


一篇已经写好的公众号文章,在 Desktop 环境里不再只是“给 AI 看一段文本”。

MiniMax Agent 可以直接读取本地文件,在理解全文结构后,自动拆成适合不同平台的版本。


因为微信文章解析本身就有保护,MiniMax Agent 就使用了“浏览器专家”启动了浏览器进行访问,并通过Dom Coentnt的方式获取了全篇文章。


比如拆成三篇小红书图文笔记,重写标题、调整语气、重新组织段落逻辑,然后使用了图片生成能力,自动创建3张相关的笔记图片。


当然了,我发现在 MiniMax Agent 里面无论是图片、视频还是文档,比如我给它下一个做多文档做PPT的任务,我直接让它读取我本地的一些资料作为参考内容,让它帮我整理成新的一份PPT。

读取文件夹中的文档,结合所有内容生成PowerPoint 演示文稿。注意你必须根据每一份文档自动填充PPT的标题和要点,并且搭配合适的示意图说明原理。 [请点击下方选择文件夹]


它就会主动拆解我这个目录下的文件内容信息,然后根据里面的内容信息重新整理,并帮我生成了一份PPT,然后直接就会保存在我的本地文件中。


请赏析PPT:


这份PPT不论是从样式上来说,或者是传达的内容信息来说,都是非常极致的体验,甚至我仔细看了一下这个架构图,都是非常细致的刻画。


生成的PPT文本的布局更规则化,“文字”还使用了风格化字体,让整体PPT质感看起来上升了一个档次。


这种体验会非常直观地改变我对“工作量”的感知,因为很多原本需要你盯着屏幕反复操作的事情,会在你去做别的事情时被悄悄完成。


类似的能力在数据和分析类工作里会被放大。


以 Boss 直聘为例,让 MiniMax Agent 帮我在 Boss 直聘搜索上海的 AI 产品经理岗位,筛选月薪 30k 以上的职位,并整理成表格。


只需要把相关的内容指令输入进去即可,然后MiniMax Agent就会自动接管你的浏览器窗口,然后去采集相关的数据,假如数据没有办法直接解析,它就会使用鼠标进行模拟访问。


整个过程你不需要在“爬虫工具、Excel、分析脚本、AI 对话”之间来回切换,它在后台跑,你只在关键节点介入。


它会把所有的数据给你整理到一个文档里面,然后给你一个整体的求职建议,你也可以继续对这份数据进行追问。


比如让它继续按照这份数据生成一份数据图表,MiniMax在接到我的需求后就会坑次坑次开动执行了。


我很惊讶的是,它主动的把所有数据生成网页看板之后,甚至还给出了一个可以在线访问的地址:https://mgbjhhw80e5j.space.minimaxi.com/


而我们也可以直接用一句话就可以美化整个网页,“帮我美化成Boss直聘的UI风格”。


如果说 Desktop App 解决的是“Agent 能不能真正干活”,那它背后的 Agent 架构和工具层,解决的就是“它能不能长期进化”。


MiniMax Agent 并没有把能力封死在一个“万能助手”里,而是允许你创建多个子 Agent。


你可以为它们分别设计 system prompt,让每个 Agent 只专注一件事,比如内容分析、发布、数据监控或素材处理。它们之间不是互相干扰,而是像一个小型协作团队。


更重要的是,这些 Agent 并不是只会思考,它们是真的有“手”的。


通过 MCP 工具,它们可以调用外部能力。


如果市场里已经有现成的 MCP,直接使用即可,如果没有,你也可以通过 SSE 接口,把自己的需要的服务通过 URL 接进来。


这意味着 Agent 的工具层不是固定的,而是可以不断扩展的,比如我刚对接的 Fetch 网页解析,就直接让它不需要再通过浏览器去读页面,而是直接通过已经配置好的 Fetch MCP 直接获取相关数据内容。


你会明显感觉到,它不是一个封闭产品,而是一个可以持续生长的工作环境。


对我而言,体验更值得一提的是“任务机制”进一步强化了这种感觉。


新建任务之后,它不会一次性执行完就消失,而是完整保留在后台任务记录中。


你可以不断追加要求、修改目标并且可以同步新建任务,让它在已有上下文中持续推进。


这种体验非常接近真实任务型协作,而不是“一问一答”。


在能力整合上,MiniMax Agent Desktop 里已经内置了大量 MiniMax 自家的原子能力,包括视频生成、图片生成、网页制作和 coding 等,背后是不同的垂类模型在支撑。


同时它也支持定时任务,比如每天定时连接 Gmail,做筛选、汇总或提醒。


这些能力单独看并不新,但当它们被统一放进一个终端级 Workspace 时,真正的价值才开始显现。


我之前一直在想,为什么国内很少有人认真做桌面端的 AI Workspace。


最近也看到了类似 Cowork 的产品出现,这条路径才开始变得清晰。


MiniMax Agent 这次的更新,让我看到了更像是把这条路径直接推到了一个可用、可规模化的阶段。


它背后其实在回答一个更大的问题:未来人是继续在工具之间奔波,还是让 Agent 主动进入人的工作环境。


MiniMax 给出的答案非常明确,是后者。


去玩玩看吧,体验地址:https://agent.minimaxi.com/


当 Agent 能理解你的本地环境,能复刻专家经验,能在后台持续运行任务,工作的定义本身就已经发生变化。


我也不再需要事无巨细地参与每一个步骤,而是把精力更多放在判断、创造和决策上。


而 MiniMax Agent 也有一个非常快的唤起办法,那就是 Option + A,让它随时随地都原地待命。


再过一段时间,我们回头看今天,会发现真正改变工作的,不再是模型参数涨了多少,是会有一个 Agent,真的坐在了你的电脑前,把活干完了。


以上就是本次的所有分享啦,我们下期再见 👋

© THE END

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询