我要投稿

美团也开源了大模型，但我觉得他们的野心是通用生活Agent。

发布日期：2025-09-04 12:10:55 浏览次数： 2244

作者：数字生命卡兹克

微信搜一搜，关注“数字生命卡兹克”

起猛了，美团这下真的开始明牌干AI了。

居然，发布并直接开源了560B参数的MoE模型LongCat-Flash-Chat。

好家伙，WAIMAI里有两个AI，这次成真的了，美团真发大模型了。

开源地址：https://github.com/meituan-longcat/LongCat-Flash-Chat

也有线上体验地址：https://longcat.ai

我自己去体验了一下，整体模型能力，中规中矩，但是快，是真的快，能把560B的模型，在推理的时候搞得这么快，是真的有点牛逼的。

我直接录了个屏给大家看一下。

这里我们可以直观对比一下LongCat和DeepSeek V3的输出速度，API其实更好，但是这里就直接用的网页版了，更C端用户一些，能直观的看到效果，他两也都是MoE，而且参数量差不太多。

为了更公平的竞争，用了同一个问题，并关闭了联网搜索来避免搜索干扰。

先来看DeepSeek。

DeepSeek每次还是需要原地转圈圈思考一会儿，然后才一个一个的往外吐字，挺急的。

耗时整整33秒。

再来看LongCat，这刷新率不用多说了吧。

像机关枪一样哒哒哒的五六秒就输出完了。

这是LongCat和DeepSeek的另一个case，DeepSeek思考的功夫，LongCat答案快写完了。

非常直观的对比。。。

我又测了一下写作和代码。

先是做了一个新的小游戏，弹射线游戏，核心玩法是操作小球来躲避不同方向，不同速度的避弹射线，存活时间越长分数越高。

整体还行，这UI以及弹射线的设计还是很有艺术感，碰壁反弹也遵循了正确的物理规律，甚至在碰撞时会迸发好看的火花。

然后，我让LongCat写了篇小说。

全文比较长，我把完整版贴在这里，大家可以看看。

我还挺喜欢它写的那句话的：在宇宙的尺度下，孤独是一种常态。

我还让它写了一个北京美食地图。

不愧是美食世家出身的大模型，写的很细。

但是，我觉得最有趣的东西，其实是他们技术报告里的。

Agent能力。

很多人都在说LongCat快，确实，它的速度极快，但是，他们的Agent能力，也极强。

直接登顶了。

我自己一直在说，AI现在很多时候，离我们普通大众太远了。

大家都在卷生产力，卷写报告，卷做PPT，卷科研，这些东西当然很重要，但，它离我们真实的生活，总感觉还隔着一层。

大家都生产属性了。

但是美团做一个Agent能力如此之高的并且超级快的大模型，我个人觉得，他目标就是为了服务自己的业务去的。

为了服务所有C端用户的生活场景。

有些事，你得连起来看。

不知道有些人知不知道，你在美团点开搜索框，现在是有AI模式的搜索的。

它跟你传统的搜索完全不一样。

你不再需要去想“火锅”、“烤肉”这种关键词。

你可以直接跟它说人话，比如：“我想找个适合哥们儿几个喝酒撸串、人均一百左右、离我最近、现在还开着的烧烤店。”

你看，它会立刻理解你这个复杂的需求，然后把最符合条件的店铺，直接推给你。

而且，前段时间，他们也开始内测一个对我们社恐人士非常非常有用的新功能。

AI帮订座。

你找到一家想去的餐厅，点一下那个“AI帮你订”的按钮，然后输入你的需求，比如“今晚7点，4个人，要个靠窗的座”。然后，就没你事了。

美团的AI，会自己打电话给餐厅的前台。你没看错，是真的打电话，点开沟通明细，就能看到它跟前台是怎么说的。

真的会用一个听起来几乎和真人一模一样的声音，去跟前台沟通，帮你预定。

还有美团里的AI开发票，也是一个逻辑。

你点完外卖，不再需要跟商家打电话，直接让AI去帮你搞定。

这些，所有这些已经在美团上落地、或者正在内测的AI功能，它们有一个共同的特点：

全都是为了C端用户，为了生活场景，为了解决我们这些普通人，在日常生活中那些最具体、最琐碎的痛点而服务的。

这一切的布局，感觉都像是一块块拼图，正在拼出一个巨大的、清晰的图景。而这个图景的目标，就叫：

通用生活Agent。

放眼整个国内，好像确实也没有比美团更适合来做这个产品的公司了。

AI最缺的是什么？场景和数据。

OpenAI做Agent，它很牛逼，但它能帮你订一张从北京到上海的、下周二的、靠窗的高铁票吗？它能帮你找到你家楼下那家新开的、评价最好的兰州拉面吗？

它不能，因为它没有这个数据，更没有打通上下游的交易系统。

但这玩意，美团可太擅长了。

它的背后，是全国几百万家真实商户的实时菜单、库存、营业时间。是几亿C端用户每天产生的真实交易、真实评价。是几百万外卖小哥每天在城市里穿梭，构成的最鲜活的、动态的物理世界数据。

换句话说，别人是拿AI，辛辛苦苦地去找应用场景。而美团，是用无数个真实的应用场景，反过来，去养它的AI。

这是一个正向的、可以无限循环的飞轮。用户在美团上用AI的次数越多，它的AI就越懂你的需求，推荐就越精准，服务就越贴心。而服务越好，你就越离不开它。

现在，我们再回头看美团发布的那个560B参数的MoE模型，LongCat。

你就能瞬间明白，这个特点就是快和Agent能力的模型，背后的深意。

为什么要把它做得那么快？

因为生活场景的交互，是即时的。你点外卖，你订酒店，你打车，你不能等。

古典的交互设计师可能都知道，你设计产品交互时，最接受不了的，就是产品的卡顿和延迟。

一秒钟的延迟，都可能让用户直接关掉App或者放弃这个功能，快，是C端产品能够被用户接受的生命线。

只有足够快，用户才不用等。

而模型为什么突出Agent能力？

因为生活服务，本质上，就是一连串复杂任务的组合。

订一顿餐，背后需要理解你的口味、预算、位置，然后调用餐厅信息，规划外卖路线，最后完成支付。

订一张票，背后需要理解你的时间、目的地、偏好，然后调用票务系统，完成预定。

这些，都不是简单的知识问答，这全都是需要理解、规划、调用工具、执行任务才能完成的Agent行为。

还有一点，就是便宜。

LongCat的输出成本5元/百万 token。换句话说，它不希望用户花几百块的成本全网比价，而是只做几块钱的生意。

所以，当你把所有的点练成线，就可以看到，美团几乎就是在明示天下：

我们做大模型，从第一天起，瞄准的就是ToC的通用生活Agent，而不是所谓的，知识问答。

所以啊。

我觉得，别小看一个做本地生活起家的公司，更别小瞧那个每天给你送外卖的平台。

它可能，比任何人都更懂，人类真实的需求和期待。

它不是要带我们去火星，也不是剑指AGI。

它是要让我们，在这个地球上。

活得。

更像一个被照顾得无微不至的人。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-12-05

开源算法能在 2025 年击败 GPT-5 吗？DeepSeek-V3.2 / Speciale 交出了一份答卷

2025-12-05

开源了首个用于诉讼的智能体框架 SuitAgent

2025-12-05

腾讯混元OCR大模型，本地部署，实测

2025-12-04

刚刚，法国Mistral 3系列模型发布，全部开源、全部多模态、全部能落地，对标中国模型

2025-12-04

Transformers来到了v5时代：从工具包到真理之源，AI时代的操作系统内核的极简进化论

2025-12-04

Mistral 3发布，14B多模态小模型表现优异

2025-12-04

ollama v0.13.1 发布：全新 Ministral-3 与 Mistral-Large-3 模型，增强工具调用与GPU

2025-12-03

从硅谷杀出来一个彻底开源的AI记忆系统，是真的优雅！

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

阿里Qoder vs Trae vs Cursor：谁才是2025年程序猿的效率之王？

2025-09-07

DeepSeek又开源，这次是OCR模型！附论文解读！

2025-10-20

Claude不让用，有哪些国产模型能迎头赶上？

2025-09-08

全新AI编程工具 Google Antigravity 实测，特别适合产品经理

2025-11-19

发现一个超神的Github开源OCR项目，国产多模态杀疯了

2025-10-27

MiniMax悄悄发布M2，8%价格打出Claude级性能

2025-10-27

如愿以偿！Qwen3-VL再开源30B-A3B，附实测！

2025-10-03

Qwen3-Next 首测！Qwen3.5的预览版？但为什么我的测试一塌糊涂？

2025-09-17

DeepSeek-V3.2背后的国产算子编程语言TileLang是什么？如何保持性能领先的同时减少6倍代码量？

2025-09-29

n8n如何调用最近爆火的deepseek OCR？

2025-10-29

大家都在问

我们为什么选择 Spring AI 开发智能体，而不是 Dify？

2025-11-12

开源安全审核模型终极PK：Qwen3Guard、OpenAI-SafeGuard、Llama4-Guard谁才是王者？

2025-11-10

DeepSeek-OCR到底厉害在哪？

2025-11-03

n8n如何调用最近爆火的deepseek OCR？

2025-10-29

小红书入局AI智能体开源DeepAgent，在计划什么更新？

2025-10-28

埃森哲的大裁员，向市场发出了什么信号？

2025-10-13

DeepSeek-V3.2背后的国产算子编程语言TileLang是什么？如何保持性能领先的同时减少6倍代码量？

2025-09-29

Qwen3-Next 首测！Qwen3.5的预览版？但为什么我的测试一塌糊涂？

2025-09-17

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB