免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


“浏览器,重新开机”:从 Dia 被收购到 Comet、Claude 与 Fellou,AI 正在重写入口之战

发布日期:2025-09-06 07:23:24 浏览次数: 1541
作者:非凡产研

微信搜一搜,关注“非凡产研”

推荐语

AI浏览器正从工具升级为智能工作前台,Dia被收购标志着入口之战进入新阶段。

核心内容:
1. 浏览器作为AI主导界面的三大驱动力:搜索替代、浏览器重构、系统化嵌入
2. 三条技术路线对比:Answer-first搜索替代 vs Agent-native浏览器重构 vs 系统级嵌入
3. 行业变革关键:从"看网页"到"做事情"的范式转移与价值重估

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

昨晚,Atlassian 宣布以 6.1 亿美元现金收购 The Browser Company——这家做过 Arc、还在测试中的 AI 浏览器 Dia 的团队。一个被忽视了二十年的“入口”,忽然被抬进了行业中枢:它不再只是装网页的壳,而是变成可以观察、思考、执行的“工作前台”。这笔交易让“AI 浏览器”从趋势讨论变成产业事件:谁来承载 Agent?工作流如何落在可操作的界面?价值如何被定价?这些问题,被拉到了台前。

Bessemer 的《The State of AI 2025》给出了一个直白判断:浏览器将成为 Agentic AI 的主导界面。它贴着用户的日常工作流,天然拥有上下文与权限;下一代浏览器(Comet、Dia 等)不只是插件,而是“操作层”的一部分,能够跨标签协作、按意图多步执行。换句话说,浏览器从“看”网页,变成“做”事情。

一. 为什么是“浏览器层”——三股力量汇合

这两年,搜索、办公与系统级入口都在往一个方向靠拢:以行动为中心的界面

第一股力量是搜索替代。 Perplexity 推出 Comet,把“搜到答案”升级为“完成任务”:从网页研究到邮箱/日历的代办安排,浏览器自身成为可调用的助手。Perplexity 同时抛出了一个震撼叙事——对 Chrome 的 345 亿美元“要约”。无论落地与否,这个动作把“浏览器=战略资产”的话题推到了聚光灯下。

第二股力量是浏览器重构。 Dia 把“可编程界面”做成默认形态,Atlassian 则把它接入到企业协作版图——Jira、Confluence 一侧是流程与数据,Dia 一侧是前台与动作,连接处正是 AI 的“意图到执行”。这解释了为什么一家协作软件公司愿意为一家“没有传统营收模型”的浏览器付出 6.1 亿美元:买的不是流量,是组织工作流的前端

第三股力量是系统化嵌入。 Anthropic 的 Claude for Chrome 进入受控试点:让 Agent 读取、点击、导航网页并在用户授权下执行动作。这不是另一个对话窗,而是将“动作权限”嵌到浏览器事件循环里——安全与可控将成为产品能否规模化的生死线。

 

二. 三条技术路线:从“回答”到“执行”

路线 A:Answer-first 的搜索替代

Comet 的产品哲学很清晰:把互联网变成“延展思维”的即时界面——研究、比较、决策、再到邮箱/日历/Slack 的任务转译,一条龙完成。优势在“从答案到行动”的联通,难点在权限治理跨域稳定性

路线 B:Agent-native 的浏览器重构(Dia / Fellou)

这类产品直接把“多步任务”“跨标签状态”“身份与会话管理”作为浏览器的原生能力。Fellou 的叙述更激进:不仅自动化网页,还要打通桌面级操作。其挑战在于安全沙箱企业级审计:当浏览器能“买单/发帖/下单”,审计流与回放能力就不再是锦上添花,而是准入门槛。

路线 C:系统型浏览器的 AI 内生化

Edge+Copilot、Chrome 的生态演进、以及 Claude for Chrome 的权限试点,构成“在既有分发里做深动作”的路径。好处是用户教育成本低、兼容性强;代价是创新速度风险承受度受制于主流平台的节奏。

 

三. “可编程界面”的工程学:把意图翻译成动作

当我们把 Agent 放进浏览器,工程问题远比“能不能总结网页”复杂:

上下文统一:跨标签页的共享记忆、可寻址的 DOM 片段、以及来自日历/邮箱/文档的外部上下文拼接。

动作编排:把低层的 click/type/scroll 提升为“意图 API”(例如“提交报销”“修改合同的赔偿条款”),以声明式 DSL 或可视化步骤保存与复用。

身份与会话:统一管理登录态、Cookie/Token 与最小权限授权;企业环境下还要映射到 SSO 与细粒度 RBAC。

安全与审计:每一步动作可回放、可撤销;异常分支(验证码、弹窗、表单校验)要自动处理;并对敏感操作(支付/合规提交)插入强交互确认。

可靠性指标:不仅看一次跑通,还要看跨域成功率(CSR)、平均修复时间(MTTR)与“不可预期 UI 变更”的鲁棒性。

Bessemer 把这类能力概括为“在操作层内生 AI”:浏览器不再只是“数据面板”,而是“执行平面”(execution plane)。

 

四. 估值与交易该怎么看:叙事、替代率与工作流粘性

Perplexity 的资本轨迹给了一个参照:截至 8 月,媒体与路透的多方报道把其最新估值区间落在 150 亿美元左右;“累计融资约 10 亿美元”的量级也被反复印证。估值并非只来自搜索份额,而是对“搜索→行动”的替代率在工作流里的滞留时间的押注。与此同时,公开向 Google 抛出收购 Chrome 的长程要约,更像是一场关于“入口主权”的叙事战争。

再看昨晚的交易:Atlassian 以 6.1 亿美元买下 The Browser Company。买的不是 DAU 或广告库存,而是把 Agent 前台化的工程资产和企业协作产品的拼图契合度。当“工作结果”成为购买理由时,浏览器的商业价值就不再用“页面浏览”来度量,而是用“任务完成”来定价。

 

五. 全球与中国:入口心智的两种路径

全球AI浏览器市场正蓄势待发,市场数据显示,预计从2024年的45亿美元起,到2034年将以每年32.8%的惊人复合年增长率(CAGR)增长,市场总规模有望达到768亿美元 。

据QYR调研数据,2023年中国AI搜索浏览器市场规模约为数亿元人民币,预计2030年将大幅增长,2024-2030年的年复合增长率达到34.3%。这一增速高于全球平均水平,反映出中国市场对AI赋能浏览器的需求旺盛。

a16z 的第 5 次《Top 100 Gen AI Consumer Apps》显示,在 Web 侧,夸克(Quark)进入前 10;豆包、Kimi 等也进入前 20。国内产品的优势在于强入口/强分发与高频刚需场景的聚合;挑战是把这些场景转译为标准化的行动 API,以及在出海市场形成可验证的安全与合规凭证。

对于中国团队而言,路径可能是:先在单市场把“行动深度”做到足够稳定(高 CSR、低 MTTR),再通过“本地生态伙伴+合规能力+可观测性”打通出海市场。没有审计的自动化,在企业采购里很难过关。

 

六. 产品与商业的“落地三角”

速度:极致响应与指令链路压缩。

安全:权限最小化、动作回放、可解释与可追责。

可用性:涵盖更多“端到端”场景,而不是单点 demo。

工程团队需要在三角内找到平衡:速度再快,如果无法审计支付动作;可用性再强,如果在第三方后台遇到验证码就崩溃;安全再全,如果用户要点五次确认才能发一封邮件——都很难规模化。

 

七. 对甲方、创业者与投资人的“可执行”观察表

入口指标:从“打开次数”转向“任务触发次数/完成率”。

动作图谱:有多少跨站点、跨系统的“可复用动作包”(Shareable Action Pack)。

合规与审计:是否提供企业级审计日志、SLA 与 DLP 钩子。

生态绑定:与主流 SaaS/数据平台的“深度集成”数量(只读 vs 可写 vs 事务级)。

人机协作:当 Agent 卡住时,是否能把“歧义”编排成可交接的微任务给人类完成,再无缝回到自动化链路。

如果你是甲方:从一个“低风险高频”的用例开始(如内部知识检索→日报自动化),在边用边沉淀“动作包”的同时,建立权限与审计基线

如果你是创业者:用“EDA 框架”自检——Entry(入口)/Depth(行动深度)/Autonomy(自主化程度)/Assurance(可证明的安全与可靠)

如果你是投资人:看“任务完成—留存”的闭环,而非单点流量;看“动作图谱复用率”,而非 demo 的戏剧性。

 

八. 未来 12 个月:合纵与连横

系统厂商会加速内生 AI 行动层:Chrome/Edge 的动作权限、策略与审计接口会更标准化,扩展“可执行性”的范围。Claude for Chrome 的试点,已经把“受控权限+行动”写进了主流浏览器叙事。

协作与浏览器前台合流:Atlassian 把 Dia 接到工作套件里,是一个样板——“从文档/工单到浏览器动作”的闭环将被打通。

搜索与浏览器的边界继续模糊:Perplexity 的 Comet 把“搜”与“做”合在一个场景里,下一步是把“团队知识”和“企业权限”连接起来。

当年浏览器赢在“谁能更好地呈现网页”;而今它要赢在“谁能更可靠地完成任务”。Dia 的归宿、Comet 的野心、Claude 的试点、Fellou 的激进,都在把一个事实摆在眼前:入口之战从“信息展示”走向“意图执行”。而真正的胜者,不是“谁的模型更聪明”,而是谁能把安全、权限、可靠性与动作图谱,做成可以规模化复用的“工程学”。这一次,浏览器不再是配角。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询