微信扫码
添加专属顾问
我要投稿
OpenAI 发布新智能体,引发关注!这是一次具有突破意义的尝试。 核心内容: 1. 与 Anthropic 同类产品对比及评测提升 2. 用户初体验及存在的问题 3. karpathy 大佬的高度评价
OpenAI 在 Anthropic 的同类产品发布 3 个月后,昨晚推出了他们的计算机使用Agent。
在OSWorld/WebArena 上评测获得了比较大的提升,说明还是存实际意义的模型进步,而不仅仅是 ui/product 包装。
原理也很常规,端到端。
@SullyOmarr 发表了关于operator的初印象。
初次使用 operator 的感受:
总体而言,我对于他们能在第一天就上线这么多用户感到惊讶,这可不容易。浏览器很复杂,搭建这样的基础设施难度很大,必须给团队点赞。
但现在还谈不上“魔法般”的效果。模型本身在后续六个月里应该还要优化,变得更快一些。
对我来说,现在可能只能把它放在“sora”那一堆里:用了一次就没再用。说实话,目前我还没发现特别适合它的场景。
karpathy大佬的评价很高,operator项目对于数字世界来说,就像类人机器人对物理世界。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-07
为什么同一个模型,在 Claude Code/Codex CLI 里感觉像换了个脑子?
2026-05-07
尝试在Warp里使用claude code
2026-05-07
我用 Claude Code CLI 搭了一套「不丢上下文」的工作流
2026-05-07
Anthropic 上线「做梦」功能,让 Agent 越睡越聪明
2026-05-06
Android CLI 实战指南:借助任意智能体,实现 3 倍速高效开发
2026-05-06
刚刚,GPT-5.5 Instant全员免费!数亿人的ChatGPT变了
2026-05-06
M365 Copilot :App Builder 它不仅是单次代码生成
2026-05-06
GPT-5.5 Instant 来了,但这次重点不是“更强”,而是“更像人”
2026-04-15
2026-03-31
2026-03-13
2026-02-14
2026-03-17
2026-04-07
2026-02-09
2026-03-17
2026-03-21
2026-02-20
2026-05-07
2026-04-26
2026-04-22
2026-04-18
2026-04-13
2026-04-12
2026-04-07
2026-04-01