免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

22.4K Stars,减少 93% 上下文。AI Agents 专用浏览器自动化 CLI 真强!

发布日期:2026-03-16 11:40:49 浏览次数: 1523
作者:AI真好玩

微信搜一搜,关注“AI真好玩”

推荐语

Vercel开源的agent-browser让AI Agent浏览器操作效率提升93%,专为AI场景优化的CLI工具。

核心内容:
1. agent-browser的五大核心特性:功能完善、跨平台、Ref-based等
2. 详细安装指南:从Node.js到Chromium的完整配置流程
3. 实际应用场景:如何为AI Agent提供高效的浏览器自动化能力

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

对于 AI Agent 来说,与浏览器进行交互是一个很常见的场景。如何让 AI Agent 更高效地操作浏览器,是一个比较棘手的问题。近期在查找 AI 浏览器自动化测试方案时,发现了 Vercel 开源的 agent-browser,它是专用于 AI Agents 的浏览器自动化 CLI。

agent-browser 的特点

  • 功能完善:支持导航、表单操作、截图等 50 几种命令
  • 跨平台:支持 macOS、Windows 和 Linux 平台
  • Ref-based:快照返回带 refs 的可访问树
  • Agent-first :高效利用 AI 上下文,更节省 Token
  • Sessions:支持多个独立身份认证的隔离浏览器实例

安装 agent-browser

在安装 agent-browser 前,请确保你的电脑已经安装 Node.js。

在命令行,输入以下命令。其中 -g 是表示全局安装。

npm install -g agent-browser

成功安装 agent-browser CLI 之后,继续输入 agent-browser install 命令,该命令会开始下载 Chromium browser。

Installing Chromium browser...
Need to install the following packages:
playwright@1.58.2
Ok to proceed? (y) y

当成功安装 Chromium browser 之后,命令行会输出安装成功的消息。

Downloading Chrome for Testing 145.0.7632.6 (playwright chromium v1208) from https://cdn.playwright.dev/builds/cft/145.0.7632.6/mac-arm64/chrome-mac-arm64.zip
162.3 MiB [====================] 100% 0.0s
Chrome for Testing 145.0.7632.6 (playwright chromium v1208) downloaded to /Users/abao/Library/Caches/ms-playwright/chromium-1208
Downloading FFmpeg (playwright ffmpeg v1011) from https://cdn.playwright.dev/dbazure/download/playwright/builds/ffmpeg/1011/ffmpeg-mac-arm64.zip
1 MiB [====================] 100% 0.0s
FFmpeg (playwright ffmpeg v1011) downloaded to /Users/abao/Library/Caches/ms-playwright/ffmpeg-1011
Downloading Chrome Headless Shell 145.0.7632.6 (playwright chromium-headless-shell v1208) from https://cdn.playwright.dev/builds/cft/145.0.7632.6/mac-arm64/chrome-headless-shell-mac-arm64.zip
91.1 MiB [====================] 100% 0.0s
Chrome Headless Shell 145.0.7632.6 (playwright chromium-headless-shell v1208) downloaded to /Users/abao/Library/Caches/ms-playwright/chromium_headless_shell-1208
✓ Chromium installed successfully

关闭浏览器

agent-browser close

使用 agent-browser

  1. 打开网页
agent-browser open https://agent-browser.dev/

输出:

✓ Headless Browser Automation for AI
  https://agent-browser.dev/

2.获取当前网页的可访问树

agent-browser snapshot -i

输出:

- link "Made with love by Vercel" [ref=e1]
- link "agent-browser" [ref=e2]
- link "16k" [ref=e3]
- link "npm" [ref=e4]
...
- button "Ask AI" [ref=e26]
  1. 使用 refs 进行交互
agent-browser click @e3

输出:

✓ Done
  1. 网页截图
agent-browser screenshot ./page.png

输出:

✓ Screenshot saved to ./page.png
  1. 关闭浏览器
agent-browser close

输出:

✓ Browser closed

安装 Skills

agent-browser 是专门 AI Agents 设计的 CLI,结合 AI Agents,我们就能轻松实现浏览器自动化操作。

安装 agent-browser skill 之后,你就能在 Cursor、Claude Code 或 Codex 中,控制浏览器,完全期望的任务。

npx skills add vercel-labs/agent-browser --skill agent-browser

因为我的电脑上已经安装了 claude code 和 LM Studio,并已经下载了 qwen3.5-35b-a3b 模型。所以,我通过以下命令启动 claude:

claude --model qwen3.5-35b-a3b 

之后,输入截图操作的任务。Claude 就会开始执行任务,并在命令行中展示任务的执行过程:


❯ Save a screenshot of the https://agent-browser.dev/     
  webpage to the current directory.                       
  ⎿  Initializing…
  ⎿  Invalid tool parameters

⏺ Skill(agent-browser)
  ⎿  Successfully loaded skill · 2 tools allowed

⏺ I'll navigate to the webpage and take a screenshot.

⏺ Bash(agent-browser open https://agent-browser.dev &&
      agent-browser wait --load networkidle && agent-browser
      screenshot screenshot.png)
  ⎿  ✓ Headless Browser Automation for AI
       https://agent-browser.dev/
     ✓ Done
     ✓ Screenshot saved to screenshot.png

总结

本文只介绍了 agent-browser 的部分功能,它还能够控制 iOS 模拟器中的 Safari 浏览器,实现移动 Web 应用的测试任务。此外,它还支持 CDP 模式,让你轻松连接本地或远程的浏览器。

除了 agent-browser skill 之外,还提供了 dogfood、electron 和 slack 相关的 skill,感兴趣的话,可以阅读 agent-browser 官方文档了解详细内容。

近期我会持续分享,OpenClaw 的最佳案例和优秀 Skills,欢迎与我一起交流 “养虾” 经验。

给我的 OpenClaw 加上免费的实时搜索引擎,联网搜索太香了!

别再“散养” OpenClaw 了!超火爆的 16.1K Stars 开源项目,让你轻松组建自主运行的 AI 公司!

Image

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询