微信扫码
添加专属顾问
我要投稿
Vercel开源的agent-browser让AI Agent浏览器操作效率提升93%,专为AI场景优化的CLI工具。核心内容: 1. agent-browser的五大核心特性:功能完善、跨平台、Ref-based等 2. 详细安装指南:从Node.js到Chromium的完整配置流程 3. 实际应用场景:如何为AI Agent提供高效的浏览器自动化能力
对于 AI Agent 来说,与浏览器进行交互是一个很常见的场景。如何让 AI Agent 更高效地操作浏览器,是一个比较棘手的问题。近期在查找 AI 浏览器自动化测试方案时,发现了 Vercel 开源的 agent-browser,它是专用于 AI Agents 的浏览器自动化 CLI。
在安装 agent-browser 前,请确保你的电脑已经安装 Node.js。
在命令行,输入以下命令。其中 -g 是表示全局安装。
npm install -g agent-browser
成功安装 agent-browser CLI 之后,继续输入 agent-browser install 命令,该命令会开始下载 Chromium browser。
Installing Chromium browser...
Need to install the following packages:
playwright@1.58.2
Ok to proceed? (y) y
当成功安装 Chromium browser 之后,命令行会输出安装成功的消息。
Downloading Chrome for Testing 145.0.7632.6 (playwright chromium v1208) from https://cdn.playwright.dev/builds/cft/145.0.7632.6/mac-arm64/chrome-mac-arm64.zip
162.3 MiB [====================] 100% 0.0s
Chrome for Testing 145.0.7632.6 (playwright chromium v1208) downloaded to /Users/abao/Library/Caches/ms-playwright/chromium-1208
Downloading FFmpeg (playwright ffmpeg v1011) from https://cdn.playwright.dev/dbazure/download/playwright/builds/ffmpeg/1011/ffmpeg-mac-arm64.zip
1 MiB [====================] 100% 0.0s
FFmpeg (playwright ffmpeg v1011) downloaded to /Users/abao/Library/Caches/ms-playwright/ffmpeg-1011
Downloading Chrome Headless Shell 145.0.7632.6 (playwright chromium-headless-shell v1208) from https://cdn.playwright.dev/builds/cft/145.0.7632.6/mac-arm64/chrome-headless-shell-mac-arm64.zip
91.1 MiB [====================] 100% 0.0s
Chrome Headless Shell 145.0.7632.6 (playwright chromium-headless-shell v1208) downloaded to /Users/abao/Library/Caches/ms-playwright/chromium_headless_shell-1208
✓ Chromium installed successfully
关闭浏览器
agent-browser close
agent-browser open https://agent-browser.dev/
输出:
✓ Headless Browser Automation for AI
https://agent-browser.dev/
2.获取当前网页的可访问树
agent-browser snapshot -i
输出:
- link "Made with love by Vercel" [ref=e1]
- link "agent-browser" [ref=e2]
- link "16k" [ref=e3]
- link "npm" [ref=e4]
...
- button "Ask AI" [ref=e26]
agent-browser click @e3
输出:
✓ Done
agent-browser screenshot ./page.png
输出:
✓ Screenshot saved to ./page.png
agent-browser close
输出:
✓ Browser closed
agent-browser 是专门 AI Agents 设计的 CLI,结合 AI Agents,我们就能轻松实现浏览器自动化操作。
安装 agent-browser skill 之后,你就能在 Cursor、Claude Code 或 Codex 中,控制浏览器,完全期望的任务。
npx skills add vercel-labs/agent-browser --skill agent-browser
因为我的电脑上已经安装了 claude code 和 LM Studio,并已经下载了 qwen3.5-35b-a3b 模型。所以,我通过以下命令启动 claude:
claude --model qwen3.5-35b-a3b
之后,输入截图操作的任务。Claude 就会开始执行任务,并在命令行中展示任务的执行过程:
❯ Save a screenshot of the https://agent-browser.dev/
webpage to the current directory.
⎿ Initializing…
⎿ Invalid tool parameters
⏺ Skill(agent-browser)
⎿ Successfully loaded skill · 2 tools allowed
⏺ I'll navigate to the webpage and take a screenshot.
⏺ Bash(agent-browser open https://agent-browser.dev &&
agent-browser wait --load networkidle && agent-browser
screenshot screenshot.png)
⎿ ✓ Headless Browser Automation for AI
https://agent-browser.dev/
✓ Done
✓ Screenshot saved to screenshot.png
本文只介绍了 agent-browser 的部分功能,它还能够控制 iOS 模拟器中的 Safari 浏览器,实现移动 Web 应用的测试任务。此外,它还支持 CDP 模式,让你轻松连接本地或远程的浏览器。
除了 agent-browser skill 之外,还提供了 dogfood、electron 和 slack 相关的 skill,感兴趣的话,可以阅读 agent-browser 官方文档了解详细内容。
近期我会持续分享,OpenClaw 的最佳案例和优秀 Skills,欢迎与我一起交流 “养虾” 经验。
给我的 OpenClaw 加上免费的实时搜索引擎,联网搜索太香了!
别再“散养” OpenClaw 了!超火爆的 16.1K Stars 开源项目,让你轻松组建自主运行的 AI 公司!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-03-13
你的 AI Agent 真的在受控运行吗?
2026-03-12
Harness Engineering 的防御视角:从 Codex Security 看 AI 生成代码的治理
2026-03-12
阿里开源龙虾组合来了:HiClaw + CoPaw,内存占用大幅降低,还能直接操作本地环境
2026-03-12
大厂抢的不是“龙虾”,是人与AI的新型关系
2026-03-11
Google Workspace 团队开源了一个工具,叫 gws,直接搬进终端里了。
2026-03-11
OpenClaw爆火背后,我们所见的时代情绪 | Linear View
2026-03-11
开源 AI 收藏夹:全平台同步、自动摘要、智能对话,太强了!
2026-03-11
OpenAI 开源 Symphony!四天狂揽 8.7K Star,AI 编程自主管理神器!
2026-01-27
2026-01-30
2026-01-12
2026-01-29
2026-01-27
2026-01-28
2025-12-22
2026-01-21
2025-12-23
2026-01-06
2026-03-13
2026-03-02
2026-02-05
2026-01-28
2026-01-26
2026-01-21
2026-01-21
2026-01-20