微信扫码
添加专属顾问
我要投稿
Browser-Use让AI真正"上网冲浪",赋予大模型操作浏览器的能力,开启Web自动化新纪元。 核心内容: 1. Browser-Use的核心功能与模块化设计 2. 三大落地场景:广告生成、QA测试、新闻监控 3. 快速上手指南与环境配置方法
uv venv --python 3.12
.venv\Scripts\activateuv pip install browser-use
uvx playwright install chromium --with-deps# 配置密钥 这里选择一个即可
# GEMINI_API_KEY=
# ANTHROPIC_API_KEY=
OPENAI_API_KEY=sk-xxxfrom browser_use import Agent, ChatOpenAI
from dotenv import load_dotenv
import asyncio
load_dotenv()
async def main():
llm = ChatOpenAI(model="gpt-4.1-mini")
task = "Find the number 1 post on Show HN"
agent = Agent(task=task, llm=llm)
await agent.run()
if __name__ == "__main__":
asyncio.run(main())uvx browser-use --mcp
uv pip install agentscope
uv pip install agentscope[full]import os
import asyncio
import agentscope
from agentscope.agent import ReActAgent, UserAgent
from agentscope.model import DashScopeChatModel
from agentscope.formatter import DashScopeChatFormatter
from agentscope.mcp import StdIOStatefulClient
from agentscope.tool import Toolkit
from dotenv import load_dotenv
# 加载环境变量
load_dotenv()
async def browser_use_demo():
"""
1. 连接 browser-use MCP
2. 注册浏览器自动化工具
3. 创建智能体
"""
# 初始化 AgentScope
agentscope.init()
# 创建工具包
toolkit = Toolkit()
# 创建 Browser-use MCP 客户端
# 环境变量配置
browser_env = {
"OPENAI_API_KEY": os.environ.get("OPENAI_API_KEY"),
"BROWSER_USE_HEADLESS": os.environ.get("BROWSER_USE_HEADLESS", "true"),
"BROWSER_USE_DISABLE_SECURITY": os.environ.get("BROWSER_USE_DISABLE_SECURITY", "false"),
}
# 以 StdIO 创建 Browser-use MCP 客户端
browser_use_client = StdIOStatefulClient(
name="browser_use_mcp",
command="browser-use",
args=["--mcp"],
env=browser_env
)
try:
# 连接到 browser-use MCP
await browser_use_client.connect()
# 注册 browser-use MCP 工具
await toolkit.register_mcp_client(browser_use_client)
# 创建支持浏览器操作的智能体
agent = ReActAgent(
name="BrowserBot",
sys_prompt="""你是一个网页自动化助手,能够执行各种浏览器操作。""",
model=DashScopeChatModel(
api_key=os.environ.get("DASHSCOPE_API_KEY"),
model_name="qwen-max",
enable_thinking=False,
stream=True,
),
formatter=DashScopeChatFormatter(),
toolkit=toolkit,
parallel_tool_calls=True,
)
# 创建用户智能体
user = UserAgent(name="User")
print("\n🤖 Browser-use 智能体已准备就绪!")
print("💡 你可以要求我执行各种网页自动化任务,例如:")
print(" - 访问http://xxx")
print(" - 点击xxx按钮")
print(" - 填写表单,在xxx输入xxx")
print(" - 输入 'exit' 退出程序\n")
# 交互循环
msg = None
while True:
msg = await user(msg)
if msg.get_text_content().lower() == "exit":
break
msg = await agent(msg)
except Exception as e:
print(e)
finally:
# 清理资源
try:
await browser_use_client.close()
except Exception as e:
print(e)
if __name__ == "__main__":
asyncio.run(browser_use_demo())53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-04-20
懂方言,通诗词,精通30国语言,阿里发布语音识别大模型Fun-ASR1.5
2026-04-20
MCP未来会死?Anthropic工程师:2026,Agent的核心能力是连接!三大改进解决MCP上下文膨胀问题,自曝MCP应用:Agent不再寄生,可自带UI
2026-04-20
「想到」就能「得到」:灵光圈,把 Coding Agent 交到普通人手里
2026-04-20
我给了他一个梦想:超越 Claude Code
2026-04-20
深度解析 Claude Code 在 Prompt / Context / Harness 的设计与实践
2026-04-20
AI大家说 | AI落地的实践分享:从大模型盈利到新工作方式
2026-04-20
大神 Karpathy 说破了大模型的真相:不是智力不够,是垃圾数据太多
2026-04-20
光会调 API 不够了:推理时计算正在成为 AI 竞争的新战场
2026-01-24
2026-04-15
2026-01-23
2026-01-26
2026-03-31
2026-03-13
2026-01-21
2026-02-14
2026-02-03
2026-02-03