微信扫码
添加专属顾问
我要投稿
Browser-Use让AI真正"上网冲浪",赋予大模型操作浏览器的能力,开启Web自动化新纪元。 核心内容: 1. Browser-Use的核心功能与模块化设计 2. 三大落地场景:广告生成、QA测试、新闻监控 3. 快速上手指南与环境配置方法
uv venv --python 3.12
.venv\Scripts\activate
uv pip install browser-use
uvx playwright install chromium --with-deps
# 配置密钥 这里选择一个即可
# GEMINI_API_KEY=
# ANTHROPIC_API_KEY=
OPENAI_API_KEY=sk-xxx
from browser_use import Agent, ChatOpenAI
from dotenv import load_dotenv
import asyncio
load_dotenv()
async def main():
llm = ChatOpenAI(model="gpt-4.1-mini")
task = "Find the number 1 post on Show HN"
agent = Agent(task=task, llm=llm)
await agent.run()
if __name__ == "__main__":
asyncio.run(main())
uvx browser-use --mcp
uv pip install agentscope
uv pip install agentscope[full]
import os
import asyncio
import agentscope
from agentscope.agent import ReActAgent, UserAgent
from agentscope.model import DashScopeChatModel
from agentscope.formatter import DashScopeChatFormatter
from agentscope.mcp import StdIOStatefulClient
from agentscope.tool import Toolkit
from dotenv import load_dotenv
# 加载环境变量
load_dotenv()
async def browser_use_demo():
"""
1. 连接 browser-use MCP
2. 注册浏览器自动化工具
3. 创建智能体
"""
# 初始化 AgentScope
agentscope.init()
# 创建工具包
toolkit = Toolkit()
# 创建 Browser-use MCP 客户端
# 环境变量配置
browser_env = {
"OPENAI_API_KEY": os.environ.get("OPENAI_API_KEY"),
"BROWSER_USE_HEADLESS": os.environ.get("BROWSER_USE_HEADLESS", "true"),
"BROWSER_USE_DISABLE_SECURITY": os.environ.get("BROWSER_USE_DISABLE_SECURITY", "false"),
}
# 以 StdIO 创建 Browser-use MCP 客户端
browser_use_client = StdIOStatefulClient(
name="browser_use_mcp",
command="browser-use",
args=["--mcp"],
env=browser_env
)
try:
# 连接到 browser-use MCP
await browser_use_client.connect()
# 注册 browser-use MCP 工具
await toolkit.register_mcp_client(browser_use_client)
# 创建支持浏览器操作的智能体
agent = ReActAgent(
name="BrowserBot",
sys_prompt="""你是一个网页自动化助手,能够执行各种浏览器操作。""",
model=DashScopeChatModel(
api_key=os.environ.get("DASHSCOPE_API_KEY"),
model_name="qwen-max",
enable_thinking=False,
stream=True,
),
formatter=DashScopeChatFormatter(),
toolkit=toolkit,
parallel_tool_calls=True,
)
# 创建用户智能体
user = UserAgent(name="User")
print("\n🤖 Browser-use 智能体已准备就绪!")
print("💡 你可以要求我执行各种网页自动化任务,例如:")
print(" - 访问http://xxx")
print(" - 点击xxx按钮")
print(" - 填写表单,在xxx输入xxx")
print(" - 输入 'exit' 退出程序\n")
# 交互循环
msg = None
while True:
msg = await user(msg)
if msg.get_text_content().lower() == "exit":
break
msg = await agent(msg)
except Exception as e:
print(e)
finally:
# 清理资源
try:
await browser_use_client.close()
except Exception as e:
print(e)
if __name__ == "__main__":
asyncio.run(browser_use_demo())
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-10-21
AI正在改写地图APP!这一次轮到谷歌了
2025-10-21
实测|DeepSeek-V3.2-Exp三大升级:长文本、多轮对话、开发支持
2025-10-21
实测上百款MCP后,我发现这10款才是真正能提升生产力的神器!
2025-10-21
Karpathy和DeepSeek-OCR说的“遗忘”是一回事吗
2025-10-21
用户体验新范式:AI 如何重新定义产品设计架构
2025-10-21
为啥Deepseek OCR 牛: 潜在用途
2025-10-21
有效的 Context 工程(精读、万字梳理)|见知录 004
2025-10-21
Agent与Workflow的技术落地实践与思考
2025-08-21
2025-08-21
2025-08-19
2025-09-16
2025-07-29
2025-09-08
2025-09-17
2025-08-19
2025-10-02
2025-09-29
2025-10-20
2025-10-20
2025-10-19
2025-10-18
2025-10-18
2025-10-18
2025-10-16
2025-10-16