微信扫码
添加专属顾问
我要投稿
一句话搞定亚马逊比价和IMDb信息提取,HyperAgent让浏览器自动化更智能!核心内容: 1. HyperAgent的环境准备与安装指南 2. 基础使用:通过CLI和代码库实现自动化任务 3. 进阶功能与云部署实操流程
大家好,我是小歪,AI玩家、AI探索者、AI开发工程师。
我会在这里分享关于AI新产品
、AI新动向
、AI应用
、AI创业
等相关的资讯。欢迎关注,点赞,收藏哦,谢谢啦!
在现代开发中,浏览器自动化场景日益复杂,传统脚本因页面结构变化频繁而变得脆弱。HyperAgent 作为一款基于 Playwright 增强的 AI 浏览器自动化工具,通过 LLM(大语言模型)能力实现了自然语言驱动的自动化操作,同时兼容原生 Playwright 功能,兼顾灵活性与稳定性。本文将从环境准备、基础使用、进阶功能到云部署,全面讲解 HyperAgent 的实操流程,帮助开发者快速上手并落地自动化需求。
在使用 HyperAgent 前,需完成本地开发环境的配置,确保依赖包与工具链正常工作。
通过 npm 或 yarn 直接安装官方包,命令如下:
# 使用npm安装
npm install @hyperbrowser/agent --save
# 使用yarn安装(推荐,依赖安装更稳定)
yarn add @hyperbrowser/agent
HyperAgent 依赖 LLM 实现 AI 指令解析,需提前获取对应 API 密钥并配置环境变量:
OPENAI_API_KEY
ANTHROPIC_API_KEY
环境变量配置方式:
set OPENAI_API_KEY=your-api-key-here
export OPENAI_API_KEY=your-api-key-here
~/.bashrc
(Linux)、~/.zshrc
(macOS)或 Windows 的系统环境变量中。HyperAgent 提供两种核心使用方式 ——CLI(命令行)和代码库,适用于不同场景。以下通过实际案例演示基础功能。
CLI 模式适合简单的一次性任务,无需编写代码,直接通过命令行输入自然语言指令即可。
npx @hyperbrowser/agent -c "你的自动化任务描述" [可选参数]
# 指令:查询迈阿密到新奥尔良的航线详情
npx @hyperbrowser/agent -c "Find a route from Miami to New Orleans, and provide the detailed route information."
若需查看自动化过程(如浏览器界面、日志),添加-d
参数开启调试:
npx @hyperbrowser/agent -d -c "Navigate to amazon.com, search for 'laptop', and show the first 3 results."
-c, --command |
-c "搜索谷歌航班从里约到洛杉矶7月16日出发" |
|
-d, --debug |
-d |
|
--hyperbrowser |
--hyperbrowser |
对于多步骤、需自定义逻辑的任务(如数据提取、多页面管理),推荐使用代码库模式,通过 JavaScript/TypeScript 编写脚本。
需求:访问亚马逊官网,搜索 “笔记本电脑”,提取前 5 个结果的价格并打印。
// 引入HyperAgent及依赖
import { HyperAgent } from "@hyperbrowser/agent";
import { ChatOpenAI } from "@langchain/openai";
// 初始化Agent(配置LLM)
const agent = new HyperAgent({
llm: new ChatOpenAI({
openAIApiKey: process.env.OPENAI_API_KEY, // 从环境变量读取API密钥
modelName: "gpt-4o", // 使用gpt-4o模型(推荐,解析精度更高)
}),
});
// 执行自动化任务
async function extractAmazonLaptopPrices() {
try {
const result = await agent.executeTask(
"Navigate to amazon.com, search for 'laptop', and extract the prices of the first 5 results"
);
// 打印提取结果
console.log("亚马逊笔记本价格(前5条):");
console.log(result.output);
} catch (error) {
console.error("任务执行失败:", error);
} finally {
// 关闭Agent,释放资源
await agent.closeAgent();
}
}
// 调用函数
extractAmazonLaptopPrices();
需求:访问 IMDb 官网,搜索《黑客帝国》,提取导演、上映年份、评分(指定数据格式)。
import { HyperAgent } from "@hyperbrowser/agent";
import { ChatOpenAI } from "@langchain/openai";
import { z } from "zod"; // 用于定义数据 schema
async function extractMovieInfo() {
const agent = new HyperAgent({
llm: new ChatOpenAI({
openAIApiKey: process.env.OPENAI_API_KEY,
modelName: "gpt-4o",
}),
});
try {
// 定义输出数据的 schema(强制结构化)
const movieSchema = z.object({
director: z.string().describe("电影导演姓名,多个导演用逗号分隔"),
releaseYear: z.number().describe("电影上映年份,仅数字"),
rating: z.string().describe("IMDb评分,格式如'8.7/10'"),
});
// 执行任务并指定 schema
const response = await agent.executeTask(
"Navigate to imdb.com, search for 'The Matrix', and extract the required info",
{ outputSchema: movieSchema }
);
// 打印结构化结果
console.log("《黑客帝国》信息:");
console.log(JSON.stringify(response.output, null, 2));
} catch (error) {
console.error("提取失败:", error);
} finally {
await agent.closeAgent();
}
}
extractMovieInfo();
new HyperAgent(options) |
new HyperAgent({ llm: new ChatOpenAI(...) }) |
|
agent.executeTask(prompt, options) |
executeTask("搜索航班", { outputSchema: ... }) |
|
agent.newPage() |
const page = await agent.newPage() |
|
page.ai(prompt) |
await page.ai("输入搜索关键词'手机'") |
|
page.extract(prompt, schema) |
await page.extract("提取航班信息", schema) |
|
agent.closeAgent() |
await agent.closeAgent() |
HyperAgent 提供多页面管理、自定义 LLM、MCP 工具集成等进阶功能,满足企业级自动化需求。
需求:创建两个页面,分别获取 “纽约推荐旅行目的地” 和 “该目的地的景点推荐”。
import { HyperAgent } from "@hyperbrowser/agent";
import { ChatOpenAI } from "@langchain/openai";
async function multiPageDemo() {
const agent = new HyperAgent({
llm: new ChatOpenAI({
openAIApiKey: process.env.OPENAI_API_KEY,
modelName: "gpt-4o",
}),
});
try {
// 创建两个独立页面
const page1 = await agent.newPage();
const page2 = await agent.newPage();
// 页面1:获取纽约推荐目的地
const destinationRes = await page1.ai(
"Go to google.com/travel/explore, set starting location to New York, return only the first recommended destination name"
);
const destination = destinationRes.output;
console.log("纽约推荐目的地:", destination);
// 页面2:基于目的地推荐景点
const attractionRes = await page2.ai(
`Recommend 3 must-visit attractions in ${destination}, return name and brief intro`
);
console.log(`n${destination}景点推荐:`);
console.log(attractionRes.output);
// 获取所有活跃页面(可选)
const activePages = await agent.getPages();
console.log(`n当前活跃页面数量:${activePages.length}`);
} catch (error) {
console.error("多页面任务失败:", error);
} finally {
await agent.closeAgent();
}
}
multiPageDemo();
除 OpenAI 外,HyperAgent 支持所有 Langchain 兼容的 LLM,以下以 Anthropic Claude 为例:
import { HyperAgent } from "@hyperbrowser/agent";
import { ChatAnthropic } from "@langchain/anthropic";
const agent = new HyperAgent({
llm: new ChatAnthropic({
anthropicApiKey: process.env.ANTHROPIC_API_KEY, // 配置Claude密钥
modelName: "claude-3-7-sonnet-latest", // 使用Claude 3 Sonnet模型
}),
});
// 后续任务执行逻辑与OpenAI示例一致
HyperAgent 可作为 MCP(工具调用协议)客户端,集成第三方工具(如 Google Sheets、Exa 搜索)。以下示例实现 “从维基百科提取美国人口 Top5 州数据,并写入 Google Sheets”。
npm install @composio/mcp
export COMPOSIO_API_KEY=your-composio-key
import { HyperAgent } from "@hyperbrowser/agent";
import { ChatOpenAI } from "@langchain/openai";
async function wikiToGoogleSheets() {
const agent = new HyperAgent({
llm: new ChatOpenAI({
openAIApiKey: process.env.OPENAI_API_KEY,
modelName: "gpt-4o", // MCP功能推荐使用gpt-4o
}),
debug: true, // 开启调试,查看工具调用日志
});
try {
// 初始化MCP客户端(连接Google Sheets工具)
await agent.initializeMCPClient({
servers: [
{
command: "npx",
args: [
"@composio/mcp@latest",
"start",
"--url",
"https://mcp.composio.dev/googlesheets/your-mcp-url", // 替换为你的MCP链接
],
env: { npm_config_yes: "true" }, // 自动确认npm安装
},
],
});
// 执行任务:提取维基数据并写入Google Sheets
const response = await agent.executeTask(
"Go to https://en.wikipedia.org/wiki/List_of_U.S._states_and_territories_by_population, extract data of top 5 most populous states (state name, population). Then insert the data into Google Sheets. If no Google Sheets connection exists, present the sign-in link first."
);
console.log("任务结果:", response.output);
} catch (error) {
console.error("MCP任务失败:", error);
} finally {
await agent.closeAgent();
}
}
wikiToGoogleSheets();
当需要大规模执行自动化任务(如批量数据采集、多地区测试)时,本地浏览器资源有限,可通过 Hyperbrowser 云服务实现弹性扩展。
Hyperbrowser 是官方提供的云浏览器平台,支持数百个并发会话,无需本地部署浏览器,步骤如下:
HYPERBROWSER_API_KEY
在初始化 Agent 时,指定browserProvider: "Hyperbrowser"
,即可使用云浏览器:
import { HyperAgent } from "@hyperbrowser/agent";
import { ChatOpenAI } from "@langchain/openai";
async function cloudBrowserDemo() {
// 初始化云Agent
const agent = new HyperAgent({
llm: new ChatOpenAI({
openAIApiKey: process.env.OPENAI_API_KEY,
modelName: "gpt-4o",
}),
browserProvider: "Hyperbrowser", // 使用云浏览器
hyperbrowserApiKey: process.env.HYPERBROWSER_API_KEY, // 配置云服务密钥
});
try {
// 执行任务(云环境中运行,本地无浏览器窗口)
const response = await agent.executeTask(
"Go to hackernews, list the 5 most recent article titles and their URLs"
);
console.log("HackerNews最新文章:");
console.log(response.output);
} catch (error) {
console.error("云任务失败:", error);
} finally {
await agent.closeAgent();
}
}
cloudBrowserDemo();
debug: true
,并集成 ELK Stack(Elasticsearch、Logstash、Kibana)监控任务执行日志try/catch
+ 延时重试),应对网络波动或页面加载延迟robots.txt
规则,避免触发反爬机制HTTP_PROXY
/HTTPS_PROXY
npx playwright install
HYPERBROWSER_API_KEY
正确(从官网重新获取)hyperbrowser.ai
域名(开放 443 端口)z.string ()
.https://github.com/hyperbrowserai/HyperAgent
https://www.hyperbrowser.ai/
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-10-13
AI测试工具的“三重奏”:从数据到Agent的工程化路径
2025-10-13
别卷刷榜了!AI Agent的下一个战场是“中训练”|Meta最新论文解读
2025-10-13
Aiops探索:AI在DevOps生命周期中的应用场景探索
2025-10-13
从混沌到可控:企业应用中AI Agent不确定性控制的 10 种策略
2025-10-13
从“键盘牛仔”到“规范工程师”,AI浪潮下的程序员身份危机
2025-10-13
2025云栖大会复盘:从ASI叙事到Agent落地的四个转向
2025-10-13
政务大模型从场景到安全的完整落地建议
2025-10-13
铁一院|铁路工程设计AI大模型技术梳理
2025-08-21
2025-08-21
2025-08-19
2025-09-16
2025-07-29
2025-09-08
2025-08-19
2025-09-17
2025-09-29
2025-08-20
2025-10-09
2025-10-09
2025-10-07
2025-10-04
2025-09-30
2025-09-29
2025-09-28
2025-09-27