支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


5.5k Stars! Nanobrowser: 基于多智能体架构的开源浏览器自动化工具(支持多LLM集成)

发布日期:2025-05-16 08:19:56 浏览次数: 1535 作者:AI工具推荐官
推荐语

探索自动化浏览器操作的新境界,Nanobrowser让你的网络任务更加智能高效。

核心内容:
1. Nanobrowser:基于多智能体架构的开源浏览器自动化工具
2. 核心功能与系统架构:自动化网络任务与多智能体协作
3. 支持多LLM集成:灵活选择大语言模型提供商,优化使用体验

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

 

点击蓝字 关注我们
图片

有没有想过,怎么能让AI自动操作浏览器,执行各种任务,这不,有一款开源工具就很适合。

Nanobrowser是一款开源的人工智能网络自动化工具,以Chrome4扩展程序的形式在浏览器中运行。它借助先进的多智能体人工智能系统,使用户能够通过自然语言指令实现复杂网络任务的自动化。

它可以作为OpenAI Operator的免费替代方案,具有灵活选择大语言模型(LLM)提供商以及完全本地掌控等额外优势。


这个扩展程序完全在浏览器内运行,确保您的数据和凭证私密。它能连接你所选的LLM提供商。

github地址:https://github.com/nanobrowser/nanobrowser

核心功能

Nanobrowser的功能主要围绕自动化基于网络的任务,这些任务通常需要手动导航和交互。该系统能够:

该系统对于重复性网络任务、研究活动以及数据收集工作流程尤其有价值,因为这些任务若手动执行通常耗时费力。

系统架构概述

Nanobrowser采用多智能体架构,由专门的人工智能智能体协作完成网络任务。此图展示了其宏观架构:

该架构包含三个主要组件:

  1. 1. 用户界面:用户输入任务并查看结果的侧边栏
  2. 2. 多智能体系统:核心智能部分,由三个专门的智能体组成
  3. 3. 浏览器集成:使系统能够与网页交互的组件。

Nanobrowser的工作原理

Nanobrowser通过多智能体协作方式运行:

  1. 1. 任务输入:用户在侧边栏输入自然语言指令
  2. 2. 任务规划:规划智能体分析请求并制定详细计划
  3. 3. 网页执行:导航智能体通过控制浏览器执行计划
  4. 4. 结果验证:验证智能体验证任务是否正确完成
  5. 5. 用户反馈:向用户展示结果,用户可提出后续问题

此序列图展示了组件之间典型的交互流程:

扩展组件

Chrome扩展程序架构由多个协同工作的关键组件构成:

LLM提供商集成

Nanobrowser支持配置如下模型:

  • • OpenAI(GPT模型)
  • • Anthropic(Claude模型)
  • • Google(Gemini模型)
  • DeepSeek模型
  • • Ollama(本地模型)
  • • 自定义OpenAI兼容端点

用户可根据特定需求为不同智能体分配不同模型。例如,规划智能体可能使用专为推理优化的更强大模型,而导航智能体则可使用更快且更具成本效益的模型。

这种灵活性使用户能够根据自身特定需求、偏好和预算限制优化使用体验。

入门指南

  1. 1. 从Chrome网上应用店安装扩展程序,或从GitHub发布页面手动安装。

  2. 2. 打开扩展程序并导航至设置页面

3. 通过添加API密钥配置LLM提供商,比如我是添加的硅基流动的API,要选最后一个OpenAl-compatible API Provider,然后配置API key、base url等。

  1. 4. 选择每个智能体使用的模型。

  1. 5. 返回主界面并开始输入任务。简单测试一下,“打开百度网页”,成功!

开发方式

Nanobrowser以单体仓库形式构建,采用模块化架构,具有可扩展性和易维护性。代码库分为几个关键目录:


 

往期文章回顾:
dify v1.3.1 重磅发布:支持整个文件夹上传知识库了!" data-itemshowtype="0" target="_blank" linktype="text" data-linktype="2">Dify v1.3.1 重磅发布:支持整个文件夹上传知识库了!
扣子AI智能体实战教程:爆款文章标题和封面图设计神器制作过程全拆解
Agent节点” 让工作流学会 “自主推理”" data-itemshowtype="0" target="_blank" linktype="text" data-linktype="2">Dify “Agent节点” 让工作流学会 “自主推理”
MCP开源合集项目介绍,并带你从根上搞懂MCP" data-itemshowtype="0" target="_blank" linktype="text" data-linktype="2">36k Star + 2.1k Star!两个热门的MCP开源合集项目介绍,并带你从根上搞懂MCP
5.3k!Dify GitHub热门工作流合集并介绍DIFY+MCP示例
Dify 开源DeepResearch工作流实现本地和Web混合搜索并探索工作流图的正确解析方法(一)
Dify内置DeepResearch工作流溯源——来看看Dify官方博客对它的介绍
Dify内置DeepResearch深度体验,抽丝剥茧带大家瞧瞧它的真实水准
Manus?" data-itemshowtype="0" target="_blank" linktype="text" data-linktype="2">Dify 实现DeepResearch工作流拆解并再看升级版Dify能否搭建出Manus?
深度解析:Dify能否复刻Deep Research与Manus?三大工具深度对比





?AI技术交流群开放!加我微信 nono_speech(备注:AI) 或扫描二维码,和开发者一起交流Dify、开源AI项目,共同学习成长!
图片
#开源AI工具  #浏览器自动化  #AI工具推荐  #AI工具 

 

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询