微信扫码
添加专属顾问
我要投稿
Nanobrowser,测试工程师的网页自动化利器。核心内容:1. Nanobrowser的AI驱动网页自动化功能2. 多智能体系统在实际任务中的应用测试3. 交互式侧边栏的用户体验及效率提升
↑ 点击上方【测试工程师成长之路】关注我们
亲爱的小伙伴们,由于微信公众号改版,打乱了发布时间,为了保证大家可以及时收到文章的推送,可以点击上方蓝字关注测试工程师成长之路,并设为星标就可以第一时间收到推送哦!
感谢您抽出
.
.
阅读本文
作为一名测试工程师,日常工作里,我常常被繁琐的网页操作折磨得苦不堪言。像是反复地在不同页面间切换、机械地填写各种表单、大海捞针般地筛选信息…… 这些看似不起眼的任务,却耗费了我大量的时间和精力,效率直线下降,还容易因为疲劳出现人为失误。我一直在寻觅一款强大的工具,能帮我从这些重复劳动中解脱出来 ,直到我发现了Nanobrowser
。
Nanobrowser
是一款开源的Chrome
扩展工具,专注于AI
驱动的网页自动化,就像是给浏览器请了个智能助手,能自主完成各种复杂的网页任务。它完全免费,所有操作都在本地浏览器运行,不用担心隐私数据被泄露,还支持DeepSeek
、OpenAI
、Anthropic
、Gemini
等主流的大型语言模型,你可以根据自己的需求和预算,灵活配置API
密钥 ,选择最合适的模型。
纸上得来终觉浅,绝知此事要躬行。光听介绍可不够,我(TesterRoad)决定亲自上手测试一番,看看Nanobrowser
是不是真像传说中那么神。
打开安装好Nanobrowser
扩展的Chrome
浏览器,一个简洁的侧边栏界面出现在眼前,这就是与智能体交互的主要阵地。我决定先给它布置一个复杂的任务:在电商平台上,帮我挑选一款价格在5000 - 8000元之间,内存16GB及以上、硬盘512GB及以上,且用户评分4.5分以上的笔记本电脑 ,并整理出性价比最高的三款。
在侧边栏输入指令后,规划器Planner
迅速开始分析任务,制定出详细的执行策略。它先是确定需要访问哪些电商平台,然后规划好搜索的步骤和筛选条件。紧接着,导航器Navigator
就按照Planner
制定的策略,自动在浏览器中打开各大电商平台的页面,精准地输入搜索关键词,点击筛选按钮,填入价格、配置、评分等筛选条件。在这个过程中,每一步操作都能在浏览器中清晰看到,就像有个无形的手在帮我点击一样。
最后,验证器Validator
登场,仔细检查Navigator
获取到的商品信息,确保数据准确无误,没有遗漏重要的细节。它会再次核对价格范围、配置参数、用户评分等关键信息,把不符合要求的商品剔除掉。经过一番筛选和比较,Nanobrowser
很快就把性价比最高的三款笔记本电脑信息整理出来,呈现在我面前。整个过程一气呵成,不到两分钟就完成了,要是我自己手动筛选,估计得花上大半个小时。
在使用过程中,交互式侧边栏给我留下了深刻的印象。它的界面设计非常简洁直观,就像我们平时使用的聊天软件一样,输入指令和查看回复都一目了然。当我向它提出任务需求时,它能快速理解我的意图,给出准确的回应。而且,在任务执行过程中,它会实时更新任务状态,让我随时了解进展情况。
有一次,我让它帮我收集最近一周关于人工智能的新闻资讯,并整理出关键要点。刚输入完指令,侧边栏就显示 “已收到任务,正在制定策略”,接着马上展示 “正在访问新闻网站”“正在筛选相关文章”“正在提取关键要点” 等实时状态。如果遇到问题,它也会及时反馈,比如某个网站无法访问,它会提示我可能的原因,并尝试寻找其他替代方案。这种实时的交互体验,让我感觉不是在和一个冷冰冰的工具打交道,而是有个智能助手在身边,随时沟通交流。
为了测试任务自动化的能力,我给Nanobrowser
布置了一个重复性的繁琐任务:从一个包含大量客户信息的网页表格中,提取出所有年龄在30岁以上、居住在特定城市的客户姓名和联系方式,并整理成Excel
表格。要是以往,我得手动一行一行地查看表格,筛选出符合条件的客户,再复制粘贴到Excel
中,不仅耗时费力,还容易出错。
但有了Nanobrowser
,一切都变得轻松简单。我只需在侧边栏输入指令,它就立刻开始工作。它自动识别网页表格,按照我设定的筛选条件,快速准确地提取出相关客户信息,然后自动打开Excel
软件,将数据填入表格中,最后还贴心地帮我保存好文件。整个过程完全自动化,我只需要坐在电脑前,看着它有条不紊地完成任务,短短几分钟,就完成了原本需要花费一两个小时的工作,效率提升了好几倍。而且,由于是机器操作,避免了人为失误,数据的准确性也得到了保障。
Nanobrowser
支持多种主流的大型语言模型,这让我可以根据不同的任务需求和成本考量,灵活选择最合适的模型。我分别使用了OpenAI
的GPT-4
和Anthropic
的Claude
模型来执行相同的任务,对比它们的表现。
在处理一些需要创意和深度理解的任务时,比如撰写一篇关于科技发展趋势的文章,GPT - 4
展现出了强大的语言生成能力,生成的文章逻辑清晰、内容丰富,语言表达也非常流畅自然。而在处理一些对准确性和事实性要求较高的任务,如整理金融数据报告时,Claude
表现得十分出色,它能够精准地分析数据,给出准确的结论和建议,对细节的把握非常到位。通过这种多LLM
支持的方式,我可以充分发挥不同模型的优势,让Nanobrowser
在各种任务中都能表现得更加出色。
是不是已经迫不及待想要亲自体验一下Nanobrowser
的神奇功能了?别着急,接下来我就手把手教你如何安装和使用它,就算是技术小白也能轻松上手 。
Nanobrowser
的官方GitHub
仓库,在页面中找到最新版本的nanobrowser.zip
文件,点击下载 。https://github.com/nanobrowser/nanobrowser/releases
nanobrowser.zip
文件并解压。Chrome
浏览器,进入扩展程序页面。打开“开发者模式” 。nanobrowser
文件夹,然后点击 “选择文件夹”。当然,你也可以直接进入Chrome应用商店直接搜索下载
安装完成后,我们还需要配置智能体模型,让Nanobrowser
能够使用你选择的大型语言模型。
Chrome
浏览器工具栏中的Nanobrowser
图标,打开Nanobrowser
的侧边栏。API Keys
选项,点击它。然后,根据你使用的大型语言模型,输入相应的API
密钥。比如,如果你使用OpenAI
的模型,就输入OpenAI API
密钥;如果使用Anthropic
的Claude
模型,就输入Anthropic API
密钥 。API
密钥后,在Model Selection
下,找到Model
选项。在这里,你可以为不同的智能体(Planner
、Navigator
、Validator
)选择使用的模型。比如,你可以为Planner
选择gpt-4
模型,以获得更强大的任务规划能力;为Navigator
选择gpt-4o
模型,让它在执行网页操作时更加精准。一切准备就绪,现在就可以让Nanobrowser
大展身手啦!在侧边栏的输入框中,输入你的任务指令,就像和朋友聊天一样,用自然语言描述你想要完成的任务。下面TesterRoad给大家列举一些常见任务指令示例:
输入指令后,点击发送按钮,Nanobrowser
就会开始分析你的指令,制定任务策略,并在浏览器中自动执行任务。在任务执行过程中,你可以在侧边栏实时查看任务状态,了解任务进展情况。如果任务执行成功,Nanobrowser
会将结果展示在侧边栏中;如果遇到问题,它也会及时反馈,告诉你可能的原因,并尝试寻找解决方案 。
市面上的网页自动化工具不在少数,像知名的OpenAI Operator
、Browser-Use
、Nanobrowser
和它们比起来,优势相当明显。
和OpenAI Operator
相比,Nanobrowser
最大的优势就是免费开源。OpenAI Operator
每月的订阅费用可不低,对于个人用户和小型团队来说,是一笔不小的开支。而Nanobrowser
完全免费,没有任何订阅费用,只需安装扩展程序,配置好自己的LLM API
密钥,就能使用顶级的网页自动化功能,成本大大降低,让每个人都能轻松享受到AI
带来的便利 。在隐私方面,OpenAI Operator
采用云端运行,数据存储在云端服务器,这就存在隐私泄露风险。而Nanobrowser
所有操作都在本地浏览器执行,API
密钥和操作数据都保存在本地,不用担心敏感信息被泄露,对隐私敏感的用户来说,简直是福音。
和基于Python
开发的Browser-Use
相比,Nanobrowser
在操作便捷性上更胜一筹。Browser-Use
作为一款LLM
智能浏览器自动化工具库,需要一定的Python
编程基础才能使用,对于普通用户来说,门槛较高。而Nanobrowser
提供了直观的交互式侧边栏,用户通过自然语言指令就能让它完成各种网页任务,就像和智能助手聊天一样简单,不需要编写任何代码,真正做到了零门槛上手 。在功能上,虽然Browser-Use
能实现网页自动化、多标签管理和视觉识别等功能,但Nanobrowser
的多智能体系统更加智能灵活,不同智能体分工协作,能更好地处理复杂的网页工作流程,遇到障碍时还能自动调整策略,确保任务顺利完成 。
经过这段时间的深度使用和测试,Nanobrowser
给我带来的是实实在在的效率飞跃,它就像一个懂我心思的得力助手,帮我把那些繁琐、重复的网页操作轻松搞定。无论是多智能体系统的默契协作,还是交互式侧边栏的便捷沟通,又或是任务自动化带来的解放双手,以及多LLM
支持的灵活选择,每一个功能都让我真切地感受到了AI
驱动网页自动化的强大魅力 。
从软件测试的角度来看,Nanobrowser
的稳定性和准确性都表现出色,在多次测试中,都能按照设定的指令准确执行任务,很少出现错误或异常情况 。而且,其开源免费的特性,以及对隐私的高度重视,让它在众多同类工具中脱颖而出,成为了注重效率和隐私用户的不二之选 。
据我所知,Nanobrowser
的开发团队正在快马加鞭地开发新功能。未来,它将会集成更多的大语言模型提供商,给我们带来更丰富的选择;安全防火墙的加入,会让浏览操作更加安全可靠;内存优化也在计划之中,在减少令牌使用的同时,还能保持出色的上下文感知能力;会话回放功能可以让我们高效回顾历史任务,还能降低令牌消耗;针对复杂领域任务的专用代理也在开发中,相信会给特定领域的工作带来极大的便利 。
如果你也像我一样,被繁琐的网页操作困扰,不妨试试Nanobrowser
。我坚信,它会给你的工作和生活带来意想不到的惊喜,让你从此告别重复劳动,拥抱高效便捷的数字化生活 。赶紧去体验一下吧,记得在评论区分享你的使用感受哦!
如果你觉得这篇文章还不错,不妨动动手指,给它点个赞?,让更多人看到它的魅力。觉得内容对你有帮助,就大胆地分享到朋友圈吧,让知识传递得更远。同时,也欢迎在评论区留下你的想法和见解,我们一起交流探讨。当然,别忘了关注我,这样你就不会错过我后续的精彩分享啦!最后,记得点个“在看”?,让我们共同见证测试之美!
•(END)•
如有任何疑问,点击添加【个人微信】咨询!
喜欢这篇文章欢迎转发、分享朋友圈~
目前100000+人已关注我们
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-06-08
开源嵌入新王落地!Qwen3-Embedding 本地部署指南 + Dify 召回测试实录
2025-06-08
通俗易懂的 MCP 概念入门
2025-06-08
斩获2.3K星 !!! 再见Notion , 效率+200% , IDE式笔记整理神器 , 知识图谱超推荐 ! 绝了
2025-06-06
企业必备神器!零代码快速部署DeepSeek-R1-0528超强版本~
2025-06-06
基于MCP协议的12306购票搜索服务器项目解析(附配置流程)!
2025-06-06
性能大涨!阿里开源新版Qwen3模型,霸榜文本表征
2025-06-06
Qwen3新成员:Embedding系列模型登场!
2025-06-05
Dify限制太多?试试开源可商用的LLM开发平台:毕昇BISHENG
2024-07-25
2025-01-01
2025-01-21
2024-05-06
2024-09-20
2024-07-20
2024-07-11
2024-06-12
2024-12-26
2024-08-13
2025-06-08
2025-05-28
2025-05-28
2025-05-26
2025-05-25
2025-05-23
2025-05-17
2025-05-17