微信扫码
添加专属顾问
我要投稿
什么是视觉AI测试?
视觉测试可以理解为功能测试的一种特殊形式。通过视觉测试,断言等方式检测被测试应用或系统UI的视觉变化。而这些视觉AI解决方案可以使用视觉人工智能(Visual AI)来发现像缺失元素、扭曲布局和重叠文本这样的漏洞,这些问题常常被传统的自动化技术所忽视。本文以AI视觉测试解决方案applitools为载体进行讲解
Applitools是如何工作的?
测试是交互加上验证。测试用例步骤仅仅是进行操作并确保其正常工作的过程。在传统的断言中,测试通常需要从页面中抓取元素,然后验证元素属性,如文本值或可见性。一个测试需要多次调用来检查不同的元素。不幸的是,元素选择器可能很难编写,并且在页面更改时容易中断。它们也无法捕捉页面的所有视觉方面,如布局、颜色、大小和位置。
视觉快照是一种更为全面、稳健的测试UI的方法。与编写多个冗长的断言相比,你只需编写一行代码调用,就可以捕获页面上的所有内容的视觉快照。快照不仅仅是静态图像:它捕捉了组成页面的所有HTML、CSS和JavaScript。
视觉测试只是使用视觉快照进行断言的测试。Applitools提供了用于多种测试工具和框架(如Selenium、Cypress和Playwright)的Eyes SDK,用于捕获视觉快照。第一次运行测试时,Applitools Eyes会将初始快照作为基准图像上传到云端。然后,每次再次运行测试时,Applitools会捕获一个新的快照,称为检查点图像,并在云端使用视觉人工智能检测任何有意义的差异。
实际案例演示
本文将以Python+Selenium+Applitools Eyes SDK进行演示视觉AI测试。以Applitools官方提供的代码库为基础进行演示。步骤如下:
首先需要注册Applitools账号,账号注册完成后,会自动分配一个API key. 注册账号地址为:https://auth.applitools.com/users/register
可以从如下截图处获取API Key,(API key会在后续的步骤中使用)。
打开Github代码库:https://github.com/applitools/example-selenium-python-pytest
克隆代码到本地,并进入到项目主目录。
准备Python开发环境,最好是虚拟环境。
准备好最新版本的Chrome浏览器,并下载适配的chrome driver.
安装需要的Python类库,通过如下命令:
pip install -r requirements.txt
设置个人账号的API Key. 文件在conftest.py
可以通过执行如下命令,执行测试。
python3 -m pytest -s -v tests
测试完成后,会在控制台有如下的日志。
测试完成之后,可以通过点击控制台上的see details里面的链接进入到applitools eye捕获到的测试细节,特别是对UI的捕捉的细节。具体如下图:
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-06-11
AI提效99.5%!英国政府联手 Gemini,破解城市规划审批困局
2025-06-10
多模态 RAG VS 传统文本 RAG ,到底效果如何,从应用视角来测试下
2025-06-10
实战复盘 | 基于视觉模型的多模态 RAG 系统,我们踩过的坑与收获 (项目已开源)
2025-06-05
多模态模型在RagFlow中的应用
2025-06-04
清华首创多模态+知识图谱+RAG,问答精准度超 94%
2025-05-30
Deepseek 多模态来解析图片,结合上下文分析pdf文档
2025-05-28
Lovart再次证明:AI不是卖工具而是卖成果
2025-05-27
Dolphin-API:字节Dolphin多模态文档解析模型API化全攻略
2025-05-14
2025-03-26
2025-03-21
2025-04-27
2025-05-16
2025-05-08
2025-04-28
2025-04-05
2025-05-13
2025-05-15