五分钟轻松掌握 Python 自动化测试 Selenium
off999 2025-07-28 19:39 46 浏览 0 评论
一、Selenium
selenium 是一个老牌的测试工具和自动化工具,它的用途非常多,掌握这么技能绝对是值得,并且如果有需要切换其他的技术,大致应该是相似的,也就是说从它迁移到别的工具是轻松的。
二、为什么 Selenium 需要驱动器呢?
有些网站渲染的内容是在页面渲染之后,通过 js 加载数据然后更新内容。在此之前我们拿不到页面的内容。我们可以通过浏览器驱动器来操作浏览器获取到页面的内容。再来看看 Selenium 的架构:
三、浏览器驱动器
Selenium 在运行之前需要驱动器,下面是不同浏览器的驱动器:
- chrome 驱动器下载地址
- firefox 驱动器下载地址
- edge 驱动器下载地址
- safari 官方文档
下载的需要注意版本:不同的浏览器对应不同的, 考虑大概率会用 chrome 但是对于高于 Chrome 115 版本的, chrome 会给你一个 json 端点,自己找需要的版本下载。
下载后,记录文件位置 例如 windows 下: "D:\web-driver\chrome-win64\chrome.exe", chrome 的驱动器在 11.7M 左右,复制一份放在自己的目录下也不大。
四、在 Chrome 中使用 WebDriver 进行测试
selenium 核心就是要得到驱动器 driver,所有的操作都是在驱动器上使用的:
from selenium import webdriver
# 指定驱动程序的位置
driver_path = 'C:\Users\Administrator\Desktop\chromedriver' # 修改为你的驱动程序路径
driver = webdriver.Chrome(executable_path=driver_path)
driver.get("http://example.com") # 打开网页
print(driver.title) # 打印页面标题
driver.quit() # 关闭浏览器这段代码也很好解释,webdriver 使用 Chrome 驱动。驱动使用 get 方法获取页面内容,然后打印驱动对象上页面的 title, 然后驱动关闭六浏览器。
Chrome 驱动的参数 Opiton
前面我们使用 Chrome 驱动,其实 Chrome 驱动还可以传递众多参数,驱动时 chrome opiton 的一些配置配置参数:
chrome_options.add_argument("--headless") # 无头模式
chrome_options.add_argument("--disable-gpu") # 禁用 gpu 加速
chrome_options.add_argument("--window-size=1920,1080") # 指定窗口大小
chrome_options.add_argument("--disable-extensions") # 禁用扩展
chrome_options.add_argument("--no-sandbox") # 禁用沙盒
chrome_options.add_argument("--ignore-certificate-errors") # 忽略证书错误
chrome_options.add_argument("--proxy-server=http://proxyserver:port") # 设置代理
chrome_options.add_argument("--disable-popup-blocking") #禁用弹出窗口阻止
chrome_options.add_argument("--start-maximized") # 启动时最大化窗口
chrome_options.add_argument("--disable-notifications") # 禁用通知
chrome_options.add_argument("--disable-infobars") #禁用信息栏
chrome_options.add_argument("--user-data-dir=/path/to/profile") # 指定用户数据目录
chrome_options.add_argument("--disable-restore-session-state") # 禁用崩溃恢复提示
chrome_options.add_argument("--mute-audio") # 静音音频五、页面动态内容的加载
Selenium 处理动态内容是常见的需求,等待 JavaScript 动态加载。如果没有等待内容加载完毕,那么查找元素可能会导致错误。原因也很简单,就是没有加载完成。
等待也可以分为不同的层级,web deriver API 级别的。Python 等待以及页面级的等待。
WebDriverWait 等待
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
# 初始化 WebDriver
driver = webdriver.Chrome()
# 打开网页
driver.get('http://example.com')
# 显式等待,等待某个元素可见
element = WebDriverWait(driver, 10).until(
EC.visibility_of_element_located((By.ID, 'dynamicElementId'))
)
# 对元素执行操作
element.click()driver.find_element 显示等待
driver = webdriver.Chrome()
driver.implicitly_wait(10) # 全局等待 10 秒
driver.get('http://example.com')
# 如果元素还没准备好,WebDriver 将等待,直到找到元素或超时
element = driver.find_element(By.ID, 'dynamicElementId')
element.click()time.sleep() Python 等待(不推荐)
import time
driver = webdriver.Chrome()
driver.get('http://example.com')
time.sleep(5) # 强制等待 5 秒
element = driver.find_element(By.ID, 'dynamicElementId')
element.click()页面级等待
from selenium.webdriver.support.ui import WebDriverWait
# 等待页面完全加载,通过检查 JavaScript 变量
WebDriverWait(driver, 10).until(
lambda driver: driver.execute_script('return document.readyState') == 'complete'
)有了对 selenium 的基础使用和认识,我们就需要较为全面的了解 selenium 的 api 了,当我们对其 api 有较为全面的了解,我们很快就能入手了。
六、selenium 浏览器操作
- driver.get(url) 打开指定的 URL。
- driver.quit() 关闭浏览器并结束 WebDriver 会话。
- driver.close() 关闭当前窗口。
- driver.maximize_window() 最大化浏览器窗口。
- driver.execute_script(script) 执行 JavaScript 脚本。
七、元素定位
- driver.find_element(By.ID, id) 通过 ID 定位元素。
- driver.find_element(By.NAME, name) 通过 NAME 定位元素。
- driver.find_element(By.XPATH, xpath) 通过 XPath 定位元素。
- driver.find_element(By.CSS_SELECTOR, selector) 通过 CSS 选择器定位元素。
- driver.find_elements(By.CLASS_NAME, class_name) 定位所有符合类名的元素,返回列表。
八、元素操作
- element.click() 点击元素。
- element.send_keys(keys) 向元素输入文本。
- element.clear() 清空输入框的内容。
- element.get_attribute(attribute) 获取元素的属性值。
- element.get_text() 获取元素的文本内容。
- element.is_displayed() 检查元素是否显示。
九、等待操作
- driver.implicitly_wait(time) 设置全局隐式等待时间。
- WebDriverWait(driver, time).until(condition) 显式等待指定的条件。
十、窗口与导航
- driver.back() 导航到前一个页面。
- driver.forward() 导航到下一个页面。
- driver.refresh() 刷新当前页面。
- driver.switch_to.frame(frame) 切换到指定的 iframe。
- driver.switch_to.alert() 切换到 alert 对话框。
- driver.switch_to.window(window_name) 切换到指定的窗口。
十一、常用功能
处理 Cookie
cookies = driver.get_cookies()
driver.add_cookie({'name': 'cookie_name', 'value': 'cookie_value'})
driver.delete_all_cookies()截图
driver.save_screenshot('screenshot.png')上传图片
file_input = driver.find_element(By.NAME, 'file_upload') file_input.send_keys('/path/to/file.txt')执行 JS
# 执行 js 脚本
driver.execute_script("alert('Hello, World!');")
# 从 localstorage 中获取 token
token = driver.execute_script("return localStorage.getItem('auth_token');") print(f"Token: {token}")
# 获取元素 css 属性
element = driver.find_element(By.ID, 'element_id')
background_color = driver.execute_script("return window.getComputedStyle(arguments[0]).backgroundColor;", element)十二、Selenium 与 XPATH
虽然页面里面使用 css 选择器更加靠近 web 端,但是 xpath 在查找元素和定位时更加直接,简单高效。前面已经介绍 api 了,下面是一个实例:
from selenium import webdriver
from selenium.webdriver.common.by import By
driver = webdriver.Chrome()
driver.get("https://example.com")
# 使用 XPath 查找元素
element = driver.find_element(By.XPATH, "//div[@id='main-content']//h1")
print(element.text)find_element 第一个参数指定 By.XPATH,后面传入 xpath 字符串即可,也是特别方便。
十三、selenium 与爬虫
得益于 selenium 能够直接访问实际页面,动态加载数据爬虫也有的重要作用。它可以弥补传统爬虫工具的不足,抓取由 JavaScript 渲染的内容。但要注意的是,它的性能相对较低,不适合大规模数据抓取。
十四、小结
本文主要介绍了 Selenium 相关内容,主要涉及 Selenium 知识面,从开始的 Python 小案例,到后面的 API 全面了解,以及 Selenium 的常用功能,到最后的 XPATH 以及爬虫的认知。这些内容已经能够全面,且具有实践性。
作者:编程杂货铺
链接:
https://juejin.cn/post/7402328037390123071
相关推荐
- win10解绑管理员账户(win10管理员账户怎么取消开机密码)
-
要解除Windows10电脑上的管理员权限,您需要进行以下操作:1.打开“控制面板”:右键单击“开始”按钮,然后选择“控制面板”。2.进入“用户账户”:在控制面板中,选择“用户账户”。3.点击...
- win10家庭版没有组策略编辑器
-
Win10组策略编辑器找不到怎么办 解决方法 一、win10系统版本本身不提供组策略的功能。 1、运行gpedit.msc直接提示找到gpedit.msc(组策略)。 2、运行MMC,在“添加...
- tplogin管理员登录入口(tplogin重新设置密码)
-
tplogin.cn是新版tplink路由器的登录地址(管理页面地址),在浏览器中输入tplogin.cn,就可以打开tplink路由器的管理页面(登录页面)。具体的登录方法如下:1、打开电脑上的浏...
- psp模拟器怎么导入游戏(psp模拟器怎么导入游戏 Vivo手机)
-
方法如下:1、打开能操作文件的助手软件,用pp链接后点击左下文件,然后点常用目录下的程序用户,会出现ppsspp的文件夹。2、打开ppsspp文件夹,会出来四个选项文件夹,第一个进去后是psp文件夹,...
- 电脑系统怎样升级(电脑系统怎么升级)
-
电脑系统升级方法步骤,1、打开电脑,点击电脑左下角的开始菜单,在弹出的菜单选项中选择“控制面板”。2、点击“开始”,点击“控制面板”3、在控制面板中,点击“系统和安全”。4、点击启用或禁用自动更新。5...
- windows无法激活(windows无法激活有什么影响)
-
1.如果修复或重新组装了电脑,则可能是安装了不同版本的Windows。或者,如果在修复过程中为电脑使用了其他产品密钥,当使用该密钥的电脑数大于Microsoft软件许可条款允许的电脑数时,该密钥...
-
- u盘文件恢复软件免费(恢复u盘数据免费的软件)
-
u盘损坏文件恢复方法:1、打开电脑桌面的“计算机”或“我的电脑”。2、然后再找到需要修复的u盘。3、打开“运行”窗口(可以直接按“Windows+R”快捷打开),输入“CMD”并点击“确定”按钮以进入命令提符界面。4、从打开的“命令提示符”...
-
2025-12-28 22:03 off999
- 电脑uac是什么意思
-
UAC就是用户帐户控制,在对计算机进行更改之前,用户帐户控制(UAC)会通知您。比如安装软件驱动什么的,默认UAC设置会在程序尝试对计算机进行更改时通知您,但您可以通过调整设置来控制UAC...
- 笔记本找不到自己家的wifi怎么办
-
1.笔记本电脑缺少无线网卡驱动,需要下载驱动如果笔记本电脑开机之后,无法显示WiFi网络的图标,这个时候多半是因为电脑缺少无线网卡驱动造成的,有时候自己在清理电脑的时候,不小心清理了驱动程序,便会...
- 电信宽带办理电话是多少(电信宽带办理联系电话)
-
电信宽带不一定需要电信手机号码,可以根据自身需要选择,有单独的宽带业务,一般要求预存一定时间的使用费。不过一般包含了宽带、手机号码的融合套餐总体上更优惠,对客户来说更划算。如果有相应需求的话,建议同时...
- 开机进入ghost启动项(电脑启动进入ghost)
-
电脑启动的时候进入GHOST界面方法: 1、首先确认电脑装了GHOST软件。 2、重启电脑,注意仔细观察电脑屏幕,会有一个3s或者10s的选择界面。让选择是进入GHOST界面,或者正常启动进入系...
- 华硕bios修复蓝屏图解(华硕bios修复蓝屏视频教程)
-
先看下BIOS是否可以识别到硬盘设备,若看不到,硬盘故障的可能性很大。若可以看到硬盘,建议先尝试进行BIOS兼容性设置:1,在BIOS界面,通过方向键进【Secure】菜单,通过方向键选择【Sec...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
python入门到脱坑 输入与输出—str()函数
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
失业程序员复习python笔记——条件与循环
-
系统u盘安装(win11系统u盘安装)
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
