小白也可以玩的Python爬虫库,收藏一下
off999 2025-07-10 20:00 104 浏览 0 评论
最近,微软开源了一个项目叫「playwright-python」,作为一个兴起项目,
出现后受到了大家热烈的欢迎,那它到底是什么样的存在呢?今天为你介绍一
下这个传说中的小白神器。
Playwright 是针对 Python 语言的纯自动化工具,它可以通过单个API自动
执行 Chromium,Firefox 和 WebKit 浏览器,连代码都不用写,就能实现
自动化功能。
虽然测试工具 selenium 具有完备的文档,但是其学习成本让一众小白们望而
却步,对比之下 playwright-python 简直是小白们的神器。
Playwright真的适用于Python吗?答案是肯定的,微软对于适用于Python的
Playwright已准备就绪。可能会发生API重大更改。但大概率是这种情况不会
发生,微软还表示仅在他们知道它可以改善您使用新库的体验时,才会可能这
样做。不过微软也提醒尚不支持特定于供应商的API的某些极端情况,例如收集
Chromium跟踪,覆盖率报告等。
1
、
Playwright介绍
Playwright是一个强大的Python库,仅用一个API即可自动执行
Chromium
、
Firefox
、
WebKit等主流浏览器自动化操作,并同时支持以无头
模式、有头模式运行。
Playwright提供的自动化技术是绿色的、功能强大、可靠且快速,支持
Linux
、
Mac以及Windows操作系统。
还有朋友这么夸:这个项目作为针对 Python 语言纯自动化的工具,解放了代
码,实现了自动化功能,我们来看看怎么用它吧。
2
、
Playwright使用
安装
Playwright的安装非常简单,两步解决。
安装playwright库
pip install playwright
安装浏览器驱动文件(安装过程稍微有点慢)
python -m playwright install
复制代码
上面两个pip操作分别安装:
安装Playwright依赖库,需要Python3.7+
安装Chromium、Firefox、WebKit等浏览器的驱动文件
录制
使用Playwright无需写一行代码,我们只需手动操作浏览器,它会录制我们的
操作,然后自动生成代码脚本。
下面就是录制的命令codegen,仅仅一行。
命令行键入 --help 可看到所有选项
python -m playwright codegen
复制代码
codegen的用法可以使用--help查看,如果简单使用就是直接在命令后面加上
url链接,如果有其他需要可以添加options。
python -m playwright codegen --help
Usage: index codegen [options] [url]
open page and generate code for user actions
Options:
-
o, --output <file name> saves the generated script to a file
--
target <language> language to use, one of javascript, python, python-async, csharp (default:
-
h, --help display help for command
Examples:
$
codegen
$
codegen --target=python
$
-
b webkit codegen https://example.com
复制代码
options含义:
-
o:将录制的脚本保存到一个文件
--
target:规定生成脚本的语言,有JS和Python两种,默认为Python
-
b:指定浏览器驱动
比如,我要在baidu.com搜索,用chromium驱动,将结果保存为my.py的
python文件。
python -m playwright codegen --target python -o 'my.py' -b chromium https://www.baidu.com
复制代码
命令行输入后会自动打开浏览器,然后可以看见在浏览器上的一举一动都会被
自动翻译成代码,如下所示。
结束后自动关闭浏览器,保存生成的自动化脚本到py文件。
from playwright import sync_playwright
def run(playwright):
browser = playwright.chromium.launch(headless=False)
context = browser.newContext()
# Open new page
page = context.newPage()
page.goto("https://www.baidu.com/")
page.click("input[name="wd"]")
page.fill("input[name="wd"]", "jingdong")
page.click("text="京东"")
# Click //a[normalize-space(.)='京东JD.COM官网 多快好省 只为品质生活']
with page.expect_navigation():
with page.expect_popup() as popup_info:
page.click("//a[normalize-space(.)='京东JD.COM官网 多快好省 只为品质生活']")
page1 = popup_info.value
# ---------------------
context.close()
browser.close()
with sync_playwright() as playwright:
run(playwright
此外,playwright还提供了同步和异步的API接口,文档如下。
链接:
https://microsoft.github.io/playwright-python/index.html
同步
下面示例代码:依次打开三个浏览器,前往baidu搜索,截图后退出。
from playwright import sync_playwright
with sync_playwright() as p:
for browser
_
type in [p.chromium, p.firefox, p.webkit]:
browser = browser
_
type.launch()
page = browser.newPage()
page.goto('https://baidu.com/')
page.screenshot(path=f'example-{browser_type.name}.png')
browser.close()
复制代码
异步
异步操作可结合asyncio同时进行三个浏览器操作。
import asyncio
from playwright import async_playwright
async def main():
async with async_playwright() as p:
for browser
_
type in [p.chromium, p.firefox, p.webkit]:
browser = await browser
_
type.launch()
page = await browser.newPage()
await page.goto('http://baidu.com/')
await page.screenshot(path=f'example-{browser_type.name}.png')
await browser.close()
asyncio.get_event_loop().run_until_complete(main())
复制代码
移动端
更厉害的是,playwright还可支持移动端的浏览器模拟。下面是官方文档提供
的一段代码,模拟在给定地理位置上手机iphone 11 pro上的Safari浏览器,
首先导航到maps.google.com,然后执行定位并截图。
from playwright import sync_playwright
with sync_playwright() as p:
iphone_11 = p.devices['iPhone 11 Pro']
browser = p.webkit.launch(headless=False)
context = browser.newContext(
**iphone_11,
locale='en-US',
geolocation={ 'longitude': 12.492507, 'latitude': 41.889938 }
,
permissions=['geolocation']
)
page = context.newPage()
page.goto('https://maps.google.com')
page.click('text="Your location"')
page.screenshot(path='colosseum-iphone.png')
browser.close()
复制代码
另外,还可以配合pytest插件一起使用,感兴趣可以自己试一下。
3
、
总结
、
总结
playwright相比已有的自动化测试工具有很多优势,其中有:
支持所有浏览器的
在Chromium,Firefox和WebKit上进行测试。Playwright拥有适用于所
有现代浏览器的完整API覆盖,包括Google Chrome和Microsoft
Edge(带有Chromium),Apple Safari(带有WebKit)和Mozilla
Firefox。
跨平台的WebKit测试。使用Playwright,使用适用于Windows,Linux
和macOS的WebKit构建,测试您的应用程序在Apple Safari中的行为。
在本地和CI上进行测试。
测试手机。使用设备仿真在移动Web浏览器中测试您的自适应Web应用程
序。
无报文头与有报文头。Playwright支持所有浏览器和所有平台的无头(无
浏览器UI)和有头(有浏览器UI)模式。有报文头模式适用于调试,而无报
文头适用于CI / cloud执行。
拥有快速可靠的执行
自动等待APIs。Playwright交互会自动等待直到元素准备就绪。这样可
以提高可靠性并简化测试编写流程。
无超时自动化。Playwright会接收浏览器信号,例如网络请求,页面导
航和页面加载事件,以消除导致睡眠中断的烦恼。
与浏览器上下文保持并行。对于多个并行孤立的浏览器上下文可执行环境
重复使用一个单独的浏览器实例。
弹性元素选择器。Playwright可以依靠面向用户的字符串(例如文本内
容和可访问性标签)来选择元素。这些字符串比紧耦合到DOM结构的选择
器更具弹性。
拥有强大的自动化功能
多个域,页面和框架。Playwright是一种进程外自动化驱动程序,不受
页面内JavaScript执行范围的限制,并且可以自动执行具有多个页面的方
案。
强大的网络控制。Playwright引入上下文范围的网络拦截以便进行终止
或者模拟网络请求。
现代网络功能。Playwright通过插入阴的选择器,地理位置,权
限,Web Worker和其他现代Web API支持Web组件。
涵盖所有场景的能力。支持文件下载和上传,进程外iframe,原生输入事
件,甚至是深色模式。
但它也有局限性
旧版Edge和IE11支持。Playwright不支持旧版Microsoft Edge或
IE11(弃用通知)。支持新的Microsoft Edge(在Chromium上)。
Java语言绑定:Playwright API目前无法在Java或Ruby中使用。这是
暂时的限制,因为Playwright旨在支持任何语言的绑定。
在真实的移动设备上进行测试:Playwright使用桌面浏览器来模拟移动
设备。
虽然有一些局限,但现在playwright 已经更新到了 1.7.0 版本,随着一代代
的更新,系统也会更为完善,作为一款小白神器,为大家省了那么多事情,我
们相信它的未来会越来越好。
相关推荐
- 云骑士装机大师官方网站(云骑士装机大师软件下载)
-
就是感觉正规吧,还有就是小白那种的比较多,专业店一忽悠就掏钱做系统了。懂装机的哪有花钱去装系统的不靠谱,因为会造成个人信息的泄露。云骑士装机大师是网络装机系统,在网络上能够实现一键装机,非常的简洁方便...
- 万能钥匙下载免费(安心上网万能钥匙下载免费)
-
行1.使用手机功能表中自带的浏览器上网,直接搜索需要的软件进行下载安装(下载安卓版本格式为apk)。2.使用电脑下载APK格式的安装包,连接数据线传输至手机,操作手机在应用程序-我的文件中找到安装包,...
- 500兆宽带用什么路由器(家用路由器什么牌子好 信号强)
-
1、飞鱼星千兆无线路由器家用2600M双频企业级高速穿墙500M光纤游戏加速VW1900/千兆双频/1900M/大型企业路由器无线500m推荐理由:可以提供企业级别的性能,空旷环境覆盖更广大,...
- xp系统怎么卸载软件(xp怎么卸载程序)
-
1、选中此电脑,点击鼠标右键。2、选择属性点击一下。3、在打开的界面选择控制面板。4、点击程序选项下方的卸载。5、选择要卸载的程序软件,点击鼠标右键。6、点击弹出的选项卸载/更改。7、也可以使用电脑管...
- 笔记本电脑系统修复软件(笔记本电脑程序修复)
-
1、超级兔子2013系统修复软件超级兔子是一款完整的系统维护工具。拥有电脑系统评测、垃圾清理和注册表清理、可疑文件和插件检测、网页防护等功能,同时自带一些实用的系统工具,可清理你大多数的文件、注册表里...
- 联想保修服务包括哪些(联想保修都保修什么)
-
1、保修36个月的硬件包括:CPU、内存。2、保修24个月的硬件包括:主板、显卡、LCD屏、硬盘、电源适配器、键盘、鼠标模块。3、保修12个月的硬件包括:LCD之附件、光驱、DVD、CDR/W、软驱...
- 系统科学大会(中国系统科学学会)
-
2021年各种科学大会的召开时间取决于疫情的发展和国家政策的调整。一些大型的国际科学会议可能会推迟或者采用线上形式进行,以保障参会人员的安全和健康。同时,一些国内的学术会议也会受到疫情的影响,需要推迟...
- win10系统下载的内容在哪(win10下载的软件在哪个文件夹)
-
进入C:\Windows\SoftwareDistribution\Download目录下,通过win10应用商店中下载的安装包都放在此目录下。进入C:\Windows\SoftwareDistrib...
- 下载原版xp系统光盘(xp光盘系统安装教程怎么安装)
-
方法步骤步骤如下:1、首先打开计算机,在电脑光驱上放入XP光盘,启动电脑后不停按F12、F11、Esc等启动热键,在弹出的启动菜单中选择DVD选项,回车。2、进入光盘主菜单,按数字2或点击选项2运行w...
- windows7中文版下载安装(windows7安装包下载)
-
谢邀,如果你戳设置-时间和语言-区域和语言,右边的语言提示“只允许使用一种语言包”,那么你的系统就是家庭中文版。家庭中文版限定系统界面只能使用简体中文显示,其他功能则与普通家庭版没有区别,也可以使用其...
- win7开机按f2怎么重装系统(win7开机按f12怎么重装系统)
-
开机或重启时,在进入Windows前按F2进入BIOS。 ←→移动到第三个好像是BOOT。 然后将EXTENELBOOT选项设置为ENABLE 最后按F5将第一启动项目设置为EXTENEL...
-
- win10驱动管理(win10驱动程序)
-
win10由于联网后会自动安装驱动,如果自动安装驱动没出现问题,即可视为最佳驱动,若出现问题,卸载出问题的驱动,然后去查自己主板型号,在主板供应商官网下载对应驱动即是最佳01Windows10驱动更新调整当前当你插入连接即插即用(Pn...
-
2025-12-29 05:51 off999
- 手机上怎么找qq邮箱登录(用手机怎么找到qq邮箱)
-
入口是“联系人”选项卡。qq邮箱手机在QQ主菜单中选择下方的“联系人”选项卡;3、在“联系人”中选取“公众号”选项卡;4、在公众号中菜单中找到或搜索“QQ邮箱提醒”,点击进入;5、点击“进入邮箱”;6...
- amd显卡控制面板
-
AMD显卡控制面板是用来管理你的AMD显卡的,可以在控制面板中进行设置一些简单的调整,来提升显卡性能和效果。1、先打开AMD控制面板。2、打开“垂直同步(V-SYNC)”功能,可调整细节,改善影像流畅...
- win10老是未响应卡死(window10总是未响应)
-
具体方法:1、如果win10中的应用程序出现不响应的情况,应该是应用程序加载失败了。可以通过重置方法来解决win10应用程序无响应。2、登录win10系统,用管理员身份运行Powershell(可在C...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
python入门到脱坑 输入与输出—str()函数
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
失业程序员复习python笔记——条件与循环
-
系统u盘安装(win11系统u盘安装)
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
