百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

小白也可以玩的Python爬虫库,收藏一下

off999 2025-07-10 20:00 104 浏览 0 评论

最近,微软开源了一个项目叫「playwright-python」,作为一个兴起项目,

出现后受到了大家热烈的欢迎,那它到底是什么样的存在呢?今天为你介绍一

下这个传说中的小白神器。

Playwright 是针对 Python 语言的纯自动化工具,它可以通过单个API自动

执行 Chromium,Firefox 和 WebKit 浏览器,连代码都不用写,就能实现

自动化功能。

虽然测试工具 selenium 具有完备的文档,但是其学习成本让一众小白们望而

却步,对比之下 playwright-python 简直是小白们的神器。

Playwright真的适用于Python吗?答案是肯定的,微软对于适用于Python的

Playwright已准备就绪。可能会发生API重大更改。但大概率是这种情况不会

发生,微软还表示仅在他们知道它可以改善您使用新库的体验时,才会可能这

样做。不过微软也提醒尚不支持特定于供应商的API的某些极端情况,例如收集

Chromium跟踪,覆盖率报告等。

1

Playwright介绍

Playwright是一个强大的Python库,仅用一个API即可自动执行

Chromium

Firefox

WebKit等主流浏览器自动化操作,并同时支持以无头

模式、有头模式运行。

Playwright提供的自动化技术是绿色的、功能强大、可靠且快速,支持

Linux

Mac以及Windows操作系统。

还有朋友这么夸:这个项目作为针对 Python 语言纯自动化的工具,解放了代

码,实现了自动化功能,我们来看看怎么用它吧。

2

Playwright使用

安装

Playwright的安装非常简单,两步解决。

安装playwright库

pip install playwright

安装浏览器驱动文件(安装过程稍微有点慢)

python -m playwright install

复制代码

上面两个pip操作分别安装:

安装Playwright依赖库,需要Python3.7+

安装Chromium、Firefox、WebKit等浏览器的驱动文件

录制

使用Playwright无需写一行代码,我们只需手动操作浏览器,它会录制我们的

操作,然后自动生成代码脚本。

下面就是录制的命令codegen,仅仅一行。

命令行键入 --help 可看到所有选项

python -m playwright codegen

复制代码

codegen的用法可以使用--help查看,如果简单使用就是直接在命令后面加上

url链接,如果有其他需要可以添加options。

python -m playwright codegen --help

Usage: index codegen [options] [url]

open page and generate code for user actions

Options:

-

o, --output <file name> saves the generated script to a file

--

target <language> language to use, one of javascript, python, python-async, csharp (default:

-

h, --help display help for command

Examples:

$

codegen

$

codegen --target=python

$

-

b webkit codegen https://example.com

复制代码

options含义:

-

o:将录制的脚本保存到一个文件

--

target:规定生成脚本的语言,有JS和Python两种,默认为Python

-

b:指定浏览器驱动

比如,我要在baidu.com搜索,用chromium驱动,将结果保存为my.py的

python文件。

python -m playwright codegen --target python -o 'my.py' -b chromium https://www.baidu.com

复制代码

命令行输入后会自动打开浏览器,然后可以看见在浏览器上的一举一动都会被

自动翻译成代码,如下所示。

结束后自动关闭浏览器,保存生成的自动化脚本到py文件。

from playwright import sync_playwright

def run(playwright):

browser = playwright.chromium.launch(headless=False)

context = browser.newContext()

# Open new page

page = context.newPage()

page.goto("https://www.baidu.com/")

page.click("input[name="wd"]")

page.fill("input[name="wd"]", "jingdong")

page.click("text="京东"")

# Click //a[normalize-space(.)='京东JD.COM官网 多快好省 只为品质生活']

with page.expect_navigation():

with page.expect_popup() as popup_info:

page.click("//a[normalize-space(.)='京东JD.COM官网 多快好省 只为品质生活']")

page1 = popup_info.value

# ---------------------

context.close()

browser.close()

with sync_playwright() as playwright:

run(playwright

此外,playwright还提供了同步和异步的API接口,文档如下。

链接:
https://microsoft.github.io/playwright-python/index.html

同步

下面示例代码:依次打开三个浏览器,前往baidu搜索,截图后退出。

from playwright import sync_playwright

with sync_playwright() as p:

for browser

_

type in [p.chromium, p.firefox, p.webkit]:

browser = browser

_

type.launch()

page = browser.newPage()

page.goto('https://baidu.com/')

page.screenshot(path=f'example-{browser_type.name}.png')

browser.close()

复制代码

异步

异步操作可结合asyncio同时进行三个浏览器操作。

import asyncio

from playwright import async_playwright

async def main():

async with async_playwright() as p:

for browser

_

type in [p.chromium, p.firefox, p.webkit]:

browser = await browser

_

type.launch()

page = await browser.newPage()

await page.goto('http://baidu.com/')

await page.screenshot(path=f'example-{browser_type.name}.png')

await browser.close()

asyncio.get_event_loop().run_until_complete(main())

复制代码

移动端

更厉害的是,playwright还可支持移动端的浏览器模拟。下面是官方文档提供

的一段代码,模拟在给定地理位置上手机iphone 11 pro上的Safari浏览器,

首先导航到maps.google.com,然后执行定位并截图。

from playwright import sync_playwright

with sync_playwright() as p:

iphone_11 = p.devices['iPhone 11 Pro']

browser = p.webkit.launch(headless=False)

context = browser.newContext(

**iphone_11,

locale='en-US',

geolocation={ 'longitude': 12.492507, 'latitude': 41.889938 }

,

permissions=['geolocation']

)

page = context.newPage()

page.goto('https://maps.google.com')

page.click('text="Your location"')

page.screenshot(path='colosseum-iphone.png')

browser.close()

复制代码

另外,还可以配合pytest插件一起使用,感兴趣可以自己试一下。

3

总结

总结

playwright相比已有的自动化测试工具有很多优势,其中有:

支持所有浏览器的

在Chromium,Firefox和WebKit上进行测试。Playwright拥有适用于所

有现代浏览器的完整API覆盖,包括Google Chrome和Microsoft

Edge(带有Chromium),Apple Safari(带有WebKit)和Mozilla

Firefox。

跨平台的WebKit测试。使用Playwright,使用适用于Windows,Linux

和macOS的WebKit构建,测试您的应用程序在Apple Safari中的行为。

在本地和CI上进行测试。

测试手机。使用设备仿真在移动Web浏览器中测试您的自适应Web应用程

序。

无报文头与有报文头。Playwright支持所有浏览器和所有平台的无头(无

浏览器UI)和有头(有浏览器UI)模式。有报文头模式适用于调试,而无报

文头适用于CI / cloud执行。

拥有快速可靠的执行

自动等待APIs。Playwright交互会自动等待直到元素准备就绪。这样可

以提高可靠性并简化测试编写流程。

无超时自动化。Playwright会接收浏览器信号,例如网络请求,页面导

航和页面加载事件,以消除导致睡眠中断的烦恼。

与浏览器上下文保持并行。对于多个并行孤立的浏览器上下文可执行环境

重复使用一个单独的浏览器实例。

弹性元素选择器。Playwright可以依靠面向用户的字符串(例如文本内

容和可访问性标签)来选择元素。这些字符串比紧耦合到DOM结构的选择

器更具弹性。

拥有强大的自动化功能

多个域,页面和框架。Playwright是一种进程外自动化驱动程序,不受

页面内JavaScript执行范围的限制,并且可以自动执行具有多个页面的方

案。

强大的网络控制。Playwright引入上下文范围的网络拦截以便进行终止

或者模拟网络请求。

现代网络功能。Playwright通过插入阴的选择器,地理位置,权

限,Web Worker和其他现代Web API支持Web组件。

涵盖所有场景的能力。支持文件下载和上传,进程外iframe,原生输入事

件,甚至是深色模式。

但它也有局限性

旧版Edge和IE11支持。Playwright不支持旧版Microsoft Edge或

IE11(弃用通知)。支持新的Microsoft Edge(在Chromium上)。

Java语言绑定:Playwright API目前无法在Java或Ruby中使用。这是

暂时的限制,因为Playwright旨在支持任何语言的绑定。

在真实的移动设备上进行测试:Playwright使用桌面浏览器来模拟移动

设备。

虽然有一些局限,但现在playwright 已经更新到了 1.7.0 版本,随着一代代

的更新,系统也会更为完善,作为一款小白神器,为大家省了那么多事情,我

们相信它的未来会越来越好。

相关推荐

云骑士装机大师官方网站(云骑士装机大师软件下载)

就是感觉正规吧,还有就是小白那种的比较多,专业店一忽悠就掏钱做系统了。懂装机的哪有花钱去装系统的不靠谱,因为会造成个人信息的泄露。云骑士装机大师是网络装机系统,在网络上能够实现一键装机,非常的简洁方便...

万能钥匙下载免费(安心上网万能钥匙下载免费)

行1.使用手机功能表中自带的浏览器上网,直接搜索需要的软件进行下载安装(下载安卓版本格式为apk)。2.使用电脑下载APK格式的安装包,连接数据线传输至手机,操作手机在应用程序-我的文件中找到安装包,...

500兆宽带用什么路由器(家用路由器什么牌子好 信号强)

1、飞鱼星千兆无线路由器家用2600M双频企业级高速穿墙500M光纤游戏加速VW1900/千兆双频/1900M/大型企业路由器无线500m推荐理由:可以提供企业级别的性能,空旷环境覆盖更广大,...

xp系统怎么卸载软件(xp怎么卸载程序)

1、选中此电脑,点击鼠标右键。2、选择属性点击一下。3、在打开的界面选择控制面板。4、点击程序选项下方的卸载。5、选择要卸载的程序软件,点击鼠标右键。6、点击弹出的选项卸载/更改。7、也可以使用电脑管...

笔记本电脑系统修复软件(笔记本电脑程序修复)

1、超级兔子2013系统修复软件超级兔子是一款完整的系统维护工具。拥有电脑系统评测、垃圾清理和注册表清理、可疑文件和插件检测、网页防护等功能,同时自带一些实用的系统工具,可清理你大多数的文件、注册表里...

联想保修服务包括哪些(联想保修都保修什么)

1、保修36个月的硬件包括:CPU、内存。2、保修24个月的硬件包括:主板、显卡、LCD屏、硬盘、电源适配器、键盘、鼠标模块。3、保修12个月的硬件包括:LCD之附件、光驱、DVD、CDR/W、软驱...

系统科学大会(中国系统科学学会)

2021年各种科学大会的召开时间取决于疫情的发展和国家政策的调整。一些大型的国际科学会议可能会推迟或者采用线上形式进行,以保障参会人员的安全和健康。同时,一些国内的学术会议也会受到疫情的影响,需要推迟...

win10系统下载的内容在哪(win10下载的软件在哪个文件夹)

进入C:\Windows\SoftwareDistribution\Download目录下,通过win10应用商店中下载的安装包都放在此目录下。进入C:\Windows\SoftwareDistrib...

下载原版xp系统光盘(xp光盘系统安装教程怎么安装)

方法步骤步骤如下:1、首先打开计算机,在电脑光驱上放入XP光盘,启动电脑后不停按F12、F11、Esc等启动热键,在弹出的启动菜单中选择DVD选项,回车。2、进入光盘主菜单,按数字2或点击选项2运行w...

windows7中文版下载安装(windows7安装包下载)

谢邀,如果你戳设置-时间和语言-区域和语言,右边的语言提示“只允许使用一种语言包”,那么你的系统就是家庭中文版。家庭中文版限定系统界面只能使用简体中文显示,其他功能则与普通家庭版没有区别,也可以使用其...

win7开机按f2怎么重装系统(win7开机按f12怎么重装系统)

开机或重启时,在进入Windows前按F2进入BIOS。  ←→移动到第三个好像是BOOT。  然后将EXTENELBOOT选项设置为ENABLE  最后按F5将第一启动项目设置为EXTENEL...

win10驱动管理(win10驱动程序)
win10驱动管理(win10驱动程序)

win10由于联网后会自动安装驱动,如果自动安装驱动没出现问题,即可视为最佳驱动,若出现问题,卸载出问题的驱动,然后去查自己主板型号,在主板供应商官网下载对应驱动即是最佳01Windows10驱动更新调整当前当你插入连接即插即用(Pn...

2025-12-29 05:51 off999

手机上怎么找qq邮箱登录(用手机怎么找到qq邮箱)

入口是“联系人”选项卡。qq邮箱手机在QQ主菜单中选择下方的“联系人”选项卡;3、在“联系人”中选取“公众号”选项卡;4、在公众号中菜单中找到或搜索“QQ邮箱提醒”,点击进入;5、点击“进入邮箱”;6...

amd显卡控制面板

AMD显卡控制面板是用来管理你的AMD显卡的,可以在控制面板中进行设置一些简单的调整,来提升显卡性能和效果。1、先打开AMD控制面板。2、打开“垂直同步(V-SYNC)”功能,可调整细节,改善影像流畅...

win10老是未响应卡死(window10总是未响应)

具体方法:1、如果win10中的应用程序出现不响应的情况,应该是应用程序加载失败了。可以通过重置方法来解决win10应用程序无响应。2、登录win10系统,用管理员身份运行Powershell(可在C...

取消回复欢迎 发表评论: