Python爬虫S08 - http post请求的数据爬取
off999 2024-11-12 12:01 40 浏览 0 评论
今天开始第八关的爬钟实战。
·先看这个页面,从这个页面看起来内容跟之前最简单的第一、第二关没有太大的区别,现在这样的看不出来到底里面有什么玄机。同样的就跟之前那个套路一样,找一个类似的关卡把代码复制一下。
·看这样的页面就选第二关,为什么?是因为它的样式跟第二关都差不多。复制一下,新建一个,把它捏进去,先把其他的关了,然后把url改一下。
·第八关如果之前大家有看就知道之前那些都会有关卡的数字在这里,现在这里没有,所以就要注意了到底是需要怎么样去处理。现在先不管这个问题,先把一些准备工作做一下,把这些代码改好了,也给它配一个。
·这里出现,因为这是刚才测试的时候出的,然后就配一下执行。这时候试一下,就去执行一下脚本,看到没有?好像是抓到数据了,就去核对一下到底是不是这些数据,就看一下抓出来这个圆码。
·因为这几关用的数据都是一样,如果光看数据是看不出来,所以要往上翻一下,因为它有关卡标识。看到这里把第一关给抓下来了,现在抓的不是第二,第八关想要的没有抓下来,就说明代码是不对的,没有拿到想要的东西。
·刚才也看到了改的东西其实是不会影响去抓的,也就是代码在逻辑上面是没有错的,有可能就是第八关是不是设置了一些什么东西让我们抓不到。刚才也提醒了一下url跟之前的不太一样,可能就要从这里入手去分析一下。
·接下来也是同样的套路F12,F12之前也有粉丝私信说在电脑上面不管怎么按F12,工具就是出不来,其实往这个里叫做开发者工具,可以在菜单那里去点,去菜单那里去找。这里是一个,在菜单那里就会有能够找到开发者工具,就是通过菜单或者快捷键(Ctrl+Shift+1)就能把它调用出来,是一样的。
·现在就是回到正题上面,同样的把它切换到network那里,然后再点一下第八关,看一下浏览器发出的一些请求。看鼠标放上去,看到url,就知道其实它发出了请求,主要是这个就先打开它看一下,看到这里其实要仔细观察一下就能看到,看到没有,是用的post,可以到代码里面是用的get,明白吧?之前其实所有的都是用get,之前用的都是用get。
这个requests要怎么做?使百度一下就有,本身快手的官方文档里面就有requests,把它加上去就可以了,就要分析它的参数是什么,继续往下分析,把它拉大一点,这个是headers,这个也是headers,这个是返回的headers,这是请求的headers,下面有个form data,看到没有?level8,level8就是第8关的参数了,要怎么做?
就可以去看,payload是要一个字典(类型),同样的也给它加个payload,然后data等于刚刚设置的pro,这里就不能是get,应该是post,就试一下,同样的有数据下来,再往上翻一下看一下关卡的数字到底是刚才的一二,是到了正确的八。
可以看到现在拿下来的已经是第八关了,其实就相当于只是换了一个请求方式,请求方式接下来这些解释了就不用看了,因为整个页面都是一样的。比如现在看第八关,抓下来数据都是一样的,因为这一关其实考察的不是这个解释,就是要找到pose相关的数请求方式跟参数。
其实这种为什么只是换了一个get或者或是一个pose这么简单,为什么要单独把它拿出来?这是因为在登录的操作里面一般来说是要用pose的,所以这个词是非常重要。
另外一个就是有一些数据,就是为了安全或者其他的一些原因,也是用pose这种方式去查或者是lasfold之类的,是get、post、put,这些都是对应不同的操作,所以这个就是浏览器除了get还有很多很多,还有好几个请求方式,就包括刚才说的那种,是每一种方式都有可能还需用到,所以用工具去调试的时候就要去注意一下这个位置,不是每次把url拷过去,然后用requestget一下就能拿得到了,有可能这里就是post或者post之类的方式,这是一个注意的点。
接下来其他就没有什么好说的,这个就是调试去找参数的问题。也说一下工具,其实工具有时候就是直接从这一行就能看得出来。怎么看?现在看这几列是没有,其实在它上面右键就可以选择要显示的那种,把这个勾起来直接就可以看得到这里,很明显这个是pose,就不用再往里面翻也可以。
这种就看每一个的操作习惯,甚至有一些可能在这边、在这里是看不到的,或者要去过滤一些东西,可以在这些选项里面对应一个个去找。其实这个工具是非常好用的,特别是后期可能要讲到一些比较复杂的一些东西,要熟练的掌握这一些东西,当然也不只是这些工具。
今天的就到这里了。
相关推荐
- 怎样打开cdr文件(.cdr用什么打开)
-
cdr是什么文件?cdr文件用什么打开?cdr文件是CorelDraw图像制作软件标准的输出格式,与photoshop(PS)图片设计软件类似都属于图片设计软件,需要打开cdr文件我们就需要先了解C...
- 微软拼音输入法好用吗(微软拼音输入法好用吗知乎)
-
CTRL(Control)组合键;Ctrl+Alt+A(截屏);Ctrl+A(All)全选;Ctrl+C(Copy)复制;Ctrl+V粘贴Ctrl+S保存,窗口...
- 怎么设置屏保密码(怎么设置屏保密码和锁定时间)
-
屏保密码设置的方法步骤1、鼠标左键单击桌面下的【开始】菜单键;点击【控制面板】;2、点击【外观和个性化】;然后点击【个性化】选项卡中的【更改屏幕保护程序】;3、选择一个自己喜欢的程序,勾选,然后再点击...
- 无法下载ie浏览器怎么办(ie浏览器显示无法下载)
-
如果您在使用IE浏览器时遇到无法下载的问题,以下是一些常见的解决办法:1.清除浏览器缓存:打开IE浏览器,依次点击工具(齿轮图标)->Internet选项->常规选项->...
- 笔记本w7可以升级w10吗(笔记本w7可以升级w10吗)
-
要将wln7升级到win10,需要先确保计算机配置符合win10的最低要求,包括处理器、内存、硬盘空间等。然后,可以下载win10的升级助手或镜像文件,在升级前备份重要数据,选择需要保留的文件和设置,...
-
- 如何卸载电脑浏览器软件(怎样卸载电脑浏览器)
-
如果我们发现我们从浏览器里面下载的东西删不了,这个时候,我们就可能是由于下载到了了一些病毒软件或者是病毒程序而导致的,如果说想要解决这个问题,方法的话也很简单,我们可以通过杀毒软件对其进行杀毒,然后再进行卸载,基本上就可以删除了。app卸载...
-
2025-11-18 09:51 off999
- 联想怎么看电脑配置和型号(联想怎么看电脑配置和型号笔记本)
-
笔记本看型号有推荐三种方法:第一种,点击你笔记本上的(开始),然后找到(运行)打开,在里面的输入框里输入(dxdiag)点击确定,你就可以看见笔记本型号,系统型号等笔记本信息。第二种,就是在你的电脑上...
- 怎么ghost电脑系统(怎样ghost)
-
使用GHOST软件备份系统即可。1、网上下载一键GOST安装好,重启电脑运行一键gost-选择手动进入GOST。2、进入GHOST的操作界面,点OK。3、选择菜单到Local(本机)--Partiti...
- u盘读取软件下载(u盘读取器下载)
-
手机播放U盘里的视频不用刻意的去安装什么播放器,一般手机里自带的播放器就能够直接播放U盘里的一般常见的视频。只要你要播放的视频,都是平时在电脑上或者电视上能够正常播放的视频,一般在手机里面它的系统自带...
- office2020安装包百度云下载
-
Office2020和Office2019是微软的办公套件产品,两个版本之间有以下区别:1.发布时间:Office2020于2021年10月发布,而Office2019于2018年9月发布。...
- 硬盘恢复分区(硬盘恢复分区怎么删除)
-
1、在电脑上下载DiskGenius软件。2、双击运行该软件,软件会自动识别硬盘。当软件自动识别硬盘之后,右键单击硬盘的盘符,出现下拉菜单栏,选择搜索已丢失分区(重建分区表)选项。3、右键单击硬盘盘符...
-
- edge 浏览器(edge浏览器官网下载)
-
目前没有,如果是平板安装了WIN10是会内置MicrosoftEdge浏览器的。edge是由微软开发的基于Chromium开源项目及其他开源软件的网页浏览器。Edge浏览器主要特点是能够支持目前主流的Web技术,作为Windows10自带...
-
2025-11-18 06:51 off999
-
- 网易163邮箱免费注册(163网易免费邮件注册)
-
163邮箱登录入口页面官方地址:https://mail.163.com/163邮箱登录注册方法1、进入邮箱登入首页,我们点击右下角“去注册”按钮,进入注册界面;2、这里直接填写账号和密码内容,点一下同意那里呈蓝色圆点;再点下一步。3、再填...
-
2025-11-18 06:03 off999
- 苹果商城app下载安装(苹果商店app免费下载)
-
一、苹果手机下载软件显示APP内购买的意思是APP可以免费下载使用,但是该APP内有付费内容,也就是通常所说的收费道具。二、不是所有应用都会提供App内购买项目。如果某个应用提供App内购买...
- 惠普电脑中国官网(惠普手提电脑官网)
-
https://support.hp.com/cn是惠普笔记本售后服务官网。惠普维修服务中心通过整合线上线下相关资源,向国内用户提供方便快捷、安全可靠的优质电子产品维修服务。目前拥有北京6家、全国30...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
慕ke 前端工程师2024「完整」
-
失业程序员复习python笔记——条件与循环
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
