百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python爬虫S08 - http post请求的数据爬取

off999 2024-11-12 12:01 34 浏览 0 评论

今天开始第八关的爬钟实战。

·先看这个页面,从这个页面看起来内容跟之前最简单的第一、第二关没有太大的区别,现在这样的看不出来到底里面有什么玄机。同样的就跟之前那个套路一样,找一个类似的关卡把代码复制一下。

·看这样的页面就选第二关,为什么?是因为它的样式跟第二关都差不多。复制一下,新建一个,把它捏进去,先把其他的关了,然后把url改一下。

·第八关如果之前大家有看就知道之前那些都会有关卡的数字在这里,现在这里没有,所以就要注意了到底是需要怎么样去处理。现在先不管这个问题,先把一些准备工作做一下,把这些代码改好了,也给它配一个。

·这里出现,因为这是刚才测试的时候出的,然后就配一下执行。这时候试一下,就去执行一下脚本,看到没有?好像是抓到数据了,就去核对一下到底是不是这些数据,就看一下抓出来这个圆码。

·因为这几关用的数据都是一样,如果光看数据是看不出来,所以要往上翻一下,因为它有关卡标识。看到这里把第一关给抓下来了,现在抓的不是第二,第八关想要的没有抓下来,就说明代码是不对的,没有拿到想要的东西。

·刚才也看到了改的东西其实是不会影响去抓的,也就是代码在逻辑上面是没有错的,有可能就是第八关是不是设置了一些什么东西让我们抓不到。刚才也提醒了一下url跟之前的不太一样,可能就要从这里入手去分析一下。

·接下来也是同样的套路F12,F12之前也有粉丝私信说在电脑上面不管怎么按F12,工具就是出不来,其实往这个里叫做开发者工具,可以在菜单那里去点,去菜单那里去找。这里是一个,在菜单那里就会有能够找到开发者工具,就是通过菜单或者快捷键(Ctrl+Shift+1)就能把它调用出来,是一样的。

·现在就是回到正题上面,同样的把它切换到network那里,然后再点一下第八关,看一下浏览器发出的一些请求。看鼠标放上去,看到url,就知道其实它发出了请求,主要是这个就先打开它看一下,看到这里其实要仔细观察一下就能看到,看到没有,是用的post,可以到代码里面是用的get,明白吧?之前其实所有的都是用get,之前用的都是用get。

这个requests要怎么做?使百度一下就有,本身快手的官方文档里面就有requests,把它加上去就可以了,就要分析它的参数是什么,继续往下分析,把它拉大一点,这个是headers,这个也是headers,这个是返回的headers,这是请求的headers,下面有个form data,看到没有?level8,level8就是第8关的参数了,要怎么做?

就可以去看,payload是要一个字典(类型),同样的也给它加个payload,然后data等于刚刚设置的pro,这里就不能是get,应该是post,就试一下,同样的有数据下来,再往上翻一下看一下关卡的数字到底是刚才的一二,是到了正确的八。

可以看到现在拿下来的已经是第八关了,其实就相当于只是换了一个请求方式,请求方式接下来这些解释了就不用看了,因为整个页面都是一样的。比如现在看第八关,抓下来数据都是一样的,因为这一关其实考察的不是这个解释,就是要找到pose相关的数请求方式跟参数。

其实这种为什么只是换了一个get或者或是一个pose这么简单,为什么要单独把它拿出来?这是因为在登录的操作里面一般来说是要用pose的,所以这个词是非常重要。

另外一个就是有一些数据,就是为了安全或者其他的一些原因,也是用pose这种方式去查或者是lasfold之类的,是get、post、put,这些都是对应不同的操作,所以这个就是浏览器除了get还有很多很多,还有好几个请求方式,就包括刚才说的那种,是每一种方式都有可能还需用到,所以用工具去调试的时候就要去注意一下这个位置,不是每次把url拷过去,然后用requestget一下就能拿得到了,有可能这里就是post或者post之类的方式,这是一个注意的点。

接下来其他就没有什么好说的,这个就是调试去找参数的问题。也说一下工具,其实工具有时候就是直接从这一行就能看得出来。怎么看?现在看这几列是没有,其实在它上面右键就可以选择要显示的那种,把这个勾起来直接就可以看得到这里,很明显这个是pose,就不用再往里面翻也可以。

这种就看每一个的操作习惯,甚至有一些可能在这边、在这里是看不到的,或者要去过滤一些东西,可以在这些选项里面对应一个个去找。其实这个工具是非常好用的,特别是后期可能要讲到一些比较复杂的一些东西,要熟练的掌握这一些东西,当然也不只是这些工具。

今天的就到这里了。

相关推荐

Python函数参数和返回值类型:让你的代码更清晰、更健壮

在Python开发中,你是否遇到过这些抓狂时刻?同事写的函数参数类型全靠猜调试两小时发现传了字符串给数值计算函数重构代码时不知道函数返回的是列表还是字典今天教你两招,彻底解决类型混乱问题!让你的...

有公司内部竟然禁用了python开发,软件开发何去何从?

今天有网友在某社交平台发文:有公司内部竟然禁止了python开发!帖子没几行,评论却炸锅了。有的说“太正常,Python本就不适合做大项目”,还有的反驳“飞书全员用Python”。暂且不说这家公司...

写 Python 七年才发现的七件事:真正提高生产力的脚本思路

如果你已经用Python写了不少脚本,却总觉得代码只是“能跑”,这篇文章或许会刷新你对这门语言的认知。以下七个思路全部来自一线实战,没有花哨的概念,只有可落地的工具与习惯。它们曾帮我省下大量无意义...

用Python写一个A*搜索算法含注释说明

大家好!我是幻化意识流。今天我们用Python写一个A*搜索算法的代码,我做了注释说明,欢迎大家一起学习:importheapq#定义搜索节点类,包括当前状态、从初始状态到该状态的代价g、从该状态...

使用python制作一个贪吃蛇游戏,并为每一句添加注释方便学习

今天来设计一个贪吃蛇的经典小游戏。先介绍下核心代码功能(源代码请往最后面拉):游戏功能:-四个难度等级:简单(8FPS)、中等(12FPS)、困难(18FPS)、专家(25FPS)-美...

Python 之父 Guido van Rossum 宣布退休

Python之父GuidovanRossum在推特公布了自己从Dropbox公司离职的消息,并表示已经退休。他还提到自己在Dropbox担任工程师期间学到了很多东西——Python的类型注解(T...

4 个早该掌握的 Python 类型注解技巧

在Python的开发过程中,类型注解常常被忽视。但当面对一段缺乏类型提示、逻辑复杂的代码时,理解和维护成本会迅速上升,极易陷入“阅读地狱”。本文整理了4个关于Python类型注解的重要技巧...

让你的Python代码更易读:7个提升函数可读性的实用技巧

如果你正在阅读这篇文章,很可能你已经用Python编程有一段时间了。今天,让我们聊聊可以提升你编程水平的一件事:编写易读的函数。请想一想:我们花在阅读代码上的时间大约是写代码的10倍。所以,每当你创建...

Python异常模块和包

异常当检测到一个错误时,Python解释器就无法继续执行了,反而出现了一些错误的提示,这就是所谓的“异常”,也就是我们常说的BUG例如:以`r`方式打开一个不存在的文件。f=open('...

别再被 return 坑了!一文吃透 Python return 语句常见错误与调试方法

Pythonreturn语句常见错误与调试方法(结构化详解)一.语法错误:遗漏return或返回值类型错误错误场景pythondefadd(a,b):print(a+b)...

Python数据校验不再难:Pydantic库的工程化实践指南

在FastAPI框架横扫Python后端开发领域的今天,其默认集成的Pydantic库正成为处理数据验证的黄金标准。这个看似简单的库究竟隐藏着哪些让开发者爱不释手的能力?本文将通过真实项目案例,带您解...

python防诈骗的脚本带注释信息

以下是一个简单但功能完整的防诈骗脚本,包含URL检测、文本分析和风险评估功能。代码结构清晰,带有详细注释,适合作为个人或家庭防诈骗工具使用。这个脚本具有以下功能:文本诈骗风险分析:检测常见诈骗关键...

Python判断语句

布尔类型和比较运算符布尔类型的定义:布尔类型只有两个值:True和False可以通过定义变量存储布尔类型数据:变量名称=布尔类型值(True/False)布尔类型不仅可以自行定义,同时也可通过...

使用python编写俄罗斯方块小游戏并为每一句添加注释,方便学习

先看下学习指导#俄罗斯方块游戏开发-Python学习指导##项目概述这个俄罗斯方块游戏是一个完整的Python项目,涵盖了以下重要的编程概念:-面向对象编程(OOP)-游戏开发基础-数据...

Python十大技巧:不掌握这些,你可能一直在做无用功!

在编程的世界里,掌握一门语言只是起点,如何写出优雅、高效的代码才是真功夫。Python作为最受欢迎的编程语言之一,拥有简洁明了的语法,但要想真正精通这门语言,还需要掌握一些实用的高级技巧。一、列表推导...

取消回复欢迎 发表评论: