Python爬虫基础篇:Requests详解(python爬虫 csdn)
off999 2024-10-08 06:20 26 浏览 0 评论
Requests库
requests是通过urllib3实现自动发送HTTP/1.1请求,它能轻松的实现cookies,登陆验证,代理设置等操作。由于Python内置的urllib模块,用于访问网络资源。但是,它用起来比较麻烦,而且,缺少很多实用的高级功能。一个大牛厌烦了urllib的使用,于是决心自己写一个自动发起HTTP请求的库(据说就写了几个小时),大牛就写完了,它就是Requests库。看一下文档的介绍,很狂有没有,让HTTP服务人类。
安装方式为 pip install Requests.
Requests库发出请求
requests.method(url,**kwargs):构造并发送一个request,返回一个response对象
参数:
- method: request对象的方法(POST,GET)
- url: request对象的URL
- params:可选的,要在查询字符串中发送的字典或字节request
- data:可选的,字典或元祖列表以表单编码,字节或类似文件的对象在主体中发送[(key,value)]
- json:可选的,一个json可序列化的python对象,在主体中发送request
- headers:可选的,用于编写http头信息
- cookies:可选,用dict或cookieJar对象发送Cookies
- file:可选,用于多部分编码上传的字典,可以是多元祖,其中是定义给定文件的内容类型的字符串,以及包含问文件添加的额外头文件的类字典对象
- auth:可选,身份验证元祖,自定义http身份验证
- timeout:可选,发送等待请求数据的超时时间(float/tuple),设置为元祖即为练级connect和read读取超时,如果设置为None即为永久等待
- allow_redirects:布尔值,可选,启用或禁用GET,OPTIONS,POST,PUT,PATCH,DELETE,HEAD重定向,默认为true
- proxies:可选,字典映射协议到代理的URL
- verify:可选,可以是布尔值,可以指定验证服务器的TLS证书路径,默认为true
重点说说一下几个属性:
- params和data,这两个数据形式相同,但params在get请求中使用,data在post请求中使用。
- headers,稍微仔细的都可以看出昨天访问百度的UA为Requests库,如果我们想告诉服务器我们来自其他浏览器呢?重定义headers就好,代码在下方,这样就可以让服务器以为爬虫发出的请求来自WIN10系统的chrome浏览器(其实没有这么简单,服务器一般会从多个维度来判断你是个正常用户,但至少UA这关你过了)。
import requests
headers="Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36"
response = requests.get('http://www.baidu.com',headers=headers
请求响应
class response :该Response对象包含服务器对HTTP请求的响应信息
该对象包含的属性和方法:
- content:响应的内容,以字节为单位。
- cookies :服务器发回的Cookies CookieJar。
- encoding :编码以在访问r.text时进行解码。
- headers :不区分大小写的响应头字典。例如,headers['content-encoding']将返回'Content-Encoding'响应头的值。
- is_redirect:如果此响应是可以自动处理的格式良好的HTTP重定向,则为真。
- json(** kwargs ):返回响应的json编码内容
- links:返回解析的响应头部链接
- ok:如果status_code小于400 则返回True,否则返回False
- status_code:整数响应HTTP状态的代码,例如404或200。
- text:响应的内容,以unicode表示。
- url:响应的最终URL位置
还是挑些重要的讲:
- response.text和response.content都是响应的正文,但是一个是unicode,一个是字节(不懂得的最好百度下,科班出身必学必回)
- response.encoding,很多时候输出Response.text为乱码,确定下这里的格式,一般为UTF-8
- response.status_code是响应状态码,很多时候我们可以通过判断是否为对应值确定爬取是否成功并做响应处理(有些网站没爬到也給200,是个坑)
- response.url请求响应的URL,懂得都懂。
写在最后:Requests库确实蛮好用的,笔者的很多业务都基于Requests库,没有Scrapy庞大,写多了封装好的功能,传参就能用,可自定义程度比较高),很多乱七八糟的业务可以自己写,太多依赖于Scrapy反而会束手束脚。
最后老规则,头条叫我配高清图,还是美女图
相关推荐
- ipv6无网络访问权限怎么解决
-
ipv6无网络访问权限解决方法如下1、点击电脑左下角的开始,进入到开始的菜单栏,在菜单栏中找到“运行”。或者通过快捷键Windows+R打开运行窗口。 2、打开运行的窗口页面后,在页面上输入“CMD...
- office ltsc版(Office LTSC版本区别)
-
office2021和2021ltsc的区别如下:1.更新策略不同。前者采用每个月月度更新的方法,提供功能更新、安全更新。后者不采用每个月月度更新的方法,且不提供功能更新。2.界面不同。2021采用了...
- 安装win7需要激活吗(现在安装win7旗舰版还需密钥吗)
-
要激活 Windows7如果是预装在计算机中的,买来之后便不用激活,这里预装指的是在厂商那里。正版的Windows7安装到计算机中,有三十天的试用期,若要永久使用,就要使...
- originos 3升级计划公布(originos升级包)
-
2023年2月。1.OriginOS3.0系统第一批升级时间为11月25日。2、包含iQOONeo7,X80系列,S15系列,iQOO9、iQOO10系列,以及折叠屏XFold系列和大屏XNo...
- 鸿蒙系统适配第三方机型(鸿蒙 第三方适配)
-
最新华为官方公布了鸿蒙系统3.0支持的机型名单,具体如下。鸿蒙系统3.0升级名单:1.Mate系列:MateXs2、MateX2、MateXs、Mate40、Mate40Pro、Mate...
- imei怎么下载(imei changer apk)
-
如果您的steam序列号激活了,可以尝试以下方法下载:1.使用steam自带的下载工具,如“下载工具”,在软件的“下载”选项卡中选择“序列号下载”。2.在下载页面中,选择要下载的游戏,然后点击“下...
- 电脑系统优化软件哪个好(系统优化软件排行榜)
-
有必要用,非常好用,WINDOWS优化大师是一个网络上下载率极高的系统维护软件。多年未曾清理过系统和硬盘的电脑,系统内部将产生大量的垃圾文件、临时文件、废旧程序等等win10系统不需要经常更新,关闭...
- 重装系统后硬盘不见了(重装系统后磁盘不见了)
-
硬盘不见可能是因为重装系统时未正确安装驱动程序或未对硬件进行正确设置。你可以按以下步骤排查问题:进入BIOS检查硬盘是否被识别,尝试重新连接数据线和电源线,更新或安装适当的硬件驱动程序,或者使用硬件故...
- 冰封u盘装win7系统教程图解(冰封u盘启动装机教程)
-
1.查找激活工具:通常来说,Win7冰封系统已经包含了必要的驱动,所以如果你的电脑上并没有出现设备错误,那你就可以正常使用。如果你需要添加任何驱动,请尝试从厂商下载相应的驱动并执行自动安装程序。如果...
- uefi模式下找不到硬盘(uefi引导找不到硬盘)
-
首先你的安装盘必须是从UEFI启动的,然后它才能安装为UEFI启动。(条件:Fat32文件系统,efi文件夹)其次你MBR+BIOS的系统想换成GPT+EFI的,分区得做一点改动,腾出来100M的空...
- win7怎么安装蓝牙驱动程序(win7电脑安装蓝牙驱动教程)
-
方法如下: 1、再开始里点击控制版面,点击【硬件和声音】找到【添加设备】 2、之后再选择你要添加的蓝牙耳机。 3、系统就会提示正在与蓝牙适配器连接,然后提示添加成功。 4、点击“开始”-“...
- 怎么装系统win7旗舰版(电脑怎么装win7旗舰版)
-
1、目前支持64位的Wincc版本有:WinccV7Sp3、WinccV11Sp2、WinccV12。2、Wincc的V11与V12两个版本不能共存,即不能同时安装在同一台电脑上。上述这两...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
慕ke 前端工程师2024「完整」
-
失业程序员复习python笔记——条件与循环
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
