python爬虫学习(四):requests的使用
off999 2024-10-08 06:21 22 浏览 0 评论
requests也一个访问网络资源的模块包,不过是python的第三方库,处理url比urllib会更方便一些,而且还有很多实用的高级功能。
安装requests,这里采用pip进行安装:
- 在windows系统下只需要在命令行输入命令 pip install requests 即可安装。
- 在 linux 系统下,只需要输入命令 sudo pip install requests ,即可安装。
- 在 mac系统下,只需要输入命令 pip3 install requests ,即可安装。
安装成功后,如果是在pycharm软件编辑的话,这个时候就有requests的提示了。
如下:
requests的七个主要方法:
- requests.request() 构造一个请求,支持以下各种方法
- requests.get() 获取html的主要方法
- requests.head() 获取html头部信息的主要方法
- requests.post() 向html网页提交post请求的方法
- requests.put() 向html网页提交put请求的方法
- requests.patch() 向html提交局部修改的请求
- requests.delete() 向html提交删除请求
这里主要讲比较常用的get和post请求方式。
requests.get()
源码:get(url, params=None, kwargs)
url参数:访问地址
Params参数: 网址尾部附加的参数,如http://xxx.xx.com/get?a=xxx&b=xxx 中的a=xxx&b=xxx部分。
kwargs参数:主要是其他可传参数的集合,具体跟urllib.request.urlopen()方法里面的参数类似。我们在源码中可以发现get和post最终都是跳到一个方法进行执行。
def request(self, method, url,
params=None, data=None, headers=None, cookies=None, files=None,
auth=None, timeout=None, allow_redirects=True, proxies=None,
hooks=None, stream=None, verify=None, cert=None, json=None)
上面的参数即为get和post方法所有可以传的参数。
具体:
import requests
r = requests.get(“http://www.baidu.com“)
print(r.status_code) #状态码
print(r.text) #返回内容
这是最简单的访问方法。还有带参的。
import requests
r = requests.get(‘https://www.douban.com/search‘, params={‘q’: ‘python’, ‘cat’: ‘1001’})
print(r.url) #查看请求的url
print(r.encoding) #查看请求的编码
print(r.content) #返回的内容,bytes对象,未解码,r.text是已经解码之后的字符串
另外,如果要传递headers可以这么写
r = requests.get(‘https://www.douban.com/‘, headers={‘User-Agent’: ‘Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit’})
requests.post()
一些参数传递方式和get方法差不多。传入data参数作为post请求的数据
>>> r = requests.post(‘https://accounts.douban.com/login‘, data={‘form_email’: ‘abc@example.com’, ‘form_password’: ‘123456’})
requests默认使用application/x-www-form-urlencoded对POST数据编码。如果要传递JSON数据,可以直接传入json参数:
params = {‘key’: ‘value’}
r = requests.post(url, json=params) # 内部自动序列化为JSON
类似的,上传文件需要更复杂的编码格式,但是requests把它简化成files参数:
>>> upload_files = {‘file’: open(‘report.xls’, ‘rb’)}
>>> r = requests.post(url, files=upload_files)
要在请求中传入Cookie,只需准备一个dict传入cookies参数:
>>> cs = {‘token’: ‘12345’, ‘status’: ‘working’}
>>> r = requests.get/post(url, cookies=cs)
最后,要指定超时,传入以秒为单位的timeout参数:
>>> r = requests.get/post(url, timeout=2.5) # 2.5秒后超时
获取响应头,可以通过r.headers获取,另外通过r.headers[key]获取具体某一个头部信息。获取cookies类似。
requests.request()
该方法可以实现get也可以实现post.通过首个参数method传递‘GET’或‘POST’进行区分,其余参数与上述相同。
r=requests.request(‘GET’,‘https://www.douban.com/search‘,params={‘q’: ‘python’, ‘cat’: ‘1001’})
相关推荐
- 大文件传不动?WinRAR/7-Zip 入门到高手,这 5 个技巧让你效率翻倍
-
“这200张照片怎么传给女儿?微信发不了,邮箱附件又超限……”62岁的张阿姨对着电脑犯愁时,儿子只用了3分钟就把照片压缩成一个文件,还教她:“以后用压缩软件,比打包行李还方便!”职场人更懂这...
- 电脑解压缩软件推荐——7-Zip:免费、高效、简洁的文件管理神器
-
在日常工作中,我们经常需要处理压缩文件。无论是下载软件包、接收文件,还是存储大量数据,压缩和解压缩文件都成为了我们日常操作的一部分。而说到压缩解压软件,7-Zip绝对是一个不可忽视的名字。今天,我就来...
- 设置了加密密码zip文件要如何打开?这几个方法可以试试~
-
Zip是一种常见的压缩格式文件,文件还可以设置密码保护。那设置了密码的Zip文件要如何打开呢?不清楚的小伙伴一起来看看吧。当我们知道密码想要打开带密码的Zip文件,我们需要用到适用于Zip格式的解压缩...
- 大文件想要传输成功,怎么把ZIP文件分卷压缩
-
不知道各位小伙伴有没有这样的烦恼,发送很大很大的压缩包会受到限制,为此,想要在压缩过程中将文件拆分为几个压缩包并且同时为所有压缩包设置加密应该如何设置?方法一:使用7-Zip免费且强大的文件管理工具7...
- 高效处理 RAR 分卷压缩包:合并解压操作全攻略
-
在文件传输和存储过程中,当遇到大文件时,我们常常会使用分卷压缩的方式将其拆分成多个较小的压缩包,方便存储和传输。RAR作为一种常见的压缩格式,分卷压缩包的使用频率也很高。但很多人在拿到RAR分卷...
- 2个方法教你如何删除ZIP压缩包密码
-
zip压缩包设置了加密密码,每次解压文件都需要输入密码才能够顺利解压出文件,当压缩包文件不再需要加密的时候,大家肯定想删除压缩包密码,或是忘记了压缩包密码,想要通过删除操作将压缩包密码删除,就能够顺利...
- 速转!漏洞预警丨压缩软件Winrar目录穿越漏洞
-
WinRAR是一款功能强大的压缩包管理器,它是档案工具RAR在Windows环境下的图形界面。该软件可用于备份数据,缩减电子邮件附件的大小,解压缩从Internet上下载的RAR、ZIP及其它类...
- 文件解压方法和工具分享_文件解压工具下载
-
压缩文件减少文件大小,降低文件失效的概率,总得来说好处很多。所以很多文件我们下载下来都是压缩软件,很多小伙伴不知道怎么解压,或者不知道什么工具更好,所以今天做了文件解压方法和工具的分享给大家。一、解压...
- [python]《Python编程快速上手:让繁琐工作自动化》学习笔记3
-
1.组织文件笔记(第9章)(代码下载)1.1文件与文件路径通过importshutil调用shutil模块操作目录,shutil模块能够在Python程序中实现文件复制、移动、改名和删除;同时...
- Python内置tarfile模块:读写 tar 归档文件详解
-
一、学习目标1.1学习目标掌握Python内置模块tarfile的核心功能,包括:理解tar归档文件的原理与常见压缩格式(gzip/bz2/lzma)掌握tar文件的读写操作(创建、解压、查看、过滤...
- 使用python展开tar包_python拓展
-
类Unix的系统,打包文件经常使用的就是tar包,结合zip工具,可以方便的打包并解压。在python的标准库里面有tarfile库,可以方便实现生成了展开tar包。使用这个库最大的好处,可能就在于不...
- 银狐钓鱼再升级:白文件脚本化实现GO语言后门持久驻留
-
近期,火绒威胁情报中心监测到一批相对更为活跃的“银狐”系列变种木马。火绒安全工程师第一时间获取样本并进行分析。分析发现,该样本通过阿里云存储桶下发恶意文件,采用AppDomainManager进行白利...
- ZIP文件怎么打开?2个简单方法教你轻松搞定!
-
在日常工作和生活中,我们经常会遇到各种压缩文件,其中最常见的格式之一就是ZIP。ZIP文件通过压缩数据来减少文件大小,方便我们进行存储和传输。然而,对于初学者来说,如何打开ZIP文件可能会成为一个小小...
- Ubuntu—解压多个zip压缩文件.zip .z01 .z02
-
方法将所有zip文件放在同一目录中:zip_file.z01,zip_file.z02,zip_file.z03,...,zip_file.zip。在Zip3.0版本及以上,使用下列命令:将所有zi...
- 如何使用7-Zip对文件进行加密压缩
-
7-Zip是一款开源的文件归档工具,支持多种压缩格式,并提供了对压缩文件进行加密的功能。使用7-Zip可以轻松创建和解压.7z、.zip等格式的压缩文件,并且可以通过设置密码来保护压缩包中的...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)