百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python3中的HTTP请求库——urllib

off999 2024-11-09 12:56 20 浏览 0 评论

urllib 是 Python3 中自带的 HTTP 请求库,可以用于打开和读取 URL,解析 URL,处理异常,以及模拟浏览器的请求头等功能。urllib 包含四个模块,分别是:

  • urllib.request - 用于打开和读取 URL,支持 GET 和 POST 方法,以及添加请求头等。
  • urllib.error - 用于处理 urllib.request 抛出的异常,如 HTTPError, URLError 等。
  • urllib.parse - 用于解析 URL,包括编码和解码,拼接和分割等。
  • urllib.robotparser - 用于解析 robots.txt 文件,判断哪些内容可以抓取,哪些不可以。

urllib 的基本用法是使用 urllib.request.urlopen 函数来打开一个 URL,返回一个类文件对象,可以使用 read, readline, readlines 等方法来读取网页内容。例如:

from urllib.request import urlopen
myURL = urlopen("https://www.runoob.com/")
print(myURL.read().decode("utf-8"))

如果要发送数据或者添加请求头,可以使用 urllib.request.Request 类来构造一个请求对象,然后传给 urlopen 函数。例如:

from urllib.request import Request, urlopen
from urllib.parse import urlencode
url = "http://httpbin.org/post"
data = bytes(urlencode({"name": "WenAn"}), encoding="utf-8")
headers = {"User-Agent": "Mozilla/5.0"}
request = Request(url, data=data, headers=headers, method="POST")
response = urlopen(request)
print(response.read().decode("utf-8"))

urllib.parse 模块提供了一些函数来处理 URL,如 quote, unquote, urlencode, parse_qs, urlparse 等。例如:

from urllib.parse import quote, unquote, urlencode, parse_qs, urlparse
url = "https://www.runoob.com/?s=Python"
print(quote(url)) # 编码
print(unquote(quote(url))) # 解码
print(urlencode({"name": "WenAn"})) # 将字典转换为查询字符串
print(parse_qs(urlencode({"name": "WenAn"}))) # 将查询字符串转换为字典
print(urlparse(url)) # 将 URL 分割为六个部分

urllib.error 模块提供了一些异常类来处理 urllib.request 抛出的错误,如 HTTPError, URLError, ContentTooShortError 等。例如:

from urllib.request import urlopen
from urllib.error import HTTPError, URLError
try:
    response = urlopen("https://www.runoob.com/no.html")
except HTTPError as e:
    print(e.code, e.reason, e.headers, sep="\n")
except URLError as e:
    print(e.reason)
else:
    print("Request Successfully")

urllib.robotparser 模块提供了一个 RobotFileParser 类来解析 robots.txt 文件,判断哪些内容可以抓取,哪些不可以。例如:

from urllib.robotparser import RobotFileParser
rp = RobotFileParser()
rp.set_url("https://www.runoob.com/robots.txt")
rp.read()
print(rp.can_fetch("*", "https://www.runoob.com/")) # True
print(rp.can_fetch("*", "https://www.runoob.com/wp-admin/")) # False

相关推荐

u盘检测软件下载(u盘测试软件)

1、u盘芯片检测工具(ChipEasy)可以查看USB设备PID、VID、SN、制造商、产品名等;2、查看USB设备主控芯片信息、闪存芯片信息、固件信息、电流控制3、SSD型号...

电脑现在什么系统最好(电脑现在用什么系统好)

WINXP好用,但过时了。VISTA不好用,没推开就夭折了。WIN8/8.1是针对触模屏设计的,如果你用的不是触摸屏平板电脑是普通电脑,使WIN8/8.1总觉着很蹩扭。新出的WIN10,功能...

账号怎么注册(steam账号怎么注册)

如果注册是qq账号【qq号码的申请办法】【1】双击qq登陆界面,在qq帐号填写空格的后面你可以看见:[申请帐号];【2】点击[申请帐号]进入,就可以在网上免费申请号码了;【3】进入www.qq.com...

tmp文件是什么意思(tmp文件有什么用)

在系统C:\Windows\Temp文件夹中,我们经常会发现一些后缀名为TMP的文件,在该文件夹中的这些文件其实都是临时文件。它们可能是系统被误关机,或者其他程序没有删除而生的。而且在该文件夹中还有其...

怎么给u盘格式化(怎么给u盘格式化成FAT32)

u盘插入电脑,等待桌面弹出u盘图标。打开“计算机”。左键选中u盘,单击右键,在弹出的菜单中,点击“格式化”。点击“开始”,点击“确定”即可。格式化u盘详细步骤1、找到U盘盘符,鼠标右键点击,弹出菜单中...

harmonyos主题下载(harmonyos主题怎么换)

首先,打开荣耀手机的应用市场,在搜索框中输入“华为鸿蒙主题”,然后点击搜索。找到“华为鸿蒙主题”应用后,点击下载即可。下载完成后,打开“华为鸿蒙主题”应用,选择心仪的主题,点击下载并应用即可享受华为鸿...

戴尔笔记本电脑黑屏却开着机

对于电脑黑屏的处理基本上采用排除、替换相结合的方法,其原则应本着先替换排除可疑性最大的部件。对于普通电脑用户来讲,专业知识不足,可以按下列步骤分析故障原因,以便可以自己动手排除故障。首先检查接触是否良...

手机版电脑桌面下载(手机电脑桌面下载软件安装包)

只有电脑版手机助手软件,没有手机桌面这个软件在电脑上点击今日头条APP下载安装即可哦你好,陌陌电脑版如果说你想要下载到电脑桌面的话,你只需要长按把它添加到你的电脑桌面就可以了。要将软件下载到桌面并创建...

ghost备份中文图解(ghost备份1837)

其实是这样的ghost文件备份后会生成两个文件一个是.GHO一个是.GHS文件FAT32格式的分区,单个文件最大只支持到2G(2048M),如果你的镜像>2G,这时的做的GHOST在一个文件里装...

win10一键重装win7(win10一键重装系统)

1、首先准备一个4GB以上可以正常使用的U盘。2、在一个可以正常使用的电脑上,下载老毛桃软件并安装。3、去网上下载所需的win7,win10选择自己所需要的系统,并下载下来。4、插入u盘并打开老毛桃...

戴尔按f12还原系统步骤win10

基本上正常的话是f8,如果你希望他变成年,F12,你要打开设置去连,然后把这个快捷键的位置调一调戴尔的键盘f1到f12恢复原功能的方法:1、可能是操作者操作有误的原因,使键盘没有任何反应。2、根据复合...

qq网页版官网(qq1网页版)
qq网页版官网(qq1网页版)

https://aq.qq.com/cn2/indexQQ安全中心是腾讯公司推出的QQ帐号保护软件,为广大QQ用户提供一站式的QQ安全服务,包括了密保管理、帐号保护、安全体检、修改密码、帐号申诉等功能,让账号更加安全可靠。为了全面保护QQ帐...

2025-11-18 15:03 off999

联想软件商店官网(联想应用商店官网下载安装)

要设置联想电脑应用商店,首先需要打开商店应用并进行登录。之后可以根据个人需求浏览并下载商店中的应用,也可以通过搜索功能查找特定应用。在商店中还可以管理已下载的应用、更新应用以及查看应用评价和评论。此外...

xp如何看电脑是32位还是64位
  • xp如何看电脑是32位还是64位
  • xp如何看电脑是32位还是64位
  • xp如何看电脑是32位还是64位
  • xp如何看电脑是32位还是64位
tp路由器设置登录网址(tplink路由器设置网址登录)

tplogin.cn是TPlink路由器界面的默认登陆入口地址。TPlink常见的登陆入口地址:192.168.1.1,192.168.0.1,tplogin.cn,192.168.0.254,192...

取消回复欢迎 发表评论: