百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python爬虫之转义和反转义使用方法

off999 2024-10-07 12:04 17 浏览 0 评论

在使用爬虫时经常遇到各种需要转义的地方,总结了各种转义的方式分享给大家

代码如下:

# -*- coding:utf-8 -*-
import html
from urllib.parse import urlparse
from urllib.parse import urljoin
from urllib.parse import urlencode, parse_qs, parse_qsl
from urllib.parse import quote, unquote

__author__ = 'Evan'


print('返回一个ParseResult类型的对象: ', urlparse('http://www.baidu.com/index.html;user?id=5#comment'))
print('合并两个字符串组合成一个完整的URL: ', urljoin('http://www.baidu.com', 'index.html'))

params = {
    'name': 'Evan',
    'id': '77'
}
print('将字典序列化为Get请求参数: ', 'http://www.baidu.com?' + urlencode(params))

print('将Get请求参数反序列化为字典: ', parse_qs('http://www.baidu.com?name=Evan&id=77'))
print('将Get请求参数反序列化为列表: ', parse_qsl('http://www.baidu.com?name=Evan&id=77'))

print('将中文转化为URL编码: ', 'http://www.baidu.com?' + quote('年龄'))
print('将URL编码转化为中文: ', unquote('http://www.baidu.com?%E5%B9%B4%E9%BE%84'))

print('HTML格式反转义成字符: ', html.unescape('https://127.0.0.1/report'))

执行结果:

返回一个ParseResult类型的对象: ParseResult(scheme='http', netloc='www.baidu.com', path='/index.html', params='user', query='id=5', fragment='comment')

合并两个字符串组合成一个完整的URL: http://www.baidu.com/index.html

将字典序列化为Get请求参数: http://www.baidu.com?name=Evan&id=77

将Get请求参数反序列化为字典: {'http://www.baidu.com?name': ['Evan'], 'id': ['77']}

将Get请求参数反序列化为列表: [('http://www.baidu.com?name', 'Evan'), ('id', '77')]

将中文转化为URL编码: http://www.baidu.com?%E5%B9%B4%E9%BE%84

将URL编码转化为中文: http://www.baidu.com?年龄

HTML格式反转义成字符: https://127.0.0.1/report

相关推荐

python列表(List)必会的13个核心技巧(附实用方法)

列表(List)是Python入门的关键步骤,因为它是编程中最常用的数据结构之一。以下是高效掌握列表的核心技巧和实用方法:一、理解列表的本质可变有序集合:可随时修改内容,保持元素顺序混合类型:一个列表...

Python列表(List)一文全掌握:核心知识点+20实战练习题

Python列表(List)知识点教程一、列表的定义与特性定义:列表是可变的有序集合,用方括号[]定义,元素用逗号分隔。list1=[1,"apple",3.14]lis...

python编程中列表常见的9大问题,你知道吗?

Python列表常见错误及解决方案列表(list)是Python中最常用的数据结构之一,但在使用过程中经常会遇到各种问题。以下是Python列表使用中的常见错误及其解决方法:一、索引越界错误1.访问...

python之列表操作(python列表操作函数大全)

常用函数函数名功能说明append将一个元素添加到列表中names=['tom']用法:names.append('tommy')注意事项:被添加的元素只会被添加到...

7 种在 Python 中反转列表的智能方法

1.使用reverse()方法(原地)my_list=[10,12,6,34,23]my_list.reverse()print(my_list)#output:[23,34,6,12,...

Python教程-列表复制(python中列表copy的用法)

作为软件开发者,我们总是努力编写干净、简洁、高效的代码。Python列表是一种多功能的数据结构,它允许你存储一个项目的集合。在Python中,列表是可变的,这意味着你可以在创建一个列表后改变它的...

「Python程序设计」基本数据类型:列表(数组)

列表是python程序设计中的一个基本的,也是重要的数据结构。我们可以把列表数据结构,理解为其它编程语言中的数组。定义和创建列表列表中的数据元素的索引,和数组基本一致,第一个元素的索引,或者是下标为0...

Python中获取列表最后一个元素的方法

技术背景在Python编程中,经常会遇到需要获取列表最后一个元素的场景。Python提供了多种方法来实现这一需求,不同的方法适用于不同的场景。实现步骤1.使用负索引-1这是最简单和最Pythoni...

Python学不会来打我(11)列表list详解:用法、场景与类型转换

在Python编程中,列表(list)是最常用且功能最强大的数据结构之一。它是一个有序、可变、支持重复元素的集合,可以存储任意类型的对象,包括整数、字符串、布尔值、甚至其他列表。本文将从基础语法开始...

零起点Python机器学习快速入门-4-4-列表操作

Python列表的基本操作展开。首先,定义了两个列表zlst和vlst并将它们的内容打印出来。接着,使用切片操作从这两个列表中提取部分元素,分别得到s2、s3和s4三个新的列表,并打...

python入门 到脱坑 基本数据类型—列表

以下是Python列表(List)的入门详解,包含基础操作、常用方法和实用技巧,适合初学者系统掌握:一、列表基础1.定义列表#空列表empty_list=[]#包含不同类型元素的列表...

Python 列表(List)完全指南:数据操作的利器

在Python中,列表(list)是一种可变序列(mutablesequence),它允许我们存储和操作一组有序数据(ordereddata)。本教程将从基础定义(basicdefiniti...

如何快速掌握 Python中列表的使用

学习python知识,好掌握Python列表的使用。从概念上来讲,Python中的列表list是一种有序、可变的容器,可以存储任意类型的数据(包括其他列表)。以下是列表的常用的操作和知识:1....

Python中的列表详解及示例(python中列表的用法)

艾瑞巴蒂干货来了,数据列表,骚话没有直接来吧列表(List)是Python中最基本、最常用的数据结构之一,它是一个有序的可变集合,可以包含任意类型的元素。列表的基本特性有序集合:元素按插入顺序存储可变...

python数据类型之列表、字典、元组、集合及操作

Python数据类型进阶:列表、字典与集合在Python中,数据类型是编程的基础,熟练掌握常用数据结构是成为高级开发者的关键。上一篇文章我们学习到了Python的数据类型:字符串(string)、数...

取消回复欢迎 发表评论: