[编程基础] Python对象的浅拷贝与深拷贝笔记
off999 2024-10-05 19:43 18 浏览 0 评论
Python中的赋值语句不创建对象的副本,它们只将名称绑定到对象。对于不可变的对象,这通常没有什么区别。但是对于处理可变对象或可变对象的集合,您可能需要寻找一种方法来创建这些对象的“真实副本”或“克隆”。从本质上讲,您有时会希望拷贝可以在不自动修改原始副本的情况下进行修改。在本文中,我将向您简要介绍如何在Python3中复制或“克隆”对象,以及一些相关的注意事项。此外,在复制对象方面,Python 2和3之间没有什么区别。
让我们先看看如何复制Python的内置集合。Python内置的可变集合,如列表、字典和集合,可以通过在现有集合上调用它们的工厂函数来复制:
new_list = list(original_list)
new_dict = dict(original_dict)
new_set = set(original_set)
但是,这种方法不适用于自定义对象,而且,除此之外,它只创建浅层副本。对于像列表、dict和set这样的复合对象,浅拷贝和深拷贝有一个重要区别:
- 浅拷贝意味着构造一个新的集合对象,然后用对原始集合中的子对象的引用填充它。本质上,复制过程不会递归,因此不会创建子对象本身的副本。
- 深度复制使得复制过程是递归的。这意味着首先构造一个新的集合对象,然后用在原始集合中找到的子对象的副本递归地填充该对象。以这种方式复制对象,遍历整个对象树,以创建原始对象及其所有子对象的完全独立克隆。
我知道,这有点拗口。所以让我们看一些例子来说明深拷贝和浅拷贝之间的区别。
# 多行输出
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"
文章目录
- 1浅拷贝与深拷贝
- 1.1 进行浅拷贝
- 1.2 进行深拷贝
- 2 复制任意Python对象
- 3 总结
- 4 参考
1浅拷贝与深拷贝
1.1 进行浅拷贝
在下面的例子中,我们将创建一个新的嵌套列表,然后用list()工厂函数简单地复制它:
xs = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
# Make a shallow copy,进行浅复制
ys = list(xs)
这意味着ys它将成为一个新的独立对象,其内容与相同xs。您可以通过检查两个对象来验证这一点:
xs
ys
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
为了确定ys确实与原始版本无关,让我们进行一些实验。您可以尝试向原始(xs)添加新的子列表,然后检查以确保此修改不会影响副本(ys):
xs.append(['new sublist'])
xs
ys
[[1, 2, 3], [4, 5, 6], [7, 8, 9], ['new sublist']]
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
如您所见,这产生了预期的效果。在“表面”级别修改复制的列表完全没有问题。但是,由于我们只创建了原始列表的一个浅拷贝,ys仍然包含对xs中存储的原始子对象的引用。但是对于浅复制,子对象没有被复制。他们只是在复制的名单中再次被引用。因此,当您修改xs中的一个子对象时,这个修改也会反映在ys中,这是因为两个列表共享相同的子对象。拷贝只是浅拷贝,一级深拷贝:
xs[1][0] = 'X'
xs
ys
[[1, 2, 3], ['X', 5, 6], [7, 8, 9], ['new sublist']]
[[1, 2, 3], ['X', 5, 6], [7, 8, 9]]
在上面的示例中,我们(似乎)只对xs进行了更改。但事实证明,xs和ys中索引1处的两个子列表都被修改了。同样,这是因为我们只创建了原始列表的一个浅拷贝。如果我们在第一步中创建了一个xs的深拷贝,那么这两个对象将完全独立。这就是对象的浅拷贝和深拷贝之间的实际区别。现在您知道了如何创建一些内置集合类的浅拷贝就是用内置工厂函数(list,set,dict),并且知道了浅拷贝和深拷贝之间的区别。我们仍然需要答案的问题是:
- 如何创建内置集合的深度副本
- 如何创建任意对象(包括自定义类)的副本(浅拷贝和深拷贝)
这些问题的答案在Python标准库中的copy模块中。这个模块提供了一个简单的接口,用于创建任意Python对象的浅拷贝和深拷贝。
1.2 进行深拷贝
让我们重复前面的列表复制示例,但是有一个重要的区别。这一次,我们将使用复制模块中定义的deepcopy()函数来创建深度副本:
import copy
xs = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
zs = copy.deepcopy(xs)
当你检查我们用copy.deepcopy()创建的xs和它的克隆zs时,你会发现它们看起来又一样了——就像前面的例子一样:
xs
zs
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
但是,如果您对原始对象(xs)中的一个子对象进行了修改,则会看到此修改不会影响深层复制(zs)。两个对象,原始对象和副本,这次是完全独立的。xs被递归地克隆,包括它的所有子对象:
xs[1][0] = 'X'
xs
zs
[[1, 2, 3], ['X', 5, 6], [7, 8, 9]]
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
现在您可能需要花些时间坐下来与Python解释器一起演示这些示例。当您亲身体验并使用示例时,复制对象会更容易。顺便说一下,您还可以使用copy模块中的函数创建浅拷贝。函数的作用是:创建对象的浅拷贝。如果您需要清楚地说明您正在代码中的某个地方创建一个浅拷贝,那么这是非常有用的。使用copy.copy()可以表明这一事实。但是,对于内置的集合,简单地使用list、dict和set factory函数来创建浅拷贝被认为更符合python风格。
2 复制任意Python对象
我们仍然需要回答的问题是如何创建任意对象(包括自定义类)的拷贝(浅拷贝和深拷贝)。现在让我们来看看。 copy.copy() and copy.deepcopy()可以复制任意对象。
同样,理解如何使用这些方法的最好方法是通过一个简单的实验。我将以前面的列表复制示例为基础。首先定义一个简单的二维点类:
class Point:
def __init__(self, x, y):
self.x = x
self.y = y
def __repr__(self):
return f'Point({self.x!r}, {self.y!r})'
上面代码添加了一个__repr__()实现,以便我们可以轻松地在Python解释器中检查从此类创建的对象。接下来,我们将创建一个Point实例,然后(使用copy模块)(浅)复制该实例:
a = Point(23, 42)
b = copy.copy(a)
如果检查原始Point对象及其(浅)克隆的内容,则会看到期望的结果:
a
b
a is b
Point(23, 42)
Point(23, 42)
False
还有一些事情要记住。因为我们的point对象使用不可变类型(int)作为其坐标,所以在这种情况下,浅拷贝和深拷贝没有区别。但我稍后将扩展示例。让我们继续一个更复杂的例子。我将定义另一个类来表示2D矩形。我将以允许我们创建更复杂的对象层次结构的方式来进行操作-我的矩形将使用Point对象来表示其坐标:
class Rectangle:
def __init__(self, topleft, bottomright):
self.topleft = topleft
self.bottomright = bottomright
def __repr__(self):
return (f'Rectangle({self.topleft!r}, '
f'{self.bottomright!r})')
同样,首先我们将尝试创建矩形实例的浅拷贝:
rect = Rectangle(Point(0, 1), Point(5, 6))
srect = copy.copy(rect)
如果检查原始矩形及其副本,则会看到__repr__()效果很好,并且浅复制过程按预期工作:
rect
srect
rect is srect
Rectangle(Point(0, 1), Point(5, 6))
Rectangle(Point(0, 1), Point(5, 6))
False
还记得前面的列表示例如何说明深拷贝和浅拷贝之间的区别吗?这里我将使用相同的方法。我将修改一个更深层次的对象,然后你会看到这个变化反映在(浅)复制:
rect.topleft.x = 999
rect
srect
Rectangle(Point(999, 1), Point(5, 6))
Rectangle(Point(999, 1), Point(5, 6))
我希望这件事像你期望的那样。接下来,我将创建原始矩形的深拷贝。然后我将应用另一个修改,你会看到哪些对象受到影响:
drect = copy.deepcopy(srect)
drect.topleft.x = 222
drect
rect
srect
Rectangle(Point(222, 1), Point(5, 6))
Rectangle(Point(999, 1), Point(5, 6))
Rectangle(Point(999, 1), Point(5, 6))
瞧!这一次,深拷贝(drect)完全独立于原始拷贝(rect)和浅拷贝(srect)。这里我们已经讨论了很多内容,还有一些关于复制对象的细节。
详细见??copy模块文档??
3 总结
- 做一个对象的浅拷贝不会克隆子对象。因此,副本并不完全独立于原件。
- 对象的深层副本将递归地克隆子对象。克隆完全独立于原始副本,但创建深度副本的速度较慢。
- 您可以使用copy模块复制任意对象(包括自定义类)。
4 参考
??https://realpython.com/copying-python-objects/??
相关推荐
- python爬取电子课本,送给居家上课的孩子们
-
在这个全民抗疫的日子,中小学生们也开启了居家上网课的生活。很多没借到书的孩子,不得不在网上看电子课本,有的电子课本是老师发的网络链接,每次打开网页去看,既费流量,也不方便。今天我们就利用python的...
- 高效办公!Python 批量生成PDF文档是如何做到的?
-
前言:日常办公中,经常会使用PDF文档,难免需要对PDF文档进行编辑,有时候PDF文档中的大部分内容都是一样的,只是发送对象不同。这种模板套用的场景下,使用Python进行自动化就尤为方便,用最短的时...
- 如何用Python将PDF完整的转成Word?
-
PDF文件完整的转为Word,转换后格式排版不会乱,图片等信息完整显示不丢失。这个很简单,有很多方法都可以实现。方法一:Python利用Python将PDF文件转换为Word,有许多库可以帮你实现这一...
- 使用Python拆分、合并PDF(python合并多个pdf)
-
知识点使用Python操作PDF!主要内容有:1、PDF拆分;2、PDF合并。在工作中,难免会和PDF打交道,所以掌握一点处理PDF的技能非常有必要,本文将介绍几个常用的功能。PDF拆分很多时候,获取...
- 10分钟实现PDF转Word神器!看DeepSeek如何用Python解放打工人
-
开篇痛点每个被PDF折磨过的职场人都懂——领导发来的扫描件要修改,手动抄到Word需要2小时;网上下载的报告想复制数据,却变成乱码…今天我们用Python+DeepSeek,10分钟打造一个智能转换工...
- 《Python知识手册》,高清全彩pdf版开放下载
-
Python编程还不懂?今天我要把我参与编写的这套《Python知识手册》免费分享出来,看完文末有惊喜哦。...
- 利用python进行数据分析,PDF文档给你答案
-
本书详细介绍利用Python进行操作、处理、清洗和规整数据等方面的具体细节和基本要点。虽然本书的标题是“数据分析”,重点却是Python编程、库,以及用于数据分析的工具。兄弟,毫无套路!PDF版无偿获...
- OCRmypdf:一款可以让扫描PDF文件变得可搜索、可复制!
-
简介在日常工作中,我们经常会接触到各种PDF文件,其中不少是扫描版文档。处理这些扫描PDF时,尽管内容看似完整,但往往无法直接复制或搜索其中的文本。尤其是在需要对大量文档进行文本分析、存档或后期编辑时...
- 高效的OCR处理工具!让扫描PDF文件变得可搜索、可复制!
-
在工作中,我们常常遇到各种各样的PDF文件,其中不乏一些扫描版的文档。而在处理扫描的PDF文件时,虽然文件内容看似完整,但你却无法复制、搜索其中的文本。特别是对大量文档需要进行文本分析、存档、或者...
- 三步教你用Elasticsearch+PyMuPDF实现PDF大文件秒搜!
-
面对100页以上的大型PDF文件时,阅读和搜索往往效率低下。传统关系型数据库在处理此类数据时容易遇到性能瓶颈,而Elasticsearch凭借其强大的全文检索和分布式架构,成为理想解决方案。通过...
- 用 Python 去除 PDF 水印,你学会吗?
-
今天介绍下用Python去除PDF(图片)的水印。思路很简单,代码也很简洁。首先来考虑Python如何去除图片的水印,然后再将思路复用到PDF上面。这张图片是前几天整理《数据结构和算法...
- 扫描PDF档案效率提升300%!OCRmyPDF:告别无法搜索的PDF噩梦,这款26K Star的开源神器让文本识别轻松上手!
-
要在PDF中搜索某个关键词,结果发现啥也找不到?这种情况大多数人都遇到过吧,特别是处理扫描文档或图片PDF时。就在前几天,我还在为这事抓狂呢!后来无意中发现了OCRmyPDF这个宝藏项目...简直就...
- Python自动化办公之PDF版本发票识别并提取关键信息教程(上篇)
-
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Python自动化办公发票数据处理的问题,一起来看看吧。二、实现过程这个问题在实际工作中还是非常常见的,实用性和通用性都比...
- PDF解锁神器:用PyMuPDF与pdfplumber告别手动提取
-
前言大家好,今天咱们来聊聊如何用Python中的PyMuPDF和pdfplumber库,轻松提取PDF文件里的文本和元数据。你是否曾经在处理一个复杂的PDF文件时,感到信息难以触及,提取过程让人抓狂?...
- 《Python知识手册》,高清pdf免费获取
-
今天我要把我参与编写的这套《Python知识手册》免费分享出来,真正弘扬Python开源精神!手册的部分页面如下:获取方式:...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- python爬取电子课本,送给居家上课的孩子们
- 高效办公!Python 批量生成PDF文档是如何做到的?
- 如何用Python将PDF完整的转成Word?
- 使用Python拆分、合并PDF(python合并多个pdf)
- 10分钟实现PDF转Word神器!看DeepSeek如何用Python解放打工人
- 《Python知识手册》,高清全彩pdf版开放下载
- 利用python进行数据分析,PDF文档给你答案
- OCRmypdf:一款可以让扫描PDF文件变得可搜索、可复制!
- 高效的OCR处理工具!让扫描PDF文件变得可搜索、可复制!
- 三步教你用Elasticsearch+PyMuPDF实现PDF大文件秒搜!
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python自定义函数 (53)
- python进度条 (67)
- python吧 (67)
- python字典遍历 (54)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python串口编程 (60)
- python读取文件夹下所有文件 (59)
- java调用python脚本 (56)
- python操作mysql数据库 (66)
- python字典增加键值对 (53)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python人脸识别 (54)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)