百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python基础——数据深拷贝、浅拷贝

off999 2024-10-05 19:43 19 浏览 0 评论

各基本数据类型的地址存储及改变情况在python中的数据类型包括:bool、int、long、float、str、set、list、tuple、dict等等。我们可以大致将这些数据类型归类为简单数据类型和复杂的数据结构。

数据结构: 集合结构:set 序列结构: tuple list (str) 映射结构: dict

基本数据类型 Int long float bool str ..

说明:由于python中的变量都是采用的引用语义,数据结构可以包含基础数据类型,导致了在python中数据的存储是下图这种情况,每个变量中都存储了这个变量的地址,而不是值本身;对于复杂的数据结构来说,里面的存储的也只只是每个元素的地址而已

1.数据类型重新初始化对python语义引用的影响

变量的每一次初始化,都开辟了一个新的空间,将新内容的地址赋值给变量

str = "hello word"print(id(str))    #43863640str1 = "new hello word"<br>print(id(str1))   #43863680

从上代码中可以看出str在重复的初始化过程中,是因为str中存储的元素地址由'hello world'的地址变成了'new hello world'的。

2.数据结构内部元素变化重对python语义引用的影响

对于复杂的数据类型来说,改变其内部的值对于变量的影响:

list1 = [1,2,3,4,5,6]print(id(list1))     #7705224list1.append('new item')print(id(list1))     #7705224list1.pop()print(list1)       #[1, 2, 3, 4, 5, 6]list1[0] = 'change_test'print(list1)          #['change_test', 2, 3, 4, 5, 6]print(id(list1))      #7705224list1 = [1,2,3,4,5]print(id(list1))      #7705224

当对列表中的元素进行一些增删改的操作的时候,是不会影响到lst1列表本身对于整个列表地址的,只会改变其内部元素的地址引用。可是当我们对于一个列表重新初始化(赋值)的时候,就给list1这个变量重新赋予了一个地址,覆盖了原本列表的地址,这个时候,list1列表的内存id就发生了改变。上面这个道理用在所有复杂的数据类型中都是一样的

3.变量的赋值

  • View Code我们刚刚已经知道,str1的再次初始化(赋值)会导致内存地址的改变,从上图的结果我们可以看出修改了str1之后,被赋值的str2从内存地址到值都没有受到影响

看内存中的变化,起始的赋值操作让str1和str2变量都存储了‘hello world’所在的地址,重新对str1初始化,使str1中存储的地址发生了改变,指向了新建的值,此时str2变量存储的内存地址并未改变,所以不受影响。

4.复杂的数据结构中的赋值 

print("复杂的数据结构中的赋值")list1 = [1, 2, 3, 4, 5, 6]list2 = list1print(id(list1)) # 42367240print(id(list2)) # 42367240list1.append('new item')print(list1) # [1, 2, 3, 4, 5, 6, 'new item']print(list2) # [1, 2, 3, 4, 5, 6, 'new item']print(id(list1)) # 42367240print(id(list2)) # 42367240

由次可知列表的增加修改操作,没有改变列表的内存地址,lst1和lst2都发生了变化,在列表中添加新值时,列表中又多存储了一个新元素的地址,而列表本身的地址没有变化,所以lst1和lst2的id均没有改变并且都被添加了一个新的元素

初识拷贝

我们已经详细了解了变量赋值的过程。对于复杂的数据结构来说,赋值就等于完全共享了资源,一个值的改变会完全被另一个值共享。然而有的时候,我们偏偏需要将一份数据的原始内容保留一份,再去处理数据,这个时候使用赋值就不够明智了。python为这种需求提供了copy模块。提供了两种主要的copy方法,一种是普通的copy,另一种是deepcopy。我们称前者是浅拷贝,后者为深拷贝。

深浅拷贝一直是所有编程语言的重要知识点,下面我们就从内存的角度来分析一下两者的区别。

浅拷贝:

首先,我们来了解

print("浅拷贝")import copylst = ['str1', 'str2', 'str3']sourcelst = ['str1', 'str2', 'str3', lst]copylst = copy.copy(sourcelst)print("原本地址")print([id(ele) for ele in sourcelst])print([id(ele) for ele in copylst])print("当sourceLst列表发生变化,copyLst中存储的lst内存地址没有改变")sourcelst.append('source')copylst.append('copy')print("->sourcelst: ", sourcelst)print("->copylst: ", copylst)print(id(sourcelst)) # 4print(sourcelst) # 5print([id(ele) for ele in sourcelst])print(id(copylst)) # 4print(copylst) # 5print([id(ele) for ele in copylst])print("sourceLst的第一个元素发生了变化。而copyLst还是存储了str1的地址,所以copyLst不会发生改变。")print([id(ele) for ele in sourcelst])print([id(ele) for ele in copylst])sourcelst[0] = 'change'print("->sourcelst: ", sourcelst)print("->copylst: ", copylst)print(id(sourcelst)) # 4print(sourcelst) # 5print([id(ele) for ele in sourcelst])print(id(copylst)) # 4print(copylst) # 5print([id(ele) for ele in copylst])print("以当lst发生改变的时候,sourceLst和copyLst两个列表就都发生了改变。")print([id(ele) for ele in sourcelst])print([id(ele) for ele in copylst])lst.append('Append')print("->sourcelst: ", sourcelst)print("->copylst: ", copylst)print(id(sourcelst)) # 4print(sourcelst) # 5print([id(ele) for ele in sourcelst])print(id(copylst)) # 4print(copylst) # 5print([id(ele) for ele in copylst])

浅拷贝:不管多么复杂的数据结构,浅拷贝都只会copy一层 。

深拷贝

刚刚我们了解了浅拷贝的意义,但是在写程序的时候,我们就是希望复杂的数据结构之间完全copy一份并且它们之间又没有一毛钱关系,应该怎么办呢?我们引入一个深拷贝的概念,深拷贝——即python的copy模块提供的另一个deepcopy方法。深拷贝会完全复制原变量相关的所有数据,在内存中生成一套完全一样的内容,在这个过程中我们对这两个变量中的一个进行任意修改都不会影响其他变量。下面我们就来试验一下。

看上面的执行结果,这一次我们不管是对直接对列表进行操作还是对列表内嵌套的其他数据结构操作,都不会产生拷贝的列表受影响的情况。我们再来看看这些变量在内存中的状况

看了上面的内容,我们就知道了深拷贝的原理。其实深拷贝就是在内存中重新开辟一块空间,不管数据结构多么复杂,只要遇到可能发生改变的数据类型,就重新开辟一块内存空间把内容复制下来,直到最后一层,不再有复杂的数据类型,就保持其原引用。这样,不管数据结构多么的复杂,数据之间的修改都不会相互影响。这就是深拷贝~~~

print("深拷贝")import copylst = ['str1', 'str2', 'str3']sourcelst = ['str1', 'str2', 'str3', lst]deepcopylst = copy.deepcopy(sourcelst)print("原本地址")print([id(ele) for ele in sourcelst])print([id(ele) for ele in deepcopylst])print("当sourceLst列表发生变化,copyLst中存储的lst内存地址没有改变")sourcelst.append('source')deepcopylst.append('deepcopy')print("->sourcelst: ", sourcelst)print("->deepcopylst: ", deepcopylst)print(id(sourcelst)) # 4print(sourcelst) # 5print([id(ele) for ele in sourcelst])print(id(deepcopylst)) # 4print(deepcopylst) # 5print([id(ele) for ele in deepcopylst])print("sourceLst的第一个元素发生了变化。而copyLst还是存储了str1的地址,所以copyLst不会发生改变。")print([id(ele) for ele in sourcelst])print([id(ele) for ele in deepcopylst])sourcelst[0] = 'change'print("->sourcelst: ", sourcelst)print("->deepcopylst: ", deepcopylst)print(id(sourcelst)) # 4print(sourcelst) # 5print([id(ele) for ele in sourcelst])print(id(deepcopylst)) # 4print(deepcopylst) # 5print([id(ele) for ele in deepcopylst])print("以当lst发生改变的时候,sourceLst和copyLst两个列表就都发生了改变。")print([id(ele) for ele in sourcelst])print([id(ele) for ele in deepcopylst])lst.append('Append')print("->sourcelst: ", sourcelst)print("->copylst: ", deepcopylst)print(id(sourcelst)) # 4print(sourcelst) # 5print([id(ele) for ele in sourcelst])print(id(deepcopylst)) # 4print(deepcopylst) # 5print([id(ele) for ele in deepcopylst])

直接看一段代码:

import copywill = ["Will", 28, ["Python", "C#", "JavaScript"]]# wilber = copy.deepcopy(will)wilber = willprint(id(will)) # 1print(will) # 2print([id(ele) for ele in will]) # 3print(id(wilber)) # 4print(wilber) # 5print([id(ele) for ele in wilber])print("\n")will[0] = "Wilber"will[2].append("CSS")print(id(will)) # 6print(will)print([id(ele) for ele in will])print(id(wilber))print(wilber)print([id(ele) for ele in wilber])

代码输出结果:

['Will', 28, ['Python', 'C#', 'JavaScript']][31949688, 506294592, 42511880]42511816['Will', 28, ['Python', 'C#', 'JavaScript']][31949688, 506294592, 42511880]42511816['Wilber', 28, ['Python', 'C#', 'JavaScript', 'CSS']][42534368, 506294592, 42511880]42511816['Wilber', 28, ['Python', 'C#', 'JavaScript', 'CSS']][42534368, 506294592, 42511880]Process finished with exit code 0  
['Will', 28, ['Python', 'C#', 'JavaScript']][31949688, 506294592, 42511880]42511816['Will', 28, ['Python', 'C#', 'JavaScript']][31949688, 506294592, 42511880]42511816['Wilber', 28, ['Python', 'C#', 'JavaScript', 'CSS']][42534368, 506294592, 42511880]42511816['Wilber', 28, ['Python', 'C#', 'JavaScript', 'CSS']][42534368, 506294592, 42511880]Process finished with exit code 0  

下面来分析一下这段代码:

首先,创建了一个名为will的变量,这个变量指向一个list对象,从第一张图中可以看到所有对象的地址(每次运行,结果可能不同)

然后,通过will变量对wilber变量进行赋值,那么wilber变量将指向will变量对应的对象(内存地址),也就是说”wilber is will”,”wilber[i] is will[i]”可以理解为,Python中,对象的赋值都是进行对象引用(内存地址)传递


总结

本文介绍了对象的赋值和拷贝,以及它们之间的差异:

  • Python中对象的赋值都是进行对象引用(内存地址)传递
  • 使用copy.copy(),可以进行对象的浅拷贝,它复制了对象,但对于对象中的元素,依然使用原始的引用.
  • 如果需要复制一个容器对象,以及它里面的所有元素(包含元素的子元素),可以使用copy.deepcopy()进行深拷贝
  • 对于非容器类型(如数字、字符串、和其他’原子’类型的对象)没有被拷贝一说
  • 如果元组变量只包含空列表类型对象,则不能深拷贝


相关推荐

python爬取电子课本,送给居家上课的孩子们

在这个全民抗疫的日子,中小学生们也开启了居家上网课的生活。很多没借到书的孩子,不得不在网上看电子课本,有的电子课本是老师发的网络链接,每次打开网页去看,既费流量,也不方便。今天我们就利用python的...

高效办公!Python 批量生成PDF文档是如何做到的?

前言:日常办公中,经常会使用PDF文档,难免需要对PDF文档进行编辑,有时候PDF文档中的大部分内容都是一样的,只是发送对象不同。这种模板套用的场景下,使用Python进行自动化就尤为方便,用最短的时...

如何用Python将PDF完整的转成Word?

PDF文件完整的转为Word,转换后格式排版不会乱,图片等信息完整显示不丢失。这个很简单,有很多方法都可以实现。方法一:Python利用Python将PDF文件转换为Word,有许多库可以帮你实现这一...

使用Python拆分、合并PDF(python合并多个pdf)

知识点使用Python操作PDF!主要内容有:1、PDF拆分;2、PDF合并。在工作中,难免会和PDF打交道,所以掌握一点处理PDF的技能非常有必要,本文将介绍几个常用的功能。PDF拆分很多时候,获取...

10分钟实现PDF转Word神器!看DeepSeek如何用Python解放打工人

开篇痛点每个被PDF折磨过的职场人都懂——领导发来的扫描件要修改,手动抄到Word需要2小时;网上下载的报告想复制数据,却变成乱码…今天我们用Python+DeepSeek,10分钟打造一个智能转换工...

《Python知识手册》,高清全彩pdf版开放下载

Python编程还不懂?今天我要把我参与编写的这套《Python知识手册》免费分享出来,看完文末有惊喜哦。...

利用python进行数据分析,PDF文档给你答案

本书详细介绍利用Python进行操作、处理、清洗和规整数据等方面的具体细节和基本要点。虽然本书的标题是“数据分析”,重点却是Python编程、库,以及用于数据分析的工具。兄弟,毫无套路!PDF版无偿获...

OCRmypdf:一款可以让扫描PDF文件变得可搜索、可复制!

简介在日常工作中,我们经常会接触到各种PDF文件,其中不少是扫描版文档。处理这些扫描PDF时,尽管内容看似完整,但往往无法直接复制或搜索其中的文本。尤其是在需要对大量文档进行文本分析、存档或后期编辑时...

高效的OCR处理工具!让扫描PDF文件变得可搜索、可复制!

在工作中,我们常常遇到各种各样的PDF文件,其中不乏一些扫描版的文档。而在处理扫描的PDF文件时,虽然文件内容看似完整,但你却无法复制、搜索其中的文本。特别是对大量文档需要进行文本分析、存档、或者...

三步教你用Elasticsearch+PyMuPDF实现PDF大文件秒搜!

面对100页以上的大型PDF文件时,阅读和搜索往往效率低下。传统关系型数据库在处理此类数据时容易遇到性能瓶颈,而Elasticsearch凭借其强大的全文检索和分布式架构,成为理想解决方案。通过...

用 Python 去除 PDF 水印,你学会吗?

今天介绍下用Python去除PDF(图片)的水印。思路很简单,代码也很简洁。首先来考虑Python如何去除图片的水印,然后再将思路复用到PDF上面。这张图片是前几天整理《数据结构和算法...

扫描PDF档案效率提升300%!OCRmyPDF:告别无法搜索的PDF噩梦,这款26K Star的开源神器让文本识别轻松上手!

要在PDF中搜索某个关键词,结果发现啥也找不到?这种情况大多数人都遇到过吧,特别是处理扫描文档或图片PDF时。就在前几天,我还在为这事抓狂呢!后来无意中发现了OCRmyPDF这个宝藏项目...简直就...

Python自动化办公之PDF版本发票识别并提取关键信息教程(上篇)

大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Python自动化办公发票数据处理的问题,一起来看看吧。二、实现过程这个问题在实际工作中还是非常常见的,实用性和通用性都比...

PDF解锁神器:用PyMuPDF与pdfplumber告别手动提取

前言大家好,今天咱们来聊聊如何用Python中的PyMuPDF和pdfplumber库,轻松提取PDF文件里的文本和元数据。你是否曾经在处理一个复杂的PDF文件时,感到信息难以触及,提取过程让人抓狂?...

《Python知识手册》,高清pdf免费获取

今天我要把我参与编写的这套《Python知识手册》免费分享出来,真正弘扬Python开源精神!手册的部分页面如下:获取方式:...

取消回复欢迎 发表评论: