Python基础——数据深拷贝、浅拷贝
off999 2024-10-05 19:43 25 浏览 0 评论
各基本数据类型的地址存储及改变情况在python中的数据类型包括:bool、int、long、float、str、set、list、tuple、dict等等。我们可以大致将这些数据类型归类为简单数据类型和复杂的数据结构。
数据结构: 集合结构:set 序列结构: tuple list (str) 映射结构: dict
基本数据类型 Int long float bool str ..
说明:由于python中的变量都是采用的引用语义,数据结构可以包含基础数据类型,导致了在python中数据的存储是下图这种情况,每个变量中都存储了这个变量的地址,而不是值本身;对于复杂的数据结构来说,里面的存储的也只只是每个元素的地址而已
1.数据类型重新初始化对python语义引用的影响
变量的每一次初始化,都开辟了一个新的空间,将新内容的地址赋值给变量
str = "hello word"print(id(str)) #43863640str1 = "new hello word"<br>print(id(str1)) #43863680
从上代码中可以看出str在重复的初始化过程中,是因为str中存储的元素地址由'hello world'的地址变成了'new hello world'的。
2.数据结构内部元素变化重对python语义引用的影响
对于复杂的数据类型来说,改变其内部的值对于变量的影响:
list1 = [1,2,3,4,5,6]print(id(list1)) #7705224list1.append('new item')print(id(list1)) #7705224list1.pop()print(list1) #[1, 2, 3, 4, 5, 6]list1[0] = 'change_test'print(list1) #['change_test', 2, 3, 4, 5, 6]print(id(list1)) #7705224list1 = [1,2,3,4,5]print(id(list1)) #7705224
当对列表中的元素进行一些增删改的操作的时候,是不会影响到lst1列表本身对于整个列表地址的,只会改变其内部元素的地址引用。可是当我们对于一个列表重新初始化(赋值)的时候,就给list1这个变量重新赋予了一个地址,覆盖了原本列表的地址,这个时候,list1列表的内存id就发生了改变。上面这个道理用在所有复杂的数据类型中都是一样的
3.变量的赋值
- View Code我们刚刚已经知道,str1的再次初始化(赋值)会导致内存地址的改变,从上图的结果我们可以看出修改了str1之后,被赋值的str2从内存地址到值都没有受到影响
看内存中的变化,起始的赋值操作让str1和str2变量都存储了‘hello world’所在的地址,重新对str1初始化,使str1中存储的地址发生了改变,指向了新建的值,此时str2变量存储的内存地址并未改变,所以不受影响。
4.复杂的数据结构中的赋值
print("复杂的数据结构中的赋值")list1 = [1, 2, 3, 4, 5, 6]list2 = list1print(id(list1)) # 42367240print(id(list2)) # 42367240list1.append('new item')print(list1) # [1, 2, 3, 4, 5, 6, 'new item']print(list2) # [1, 2, 3, 4, 5, 6, 'new item']print(id(list1)) # 42367240print(id(list2)) # 42367240
由次可知列表的增加修改操作,没有改变列表的内存地址,lst1和lst2都发生了变化,在列表中添加新值时,列表中又多存储了一个新元素的地址,而列表本身的地址没有变化,所以lst1和lst2的id均没有改变并且都被添加了一个新的元素
初识拷贝
我们已经详细了解了变量赋值的过程。对于复杂的数据结构来说,赋值就等于完全共享了资源,一个值的改变会完全被另一个值共享。然而有的时候,我们偏偏需要将一份数据的原始内容保留一份,再去处理数据,这个时候使用赋值就不够明智了。python为这种需求提供了copy模块。提供了两种主要的copy方法,一种是普通的copy,另一种是deepcopy。我们称前者是浅拷贝,后者为深拷贝。
深浅拷贝一直是所有编程语言的重要知识点,下面我们就从内存的角度来分析一下两者的区别。
浅拷贝:
首先,我们来了解
print("浅拷贝")import copylst = ['str1', 'str2', 'str3']sourcelst = ['str1', 'str2', 'str3', lst]copylst = copy.copy(sourcelst)print("原本地址")print([id(ele) for ele in sourcelst])print([id(ele) for ele in copylst])print("当sourceLst列表发生变化,copyLst中存储的lst内存地址没有改变")sourcelst.append('source')copylst.append('copy')print("->sourcelst: ", sourcelst)print("->copylst: ", copylst)print(id(sourcelst)) # 4print(sourcelst) # 5print([id(ele) for ele in sourcelst])print(id(copylst)) # 4print(copylst) # 5print([id(ele) for ele in copylst])print("sourceLst的第一个元素发生了变化。而copyLst还是存储了str1的地址,所以copyLst不会发生改变。")print([id(ele) for ele in sourcelst])print([id(ele) for ele in copylst])sourcelst[0] = 'change'print("->sourcelst: ", sourcelst)print("->copylst: ", copylst)print(id(sourcelst)) # 4print(sourcelst) # 5print([id(ele) for ele in sourcelst])print(id(copylst)) # 4print(copylst) # 5print([id(ele) for ele in copylst])print("以当lst发生改变的时候,sourceLst和copyLst两个列表就都发生了改变。")print([id(ele) for ele in sourcelst])print([id(ele) for ele in copylst])lst.append('Append')print("->sourcelst: ", sourcelst)print("->copylst: ", copylst)print(id(sourcelst)) # 4print(sourcelst) # 5print([id(ele) for ele in sourcelst])print(id(copylst)) # 4print(copylst) # 5print([id(ele) for ele in copylst])
浅拷贝:不管多么复杂的数据结构,浅拷贝都只会copy一层 。
深拷贝
刚刚我们了解了浅拷贝的意义,但是在写程序的时候,我们就是希望复杂的数据结构之间完全copy一份并且它们之间又没有一毛钱关系,应该怎么办呢?我们引入一个深拷贝的概念,深拷贝——即python的copy模块提供的另一个deepcopy方法。深拷贝会完全复制原变量相关的所有数据,在内存中生成一套完全一样的内容,在这个过程中我们对这两个变量中的一个进行任意修改都不会影响其他变量。下面我们就来试验一下。
看上面的执行结果,这一次我们不管是对直接对列表进行操作还是对列表内嵌套的其他数据结构操作,都不会产生拷贝的列表受影响的情况。我们再来看看这些变量在内存中的状况
看了上面的内容,我们就知道了深拷贝的原理。其实深拷贝就是在内存中重新开辟一块空间,不管数据结构多么复杂,只要遇到可能发生改变的数据类型,就重新开辟一块内存空间把内容复制下来,直到最后一层,不再有复杂的数据类型,就保持其原引用。这样,不管数据结构多么的复杂,数据之间的修改都不会相互影响。这就是深拷贝~~~
print("深拷贝")import copylst = ['str1', 'str2', 'str3']sourcelst = ['str1', 'str2', 'str3', lst]deepcopylst = copy.deepcopy(sourcelst)print("原本地址")print([id(ele) for ele in sourcelst])print([id(ele) for ele in deepcopylst])print("当sourceLst列表发生变化,copyLst中存储的lst内存地址没有改变")sourcelst.append('source')deepcopylst.append('deepcopy')print("->sourcelst: ", sourcelst)print("->deepcopylst: ", deepcopylst)print(id(sourcelst)) # 4print(sourcelst) # 5print([id(ele) for ele in sourcelst])print(id(deepcopylst)) # 4print(deepcopylst) # 5print([id(ele) for ele in deepcopylst])print("sourceLst的第一个元素发生了变化。而copyLst还是存储了str1的地址,所以copyLst不会发生改变。")print([id(ele) for ele in sourcelst])print([id(ele) for ele in deepcopylst])sourcelst[0] = 'change'print("->sourcelst: ", sourcelst)print("->deepcopylst: ", deepcopylst)print(id(sourcelst)) # 4print(sourcelst) # 5print([id(ele) for ele in sourcelst])print(id(deepcopylst)) # 4print(deepcopylst) # 5print([id(ele) for ele in deepcopylst])print("以当lst发生改变的时候,sourceLst和copyLst两个列表就都发生了改变。")print([id(ele) for ele in sourcelst])print([id(ele) for ele in deepcopylst])lst.append('Append')print("->sourcelst: ", sourcelst)print("->copylst: ", deepcopylst)print(id(sourcelst)) # 4print(sourcelst) # 5print([id(ele) for ele in sourcelst])print(id(deepcopylst)) # 4print(deepcopylst) # 5print([id(ele) for ele in deepcopylst])
直接看一段代码:
import copywill = ["Will", 28, ["Python", "C#", "JavaScript"]]# wilber = copy.deepcopy(will)wilber = willprint(id(will)) # 1print(will) # 2print([id(ele) for ele in will]) # 3print(id(wilber)) # 4print(wilber) # 5print([id(ele) for ele in wilber])print("\n")will[0] = "Wilber"will[2].append("CSS")print(id(will)) # 6print(will)print([id(ele) for ele in will])print(id(wilber))print(wilber)print([id(ele) for ele in wilber])
代码输出结果:
['Will', 28, ['Python', 'C#', 'JavaScript']][31949688, 506294592, 42511880]42511816['Will', 28, ['Python', 'C#', 'JavaScript']][31949688, 506294592, 42511880]42511816['Wilber', 28, ['Python', 'C#', 'JavaScript', 'CSS']][42534368, 506294592, 42511880]42511816['Wilber', 28, ['Python', 'C#', 'JavaScript', 'CSS']][42534368, 506294592, 42511880]Process finished with exit code 0
['Will', 28, ['Python', 'C#', 'JavaScript']][31949688, 506294592, 42511880]42511816['Will', 28, ['Python', 'C#', 'JavaScript']][31949688, 506294592, 42511880]42511816['Wilber', 28, ['Python', 'C#', 'JavaScript', 'CSS']][42534368, 506294592, 42511880]42511816['Wilber', 28, ['Python', 'C#', 'JavaScript', 'CSS']][42534368, 506294592, 42511880]Process finished with exit code 0
下面来分析一下这段代码:
首先,创建了一个名为will的变量,这个变量指向一个list对象,从第一张图中可以看到所有对象的地址(每次运行,结果可能不同)
然后,通过will变量对wilber变量进行赋值,那么wilber变量将指向will变量对应的对象(内存地址),也就是说”wilber is will”,”wilber[i] is will[i]”可以理解为,Python中,对象的赋值都是进行对象引用(内存地址)传递
总结
本文介绍了对象的赋值和拷贝,以及它们之间的差异:
- Python中对象的赋值都是进行对象引用(内存地址)传递
- 使用copy.copy(),可以进行对象的浅拷贝,它复制了对象,但对于对象中的元素,依然使用原始的引用.
- 如果需要复制一个容器对象,以及它里面的所有元素(包含元素的子元素),可以使用copy.deepcopy()进行深拷贝
- 对于非容器类型(如数字、字符串、和其他’原子’类型的对象)没有被拷贝一说
- 如果元组变量只包含空列表类型对象,则不能深拷贝
相关推荐
- Python设计模式 第 13 章 中介者模式(Mediator Pattern)
-
在行为型模式中,中介者模式是解决“多对象间网状耦合”问题的核心模式。它就像“机场调度中心”——多个航班(对象)无需直接沟通起飞、降落时间,只需通过调度中心(中介者)协调,避免航班间的冲突与混乱...
- 1.3.1 python交互式模式的特点和用法
-
什么是Python交互模式Python交互模式,也叫Python交互式编程,是一种在Python解释器中运行的模式,它允许用户在解释器窗口中输入单个Python语句,并立即查看结果,而不需要编写整个程...
- Python设计模式 第 8 章 装饰器模式(Decorator Pattern)
-
在结构型模式中,装饰器模式是实现“动态功能扩展”的核心模式。它就像“手机壳与手机的关系”——手机(原始对象)具备通话、上网等基础功能,手机壳(装饰器)可在不改变手机本身的前提下,为其新增保护、...
- python设计模式 综合应用与实战指南
-
经过前面16章的学习,我们已系统掌握创建型模式(单例、工厂、建造者、原型)、结构型模式(适配器、桥接、组合、装饰器、外观、享元、代理)、行为型模式(责任链、命令、迭代器、中介者、观察者、状态、策略...
- Python入门学习教程:第 16 章 图形用户界面(GUI)编程
-
16.1什么是GUI编程?图形用户界面(GraphicalUserInterface,简称GUI)是指通过窗口、按钮、菜单、文本框等可视化元素与用户交互的界面。与命令行界面(CLI)相比,...
- Python 中 必须掌握的 20 个核心:str()
-
str()是Python中用于将对象转换为字符串表示的核心函数,它在字符串处理、输出格式化和对象序列化中扮演着关键角色。本文将全面解析str()函数的用法和特性。1.str()函数的基本用法1.1...
- Python偏函数实战:用functools.partial减少50%重复代码的技巧
-
你是不是经常遇到这样的场景:写代码时同一个函数调用了几十次,每次都要重复传递相同的参数?比如处理文件时总要用encoding='utf-8',调用API时固定传Content-Type...
- 第2节.变量和数据类型【第29课-输出总结】
-
同学们,关于输出的知识点讲解完成之后,把重点性的知识点做一个总结回顾。·首先对于输出这一章节讲解的比如有格式化符号,格式化符号这里需要同学们额外去多留意的是不是百分号s格式化输出字符串。当然课上也说百...
- AI最火语言python之json操作_python json.loads()
-
JSON(JavaScriptObjectNotation,JavaScript对象表示法)是一种开放标准的文件格式和数据交换格式,它易于人阅读和编写。JSON是一种常用的数据格式,比如对接各种第...
- python中必须掌握的20个核心函数—split()详解
-
split()是Python字符串对象的方法,用于将字符串按照指定的分隔符拆分成列表。它是文本处理中最常用的函数之一。一、split()的基本用法1.1基本语法str.split(sep=None,...
- 实用方法分享:pdf文件分割方法 横向A3分割成纵向A4
-
今天在街上打印店给儿子打印试卷时,我在想:能不能,把它分割成A4在家中打印,这样就不需要跑到街上的打印店打印卷子了。原来,老师发的作业,是电子稿,pdf文件,A3格式的试卷。可是家中的打印机只能打印A...
- 20道常考Python面试题大总结_20道常考python面试题大总结免费
-
20道常考Python面试题大总结关于Python的面试经验一般来说,面试官会根据求职者在简历中填写的技术及相关细节来出面试题。一位拿了大厂技术岗SpecialOffer的网友分享了他总结的面试经...
- Kotlin Data Classes 快速上手_kotlin快速入门
-
引言在日常开发中,我们常常需要创建一些只用来保存数据的类。问题是,这样的类往往需要写一堆模板化的方法:equals()、hashCode()、toString()……每次都重复,既枯燥又容易出错。//...
- python自动化RobotFramework中Collections字典关键字使用(五)
-
前言介绍安装好robotframework库后,跟之前文章介绍的BuiltIn库一样BuiltIn库使用介绍,在“python安装目录\Lib\site-packages\robot\librarie...
- Python中numpy数据分析库知识点总结
-
Python中numpy数据分析库知识点总结二、对已读取数据的处理②指定一个值,并对该值双边进行修改③指定两个值,并对第一个值的左侧和第二个值的右侧进行修改2.4数组的拼接和行列交换①竖直拼接(np...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- Python设计模式 第 13 章 中介者模式(Mediator Pattern)
- 1.3.1 python交互式模式的特点和用法
- Python设计模式 第 8 章 装饰器模式(Decorator Pattern)
- python设计模式 综合应用与实战指南
- Python入门学习教程:第 16 章 图形用户界面(GUI)编程
- Python 中 必须掌握的 20 个核心:str()
- Python偏函数实战:用functools.partial减少50%重复代码的技巧
- 第2节.变量和数据类型【第29课-输出总结】
- AI最火语言python之json操作_python json.loads()
- python中必须掌握的20个核心函数—split()详解
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)