百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python基础——数据深拷贝、浅拷贝

off999 2024-10-05 19:43 30 浏览 0 评论

各基本数据类型的地址存储及改变情况在python中的数据类型包括:bool、int、long、float、str、set、list、tuple、dict等等。我们可以大致将这些数据类型归类为简单数据类型和复杂的数据结构。

数据结构: 集合结构:set 序列结构: tuple list (str) 映射结构: dict

基本数据类型 Int long float bool str ..

说明:由于python中的变量都是采用的引用语义,数据结构可以包含基础数据类型,导致了在python中数据的存储是下图这种情况,每个变量中都存储了这个变量的地址,而不是值本身;对于复杂的数据结构来说,里面的存储的也只只是每个元素的地址而已

1.数据类型重新初始化对python语义引用的影响

变量的每一次初始化,都开辟了一个新的空间,将新内容的地址赋值给变量

str = "hello word"print(id(str))    #43863640str1 = "new hello word"<br>print(id(str1))   #43863680

从上代码中可以看出str在重复的初始化过程中,是因为str中存储的元素地址由'hello world'的地址变成了'new hello world'的。

2.数据结构内部元素变化重对python语义引用的影响

对于复杂的数据类型来说,改变其内部的值对于变量的影响:

list1 = [1,2,3,4,5,6]print(id(list1))     #7705224list1.append('new item')print(id(list1))     #7705224list1.pop()print(list1)       #[1, 2, 3, 4, 5, 6]list1[0] = 'change_test'print(list1)          #['change_test', 2, 3, 4, 5, 6]print(id(list1))      #7705224list1 = [1,2,3,4,5]print(id(list1))      #7705224

当对列表中的元素进行一些增删改的操作的时候,是不会影响到lst1列表本身对于整个列表地址的,只会改变其内部元素的地址引用。可是当我们对于一个列表重新初始化(赋值)的时候,就给list1这个变量重新赋予了一个地址,覆盖了原本列表的地址,这个时候,list1列表的内存id就发生了改变。上面这个道理用在所有复杂的数据类型中都是一样的

3.变量的赋值

  • View Code我们刚刚已经知道,str1的再次初始化(赋值)会导致内存地址的改变,从上图的结果我们可以看出修改了str1之后,被赋值的str2从内存地址到值都没有受到影响

看内存中的变化,起始的赋值操作让str1和str2变量都存储了‘hello world’所在的地址,重新对str1初始化,使str1中存储的地址发生了改变,指向了新建的值,此时str2变量存储的内存地址并未改变,所以不受影响。

4.复杂的数据结构中的赋值 

print("复杂的数据结构中的赋值")list1 = [1, 2, 3, 4, 5, 6]list2 = list1print(id(list1)) # 42367240print(id(list2)) # 42367240list1.append('new item')print(list1) # [1, 2, 3, 4, 5, 6, 'new item']print(list2) # [1, 2, 3, 4, 5, 6, 'new item']print(id(list1)) # 42367240print(id(list2)) # 42367240

由次可知列表的增加修改操作,没有改变列表的内存地址,lst1和lst2都发生了变化,在列表中添加新值时,列表中又多存储了一个新元素的地址,而列表本身的地址没有变化,所以lst1和lst2的id均没有改变并且都被添加了一个新的元素

初识拷贝

我们已经详细了解了变量赋值的过程。对于复杂的数据结构来说,赋值就等于完全共享了资源,一个值的改变会完全被另一个值共享。然而有的时候,我们偏偏需要将一份数据的原始内容保留一份,再去处理数据,这个时候使用赋值就不够明智了。python为这种需求提供了copy模块。提供了两种主要的copy方法,一种是普通的copy,另一种是deepcopy。我们称前者是浅拷贝,后者为深拷贝。

深浅拷贝一直是所有编程语言的重要知识点,下面我们就从内存的角度来分析一下两者的区别。

浅拷贝:

首先,我们来了解

print("浅拷贝")import copylst = ['str1', 'str2', 'str3']sourcelst = ['str1', 'str2', 'str3', lst]copylst = copy.copy(sourcelst)print("原本地址")print([id(ele) for ele in sourcelst])print([id(ele) for ele in copylst])print("当sourceLst列表发生变化,copyLst中存储的lst内存地址没有改变")sourcelst.append('source')copylst.append('copy')print("->sourcelst: ", sourcelst)print("->copylst: ", copylst)print(id(sourcelst)) # 4print(sourcelst) # 5print([id(ele) for ele in sourcelst])print(id(copylst)) # 4print(copylst) # 5print([id(ele) for ele in copylst])print("sourceLst的第一个元素发生了变化。而copyLst还是存储了str1的地址,所以copyLst不会发生改变。")print([id(ele) for ele in sourcelst])print([id(ele) for ele in copylst])sourcelst[0] = 'change'print("->sourcelst: ", sourcelst)print("->copylst: ", copylst)print(id(sourcelst)) # 4print(sourcelst) # 5print([id(ele) for ele in sourcelst])print(id(copylst)) # 4print(copylst) # 5print([id(ele) for ele in copylst])print("以当lst发生改变的时候,sourceLst和copyLst两个列表就都发生了改变。")print([id(ele) for ele in sourcelst])print([id(ele) for ele in copylst])lst.append('Append')print("->sourcelst: ", sourcelst)print("->copylst: ", copylst)print(id(sourcelst)) # 4print(sourcelst) # 5print([id(ele) for ele in sourcelst])print(id(copylst)) # 4print(copylst) # 5print([id(ele) for ele in copylst])

浅拷贝:不管多么复杂的数据结构,浅拷贝都只会copy一层 。

深拷贝

刚刚我们了解了浅拷贝的意义,但是在写程序的时候,我们就是希望复杂的数据结构之间完全copy一份并且它们之间又没有一毛钱关系,应该怎么办呢?我们引入一个深拷贝的概念,深拷贝——即python的copy模块提供的另一个deepcopy方法。深拷贝会完全复制原变量相关的所有数据,在内存中生成一套完全一样的内容,在这个过程中我们对这两个变量中的一个进行任意修改都不会影响其他变量。下面我们就来试验一下。

看上面的执行结果,这一次我们不管是对直接对列表进行操作还是对列表内嵌套的其他数据结构操作,都不会产生拷贝的列表受影响的情况。我们再来看看这些变量在内存中的状况

看了上面的内容,我们就知道了深拷贝的原理。其实深拷贝就是在内存中重新开辟一块空间,不管数据结构多么复杂,只要遇到可能发生改变的数据类型,就重新开辟一块内存空间把内容复制下来,直到最后一层,不再有复杂的数据类型,就保持其原引用。这样,不管数据结构多么的复杂,数据之间的修改都不会相互影响。这就是深拷贝~~~

print("深拷贝")import copylst = ['str1', 'str2', 'str3']sourcelst = ['str1', 'str2', 'str3', lst]deepcopylst = copy.deepcopy(sourcelst)print("原本地址")print([id(ele) for ele in sourcelst])print([id(ele) for ele in deepcopylst])print("当sourceLst列表发生变化,copyLst中存储的lst内存地址没有改变")sourcelst.append('source')deepcopylst.append('deepcopy')print("->sourcelst: ", sourcelst)print("->deepcopylst: ", deepcopylst)print(id(sourcelst)) # 4print(sourcelst) # 5print([id(ele) for ele in sourcelst])print(id(deepcopylst)) # 4print(deepcopylst) # 5print([id(ele) for ele in deepcopylst])print("sourceLst的第一个元素发生了变化。而copyLst还是存储了str1的地址,所以copyLst不会发生改变。")print([id(ele) for ele in sourcelst])print([id(ele) for ele in deepcopylst])sourcelst[0] = 'change'print("->sourcelst: ", sourcelst)print("->deepcopylst: ", deepcopylst)print(id(sourcelst)) # 4print(sourcelst) # 5print([id(ele) for ele in sourcelst])print(id(deepcopylst)) # 4print(deepcopylst) # 5print([id(ele) for ele in deepcopylst])print("以当lst发生改变的时候,sourceLst和copyLst两个列表就都发生了改变。")print([id(ele) for ele in sourcelst])print([id(ele) for ele in deepcopylst])lst.append('Append')print("->sourcelst: ", sourcelst)print("->copylst: ", deepcopylst)print(id(sourcelst)) # 4print(sourcelst) # 5print([id(ele) for ele in sourcelst])print(id(deepcopylst)) # 4print(deepcopylst) # 5print([id(ele) for ele in deepcopylst])

直接看一段代码:

import copywill = ["Will", 28, ["Python", "C#", "JavaScript"]]# wilber = copy.deepcopy(will)wilber = willprint(id(will)) # 1print(will) # 2print([id(ele) for ele in will]) # 3print(id(wilber)) # 4print(wilber) # 5print([id(ele) for ele in wilber])print("\n")will[0] = "Wilber"will[2].append("CSS")print(id(will)) # 6print(will)print([id(ele) for ele in will])print(id(wilber))print(wilber)print([id(ele) for ele in wilber])

代码输出结果:

['Will', 28, ['Python', 'C#', 'JavaScript']][31949688, 506294592, 42511880]42511816['Will', 28, ['Python', 'C#', 'JavaScript']][31949688, 506294592, 42511880]42511816['Wilber', 28, ['Python', 'C#', 'JavaScript', 'CSS']][42534368, 506294592, 42511880]42511816['Wilber', 28, ['Python', 'C#', 'JavaScript', 'CSS']][42534368, 506294592, 42511880]Process finished with exit code 0  
['Will', 28, ['Python', 'C#', 'JavaScript']][31949688, 506294592, 42511880]42511816['Will', 28, ['Python', 'C#', 'JavaScript']][31949688, 506294592, 42511880]42511816['Wilber', 28, ['Python', 'C#', 'JavaScript', 'CSS']][42534368, 506294592, 42511880]42511816['Wilber', 28, ['Python', 'C#', 'JavaScript', 'CSS']][42534368, 506294592, 42511880]Process finished with exit code 0  

下面来分析一下这段代码:

首先,创建了一个名为will的变量,这个变量指向一个list对象,从第一张图中可以看到所有对象的地址(每次运行,结果可能不同)

然后,通过will变量对wilber变量进行赋值,那么wilber变量将指向will变量对应的对象(内存地址),也就是说”wilber is will”,”wilber[i] is will[i]”可以理解为,Python中,对象的赋值都是进行对象引用(内存地址)传递


总结

本文介绍了对象的赋值和拷贝,以及它们之间的差异:

  • Python中对象的赋值都是进行对象引用(内存地址)传递
  • 使用copy.copy(),可以进行对象的浅拷贝,它复制了对象,但对于对象中的元素,依然使用原始的引用.
  • 如果需要复制一个容器对象,以及它里面的所有元素(包含元素的子元素),可以使用copy.deepcopy()进行深拷贝
  • 对于非容器类型(如数字、字符串、和其他’原子’类型的对象)没有被拷贝一说
  • 如果元组变量只包含空列表类型对象,则不能深拷贝


相关推荐

阿里云国际站ECS:阿里云ECS如何提高网站的访问速度?

TG:@yunlaoda360引言:速度即体验,速度即业务在当今数字化的世界中,网站的访问速度已成为决定用户体验、用户留存乃至业务转化率的关键因素。页面加载每延迟一秒,都可能导致用户流失和收入损失。对...

高流量大并发Linux TCP性能调优_linux 高并发网络编程

其实主要是手里面的跑openvpn服务器。因为并没有明文禁p2p(哎……想想那么多流量好像不跑点p2p也跑不完),所以造成有的时候如果有比较多人跑BT的话,会造成VPN速度急剧下降。本文所面对的情况为...

性能测试100集(12)性能指标资源使用率

在性能测试中,资源使用率是评估系统硬件效率的关键指标,主要包括以下四类:#性能测试##性能压测策略##软件测试#1.CPU使用率定义:CPU处理任务的时间占比,计算公式为1-空闲时间/总...

Linux 服务器常见的性能调优_linux高性能服务端编程

一、Linux服务器性能调优第一步——先搞懂“看什么”很多人刚接触Linux性能调优时,总想着直接改配置,其实第一步该是“看清楚问题”。就像医生看病要先听诊,调优前得先知道服务器“哪里...

Nginx性能优化实战:手把手教你提升10倍性能!

关注△mikechen△,十余年BAT架构经验倾囊相授!Nginx是大型架构而核心,下面我重点详解Nginx性能@mikechen文章来源:mikechen.cc1.worker_processe...

高并发场景下,Spring Cloud Gateway如何抗住百万QPS?

关注△mikechen△,十余年BAT架构经验倾囊相授!大家好,我是mikechen。高并发场景下网关作为流量的入口非常重要,下面我重点详解SpringCloudGateway如何抗住百万性能@m...

Kubernetes 高并发处理实战(可落地案例 + 源码)

目标场景:对外提供HTTPAPI的微服务在短时间内收到大量请求(例如每秒数千至数万RPS),要求系统可弹性扩容、限流降级、缓存减压、稳定运行并能自动恢复。总体思路(多层防护):边缘层:云LB...

高并发场景下,Nginx如何扛住千万级请求?

Nginx是大型架构的必备中间件,下面我重点详解Nginx如何实现高并发@mikechen文章来源:mikechen.cc事件驱动模型Nginx采用事件驱动模型,这是Nginx高并发性能的基石。传统...

Spring Boot+Vue全栈开发实战,中文版高清PDF资源

SpringBoot+Vue全栈开发实战,中文高清PDF资源,需要的可以私我:)SpringBoot致力于简化开发配置并为企业级开发提供一系列非业务性功能,而Vue则采用数据驱动视图的方式将程序...

Docker-基础操作_docker基础实战教程二

一、镜像1、从仓库获取镜像搜索镜像:dockersearchimage_name搜索结果过滤:是否官方:dockersearch--filter="is-offical=true...

你有空吗?跟我一起搭个服务器好不好?

来人人都是产品经理【起点学院】,BAT实战派产品总监手把手系统带你学产品、学运营。昨天闲的没事的时候,随手翻了翻写过的文章,发现一个很严重的问题。就是大多数时间我都在滔滔不绝的讲理论,却很少有涉及动手...

部署你自己的 SaaS_saas如何部署

部署你自己的VPNOpenVPN——功能齐全的开源VPN解决方案。(DigitalOcean教程)dockovpn.io—无状态OpenVPNdockerized服务器,不需要持久存储。...

Docker Compose_dockercompose安装

DockerCompose概述DockerCompose是一个用来定义和管理多容器应用的工具,通过一个docker-compose.yml文件,用YAML格式描述服务、网络、卷等内容,...

京东T7架构师推出的电子版SpringBoot,从构建小系统到架构大系统

前言:Java的各种开发框架发展了很多年,影响了一代又一代的程序员,现在无论是程序员,还是架构师,使用这些开发框架都面临着两方面的挑战。一方面是要快速开发出系统,这就要求使用的开发框架尽量简单,无论...

Kubernetes (k8s) 入门学习指南_k8s kubeproxy

Kubernetes(k8s)入门学习指南一、什么是Kubernetes?为什么需要它?Kubernetes(k8s)是一个开源的容器编排系统,用于自动化部署、扩展和管理容器化应用程序。它...

取消回复欢迎 发表评论: