Python学不会来打我(5)深拷贝和浅拷贝详解
off999 2025-09-06 10:12 16 浏览 0 评论
2025年Python开发者调查显示,超过65%的数据处理bug源于拷贝操作不当。本文将通过内存模型图解与实战案例,系统解析深拷贝与浅拷贝的核心差异,助你彻底掌握Python数据复制的精髓。
一、拷贝的本质:内存管理的艺术
1. 变量赋值的真相
a = [1, 2, 3]
b = a # 不是拷贝,是引用别名
b.append(4)
print(a) # [1, 2, 3, 4] 原对象被修改!内存模型
- 原理:Python变量存储对象引用,而非对象本身
- 风险:多个变量指向同一对象时,修改会相互影响
2. 拷贝的核心分类
二、浅拷贝:表面复制的双刃剑
1. 实现机制
2. 数据类型行为分析
列表(list)
import copy
lst = [1, [2, 3], 4]
shallow_lst = copy.copy(lst)
shallow_lst[0] = 99 # 修改顶层元素
print(lst) # [1, [2,3], 4] → 不影响原对象
shallow_lst[1].append(5) # 修改子对象
print(lst) # [1, [2,3,5], 4] → 原对象被修改!字典(dict)
person = {
"name": "Alice",
"skills": ["Python", "SQL"]
}
shallow_person = copy.copy(person)
shallow_person["skills"].append("Java")
print(person["skills"]) # ['Python','SQL','Java'] 原数据被修改自定义对象
class User:
def __init__(self, name):
self.name = name
self.roles = []
u1 = User("Bob")
u1.roles.append("admin")
u2 = copy.copy(u1)
u2.roles.append("editor")
print(u1.roles) # ['admin','editor'] 共享引用3. 浅拷贝的三种实现方式
- 切片操作:new_list = old_list[:]
- 工厂函数:new_dict = dict(old_dict)
- copy模块:copy.copy()
三、深拷贝:彻底的独立王国
1. 实现机制
2. 深拷贝实战
import copy
# 嵌套数据结构
data = {
"matrix": [
[1, 2],
[3, 4]
],
"config": {
"size": 10,
"enabled": True
}
}
# 深拷贝创建完全独立副本
deep_data = copy.deepcopy(data)
# 修改副本
deep_data["matrix"][0][0] = 99
deep_data["config"]["size"] = 20
print(data["matrix"][0][0]) # 1 → 原对象未受影响
print(data["config"]["size"]) # 10 → 原对象未受影响3. 深拷贝的边界情况
递归对象处理
a = []
a.append(a) # 创建递归引用
try:
b = copy.deepcopy(a) # 能正确处理递归
print(b[0] is b) # True → 保持递归结构
except RecursionError:
print("递归深度超出")外部资源处理
import socket
class Connection:
def __init__(self):
self.sock = socket.socket()
conn = Connection()
deep_conn = copy.deepcopy(conn) # 引发TypeError
# 解决方案:实现__deepcopy__方法
class SafeConnection:
def __deepcopy__(self, memo):
new_obj = self.__class__()
# 创建新套接字而非复制
new_obj.sock = socket.socket()
return new_obj四、数据类型深度解析
1. 列表(list)的拷贝行为
2. 字典(dict)的拷贝特性
original = {
"id": 1001,
"tags": ["urgent", "important"]
}
# 浅拷贝方法
shallow = dict(original) # 或 original.copy()
# 深拷贝方法
deep = copy.deepcopy(original)
# 测试修改
shallow["tags"].append("new")
print(original["tags"]) # ['urgent','important','new']
deep["tags"].append("test")
print(original["tags"]) # ['urgent','important','new'] 不变3. 集合(set)的拷贝陷阱
s1 = {1, 2, [3,4]} # TypeError: unhashable type: 'list'
# 正确使用
s2 = {1, 2, (3,4)}
s2_copy = s2.copy() # 浅拷贝
# 深拷贝需求场景
s3 = {1, 2, frozenset([3,4])}
s3_deep = copy.deepcopy(s3) # 需要深拷贝4. 不可变类型的特殊行为
# 元组浅拷贝
t1 = (1, 2, [3])
t2 = tuple(t1) # 浅拷贝
print(id(t1) == id(t2)) # True → 相同对象
# 元组深拷贝
t3 = copy.deepcopy(t1)
print(id(t1) == id(t3)) # False → 新对象
t3[2].append(4) # 修改嵌套列表
print(t1) # (1,2,[3,4]) 原对象被影响!五、拷贝性能大比拼
1. 时间开销测试(10000次操作)
- 内存占用对比
import sys
data = [[i for i in range(1000)] for _ in range(100)]
print("原始数据:", sys.getsizeof(data))
print("浅拷贝:", sys.getsizeof(copy.copy(data)))
print("深拷贝:", sys.getsizeof(copy.deepcopy(data)))
# 输出示例:
# 原始数据: 8856
# 浅拷贝: 8856 (仅复制外层列表)
# 深拷贝: 162168 (完全复制所有子列表)六、实战应用场景
1. 浅拷贝适用场景
- 配置预设模板:
default_config = {"theme": "dark", "font_size": 12}
user_config = copy.copy(default_config)
user_config["font_size"] = 14 # 不影响默认配置- 多线程共享只读数据:
base_data = [1, 2, 3]
thread_data = [copy.copy(base_data) for _ in range(10)]2. 深拷贝必要场景
- 游戏状态保存/回滚:
class GameState:
def save(self):
return copy.deepcopy(self)
def load(self, state):
self.__dict__ = state.__dict__- 机器学习超参数调优:
base_params = {"model": CNN(), "lr": 0.01}
trial_params = copy.deepcopy(base_params)
trial_params["lr"] = 0.001 # 安全修改七、高级技巧与陷阱规避
1. 自定义拷贝行为
class CustomObject:
def __init__(self, value):
self.value = value
self.timestamp = time.time()
def __copy__(self):
# 自定义浅拷贝逻辑
new = self.__class__(self.value)
new.timestamp = self.timestamp # 共享时间戳
return new
def __deepcopy__(self, memo):
# 自定义深拷贝逻辑
new = self.__class__(copy.deepcopy(self.value, memo))
new.timestamp = time.time() # 生成新时间戳
return new2. 循环引用处理
a = []
b = [a]
a.append(b)
# 标准深拷贝
deep_a = copy.deepcopy(a) # 自动处理循环引用
# 验证独立性
deep_a[0][0] = "modified"
print(a[0][0] is b) # True → 原对象未受影响3. 不可变对象优化
import copy
# Python对不可变对象的优化
t = (1, 2, 3)
shallow_t = copy.copy(t)
deep_t = copy.deepcopy(t)
print(id(t) == id(shallow_t)) # True → 相同对象
print(id(t) == id(deep_t)) # True → 相同对象八、拷贝决策流程图
九、总结:拷贝的三重境界
- 引用层级:理解变量与对象的引用关系
- 内存层级:掌握对象在内存中的存储结构
- 业务层级:根据场景选择最佳拷贝策略
Python标准库copy模块作者Raymond Hettinger强调:
“深拷贝不是默认选择,而是最后的保障。多数场景下,良好的设计能避免深度复制的开销。”
当你在项目中面临拷贝选择时,请思考:
- 数据是否需要完全隔离?
- 性能开销是否可接受?
- 是否存在循环引用等边界情况?
掌握拷贝机制,意味着你已跨越Python初学者的门槛,迈入专业开发者的行列。这种能力将成为你构建健壮、高效系统的核心支柱。
相关推荐
- 阿里云国际站ECS:阿里云ECS如何提高网站的访问速度?
-
TG:@yunlaoda360引言:速度即体验,速度即业务在当今数字化的世界中,网站的访问速度已成为决定用户体验、用户留存乃至业务转化率的关键因素。页面加载每延迟一秒,都可能导致用户流失和收入损失。对...
- 高流量大并发Linux TCP性能调优_linux 高并发网络编程
-
其实主要是手里面的跑openvpn服务器。因为并没有明文禁p2p(哎……想想那么多流量好像不跑点p2p也跑不完),所以造成有的时候如果有比较多人跑BT的话,会造成VPN速度急剧下降。本文所面对的情况为...
- 性能测试100集(12)性能指标资源使用率
-
在性能测试中,资源使用率是评估系统硬件效率的关键指标,主要包括以下四类:#性能测试##性能压测策略##软件测试#1.CPU使用率定义:CPU处理任务的时间占比,计算公式为1-空闲时间/总...
- Linux 服务器常见的性能调优_linux高性能服务端编程
-
一、Linux服务器性能调优第一步——先搞懂“看什么”很多人刚接触Linux性能调优时,总想着直接改配置,其实第一步该是“看清楚问题”。就像医生看病要先听诊,调优前得先知道服务器“哪里...
- Nginx性能优化实战:手把手教你提升10倍性能!
-
关注△mikechen△,十余年BAT架构经验倾囊相授!Nginx是大型架构而核心,下面我重点详解Nginx性能@mikechen文章来源:mikechen.cc1.worker_processe...
- 高并发场景下,Spring Cloud Gateway如何抗住百万QPS?
-
关注△mikechen△,十余年BAT架构经验倾囊相授!大家好,我是mikechen。高并发场景下网关作为流量的入口非常重要,下面我重点详解SpringCloudGateway如何抗住百万性能@m...
- Kubernetes 高并发处理实战(可落地案例 + 源码)
-
目标场景:对外提供HTTPAPI的微服务在短时间内收到大量请求(例如每秒数千至数万RPS),要求系统可弹性扩容、限流降级、缓存减压、稳定运行并能自动恢复。总体思路(多层防护):边缘层:云LB...
- 高并发场景下,Nginx如何扛住千万级请求?
-
Nginx是大型架构的必备中间件,下面我重点详解Nginx如何实现高并发@mikechen文章来源:mikechen.cc事件驱动模型Nginx采用事件驱动模型,这是Nginx高并发性能的基石。传统...
- Spring Boot+Vue全栈开发实战,中文版高清PDF资源
-
SpringBoot+Vue全栈开发实战,中文高清PDF资源,需要的可以私我:)SpringBoot致力于简化开发配置并为企业级开发提供一系列非业务性功能,而Vue则采用数据驱动视图的方式将程序...
- Docker-基础操作_docker基础实战教程二
-
一、镜像1、从仓库获取镜像搜索镜像:dockersearchimage_name搜索结果过滤:是否官方:dockersearch--filter="is-offical=true...
- 你有空吗?跟我一起搭个服务器好不好?
-
来人人都是产品经理【起点学院】,BAT实战派产品总监手把手系统带你学产品、学运营。昨天闲的没事的时候,随手翻了翻写过的文章,发现一个很严重的问题。就是大多数时间我都在滔滔不绝的讲理论,却很少有涉及动手...
- 部署你自己的 SaaS_saas如何部署
-
部署你自己的VPNOpenVPN——功能齐全的开源VPN解决方案。(DigitalOcean教程)dockovpn.io—无状态OpenVPNdockerized服务器,不需要持久存储。...
- Docker Compose_dockercompose安装
-
DockerCompose概述DockerCompose是一个用来定义和管理多容器应用的工具,通过一个docker-compose.yml文件,用YAML格式描述服务、网络、卷等内容,...
- 京东T7架构师推出的电子版SpringBoot,从构建小系统到架构大系统
-
前言:Java的各种开发框架发展了很多年,影响了一代又一代的程序员,现在无论是程序员,还是架构师,使用这些开发框架都面临着两方面的挑战。一方面是要快速开发出系统,这就要求使用的开发框架尽量简单,无论...
- Kubernetes (k8s) 入门学习指南_k8s kubeproxy
-
Kubernetes(k8s)入门学习指南一、什么是Kubernetes?为什么需要它?Kubernetes(k8s)是一个开源的容器编排系统,用于自动化部署、扩展和管理容器化应用程序。它...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
慕ke 前端工程师2024「完整」
-
失业程序员复习python笔记——条件与循环
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
