Python文件压缩神器:ZipFile功能全解析,支持一键压缩和解压
off999 2025-07-09 16:53 30 浏览 0 评论
在Python中处理ZIP文件时,zipfile模块是最常用的工具。它提供了创建、读取、修改ZIP文件的完整功能,无需依赖外部命令。本文将通过核心函数、实战案例和避坑指南,带你掌握这个高效的文件处理模块!
一、ZipFile 类详解:核心参数与方法
1.构造函数:ZipFile (file, mode='r', compression=ZIP_STORED, allowZip64=True)
关键参数:
参数 | 说明 |
file | ZIP 文件名(如'archive.zip')或文件对象 |
mode | 打开模式: |
compression | 压缩方法: |
allowZip64 | 是否支持 64 位扩展(处理大于 4GB 的文件),默认True |
2.核心方法:文件操作
添加文件
- 添加文件:write(filename, arcname=None, compress_type=None)
将本地文件添加到ZIP,arcname指定ZIP内的路径,注意路径中使用‘/’,不使用‘\’
import zipfile
# 使用最高压缩级别创建ZIP
with zipfile.ZipFile('compressed.zip', 'w', compression=zipfile.ZIP_DEFLATED) as zipf:
zipf.write('log.txt') # 自动压缩文件
zipf.write('forder/', arcname='new_folder/') # 仅添加目录名
问题:若filename是文件,则添加该文件;若filename是目录,则仅添加目录名(空目录),不会递归添加其内容。
- 直接写入字符串或字节数据:writestr(zinfo_or_arcname, data, compress_type=None)
import zipfile
with zipfile.ZipFile('inline.zip', 'w') as zipf:
zipf.writestr('1.txt', 'This is a test file.') # 添加文件并写入文本
zipf.writestr('2.txt', b'\xff\xd8\xff\xe0...') # 添加文件并写入二进制
设置解压密码:setpassword(pwd) 密码为bytes 类型,否则报错
with zipfile.ZipFile('secure.zip', 'w') as zipf:
zipf.setpassword(b'123456') # 设置密码
zipf.write('confidential.txt')但是标准库zipfile设置加密密码后,其实不会生效,无需密码也可以解压文件。后面我们再介绍其他的一些加密方法。
解压单个文件:extract(member, path=None, pwd=None)
参数:
- member:ZIP 内的文件名或ZipInfo对象。
- path:解压目标路径(默认当前目录)。
- pwd:解压密码(默认为None)
案例:解压指定文件
with zipfile.ZipFile('example.zip', 'r') as zipf:
zipf.extract('data.txt', 'extract_dir/') # 解压到指定目录
解压所有文件:extractall(path=None, members=None, pwd=None)
参数:
- path:指定解压的目录(默认当前目录)。
- members:指定解压的文件列表(默认全部)。
- pwd:解压密码(默认为None)
#案例:解压全部内容到某个目录
with zipfile.ZipFile('example.zip', 'r') as zipf:
zipf.extractall('extracted_files/')
案例:解压部分内容
with zipfile.ZipFile('example.zip', 'r') as zipf:
zipf.extractall(members=['1.txt','xxxxdir/'])打开ZIP内的文件对象(不提取到磁盘):open(name, mode='r', pwd=None)
参数:
- name:指定打开的文件名
- mode:跟open函数类似的mode,r表示读取,w表示写入,a表示追加等
- pwd:解压密码(默认为None)
with zipfile.ZipFile('data.zip') as zipf:
with zipf.open('config.json') as f:
content = f.read().decode('utf-8') # 读取文本内容直接读取ZIP内的某个文件内容:read(name, pwd=None)参数:
- name:指定打开的文件名
- pwd:解压密码(默认为None)
with zipfile.ZipFile('data.zip') as zipf:
content = zipf.read('config.json')
校验ZIP文件完整性:testzip() 返回第一个损坏的文件名(无损坏返回None):
with zipfile.ZipFile('downloaded.zip') as zipf:
if zipf.testzip() is None:
print("文件完整")
else:
print(f"文件损坏: {zipf.testzip()}")
文件信息查询
- namelist() 返回 ZIP 内所有文件的名称列表:
with zipfile.ZipFile('project.zip') as zipf:
print(zipf.namelist()) # 输出一个列表
- getinfo(name) 返回ZipInfo对象,包含文件详细信息:
属性 | 说明 |
filename | 文件在 ZIP 内的路径(如'docs/README.md') |
file_size | 原始文件大小(字节) |
compress_size | 压缩后大小(字节) |
date_time | 修改时间元组(年, 月, 日, 时, 分, 秒) |
create_system | 创建文件的系统(0=Windows,3=Unix) |
external_attr | 外部属性(如 Unix 文件权限) |
with zipfile.ZipFile('archive.zip') as zipf:
info = zipf.getinfo('data.csv')
print(f"文件大小: {info.file_size} 字节")
print(f"压缩后: {info.compress_size} 字节")
print(f"压缩比: {info.compress_size/info.file_size:.2%}")
print(f"修改时间: {info.date_time}") # (年, 月, 日, 时, 分, 秒)
#输出类似:
文件大小: 20 字节
压缩后: 20 字节
压缩比: 100.00%
修改时间: (2025, 6, 5, 21, 57, 52)- infolist() 返回所有文件的ZipInfo列表
with zipfile.ZipFile('package.zip') as zipf:
for info in zipf.infolist():
print(f"{info.filename}: {info.file_size} bytes")
#输出类似:
new_folder/: 0 bytes
report.txt: 20 bytes
image.jpg: 7 bytes三、进阶操作
1.压缩目录
- 问题:直接添加目录不会保存其结构,需递归处理。配合os.walk函数实现递归压缩目录内容
import os
import zipfile
def zip_directory(directory, zip_file):
with zipfile.ZipFile(zip_file, 'w', zipfile.ZIP_DEFLATED) as zipf:
for root, dirs, files in os.walk(directory):
print(root)
print(dirs)
print(files)
for file in files:
file_path = os.path.join(root, file)
print(file_path)
zipf.write(file_path)
# 使用示例
zip_directory('compressed', '1.zip')2.选择性解压(基于文件大小)
with zipfile.ZipFile('dataset.zip') as zipf:
for info in zipf.infolist():
if info.file_size < 1024 * 1024: # 小于1MB的文件
zipf.extract(info, 'small_files/')
3.创建内存 ZIP(不落地磁盘)
import io
import zipfile
# 创建内存ZIP
buffer = io.BytesIO()
with zipfile.ZipFile(buffer, 'w') as zipf:
zipf.writestr('report.txt', 'Monthly sales report...')
zipf.write('data.csv') # 添加本地文件
# 将内存ZIP发送到网络或保存
with open('memory_zip.zip', 'wb') as f:
f.write(buffer.getvalue())
4.修改ZIP内文件(不重建整个ZIP)
import zipfile
import os
def replace_file_in_zip(zip_path, old_file, new_content):
# 创建临时ZIP
temp_path = zip_path + '.temp'
with zipfile.ZipFile(zip_path, 'r') as old_zip, \
zipfile.ZipFile(temp_path, 'w') as new_zip:
# 复制所有文件,替换指定文件
for item in old_zip.infolist():
if item.filename == old_file:
new_zip.writestr(item, new_content) # 替换内容
else:
new_zip.writestr(item, old_zip.read(item))
# 替换原ZIP
os.replace(temp_path, zip_path)
# 使用示例
replace_file_in_zip('config.zip', 'settings.ini', 'NEW_CONFIG_DATA')
五、ZipFile函数速查表
功能 | 方法 / 属性 | 示例代码 |
创建 ZIP 文件 | ZipFile('name.zip', 'w') | with zipfile.ZipFile('archive.zip', 'w') as zipf: |
添加文件 | write() | zipf.write('data.txt', 'docs/data.txt') |
添加字符串内容 | writestr() | zipf.writestr('note.txt', 'Hello World') |
解压文件 | extract() | zipf.extract('file.txt', 'target/') |
解压所有文件 | extractall() | zipf.extractall('extracted/') |
获取文件列表 | namelist() | file_list = zipf.namelist() |
获取文件信息 | getinfo() | info = zipf.getinfo('data.csv') |
校验 ZIP 完整性 | testzip() | if zipf.testzip() is None: print("完整") |
设置密码 | setpassword() | zipf.setpassword(b'mysecret') |
获取 / 设置 ZIP 注释 | comment | zipf.comment = b"Backup data" |
六 总结
python自带的zipfile模块可以满足最基本的压缩功能,但也少了一些比如添加压缩密码,压缩目录的功能,如果想使用这些,我们后面再结合其他模块介绍。
----感谢读者的阅读,明天的你定会感谢今天的自己!!!!----
相关推荐
- win10版本回退(win10回退到以前版本)
-
如果你想在Windows10系统中回退到上一个版本,可以按照以下步骤进行操作:1.打开设置:点击Windows开始按钮,然后点击屏幕左侧的“设置”图标,或者使用键盘快捷键Win+I打开设置。2...
- 营业厅一个路由器多少钱(上门更换路由器收费吗)
-
移动免费装宽带活动全国都在搞,不过免费是有“门槛”的。以我所在的地区为例,只有月费在78元及以上的大流量套餐用户,才可以享受免费安装移动的宽带。月费越高,宽带的速率也越高,148元档可以安装200M的...
- win10从u盘启动怎么设置(win10怎么从u盘启动电脑)
-
1.回到桌面。点击开始徽标,点击开始菜单左侧的设置。2.设置界面点击更新和安全。3.进入更新和安全界面,点击左侧的恢复选项。4.进入恢复界面,点击高级启动下面的立即重新启动。5.插入自己的U盘,等待...
- 系统大全网站(系统大全网站推荐)
-
下载时发生错误可能是以下原因:1.你的网速过慢,网页代码没有完全下载就运行了,导致不完整,当然就错误了。请刷新。2.网页设计错误,导致部分代码不能执行。请下载最新的遨游浏览器。3.你的浏览器不兼容导致...
- win10官方启动盘(win10官方启动盘怎么用)
-
1、在开始菜单搜索“设置”,打开“设置”;2、点击“更新与安全”,在左侧菜单栏点击“恢复”;3、点击“启动项”,在弹出的窗口中会显示当前可以启动的项目,点击“编辑”;4、在打开的“编辑启动项”窗口中,...
- win10系统安装不了(win10 安装不了)
-
电脑装不上win10系统可能是因为以下几个原因导致的原因一:win10安装文件不对我们在安装win10之前,要确保下载到安装包真实可用的,否则安装肯定会有问题,建议下载安全可靠的安装包!原因二:系统文...
- 国内dns哪个最快(dns开启好还是关闭好)
-
移动dns设置首选114.114.114.114,它又好又快。首选DNS和备用DNS都是一种域名系统,这两种域名系统有着先后之分,如果在首选DNS正常的情况下,就用首选DNS地址。当首选DNS服务器出...
- winxp安装盘(winxp系统安装)
-
xp系统安装步骤如下1、将下载的xp系统iso压缩包文件下载到C盘之外的分区,比如下载到D盘,右键使用WinRAR等工具解压到当前文件夹或指定文件夹,不能解压到C盘和桌面,否则无法安装;?2、解压之后...
- 现在的win11稳定了吗(win11稳定嘛)
-
windows10更稳定,由于win11刚刚推出没多久,稳定差不够好,兼容性也有待提升,无论是应用还是游戏都会遇到不明程度的问题,因此,在日常的使用过程中,我们还是应当以稳定性为优先,选择win10是...
- xp安装包下载到手机(xp系统安装包)
-
手机是基于ARM架构的处理器,而WindowsXP是基于x86架构的操作系统,因此无法直接在手机上安装WindowsXP。除非您的手机是使用Intel处理器,但这种情况非常罕见。如果您需要在手机上...
- 如何查看硬盘序列号(windows如何查看硬盘序列号)
-
1.打开开始菜单栏,输入【cmd】点击【确定】;2.在命令窗口依次输入【diskpart】-【listdisk】-【selectdisk0】;3.选好要查看的硬盘后,接着输入【detaildi...
- 虚拟机安装win7教程(虚拟机安装win7教程图解)
-
1.首先,下载并安装虚拟机软件,如VMwareWorkstation、VirtualBox等。2.打开虚拟机软件,创建一个新的虚拟机。3.在创建虚拟机的过程中,选择安装Windows7专业版的IS...
- 系统脱敏法的操作程序如何
-
系统脱敏疗法(systematicdesensitization)又称交互抑制法,是由美国学者沃尔普创立和发展的。这种方法主要是诱导求治者缓慢地暴露出导致神经症焦虑、恐惧的情境,并通过心理的放松状态...
- 闪迪u盘低级格式化工具(闪迪u盘格式化分配单元大小)
-
闪迪U盘格式化后速度变慢的可能原因及解决方法如下:文件系统问题:格式化时选择的文件系统类型可能会影响U盘的性能。常见的文件系统类型包括FAT32、NTFS和exFAT等。如果文件系统类型不合适,可能会...
- psd文件下载(psd格式下载网站)
-
1、在photoshop中,不能通过置入的方法来加载PSD文件,因为,通过置入的方法加载PSD文件,它是以合并图层的方法把PSD文件加入,这样,就失去了PSD文件的所有图层信息。 2、在文档中想...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
python入门到脱坑 输入与输出—str()函数
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
失业程序员复习python笔记——条件与循环
-
系统u盘安装(win11系统u盘安装)
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
