Python编程高手都在用的10个文件处理技巧,让你效率翻倍!
off999 2025-09-13 07:46 20 浏览 0 评论
前言
- 批量自动化处理:日均处理1000+文件时,可节省80%人工操作时间
- 跨平台兼容性:统一处理Windows/Linux/Mac文件路径问题
- 数据预处理基础:为数据分析/机器学习提供结构化数据输入
适用人群:掌握Python基础语法 (变量/循环/函数) ,具备文件读写基础操作经验的开发者
技巧① 智能路径拼接
使用os.path.join()替代字符串拼接
示例:
import os
# 标准版
path = os.path.join("data", "2023", "logs.txt") # 输出: data\2023\logs.txt (Windows)
# 优化版 (Python 3.4+)
from pathlib import Path
path = Path("data") / "2023" / "logs.txt" # 自动适配系统路径分隔符
警告:直接使用+拼接路径可能导致跨平台异常
技巧② 上下文管理器
with语句自动释放资源
示例:
# 标准版
f = open("data.txt", "r")
content = f.read()
f.close()
# 优化版
with open("data.txt", "r") as f: # 文件在代码块结束后自动关闭
content = f.read()
优势:防止文件句柄泄漏,建议100%使用
技巧③ 批量文件过滤
使用glob通配符匹配
示例:
import glob
# 匹配所有CSV文件
csv_files = glob.glob("data/*.csv")
# 递归搜索子目录
all_logs = glob.glob("**/*.log", recursive=True)
参数说明:*匹配任意字符,?匹配单个字符,[0-9]匹配数字范围
技巧④ 文件内容迭代
逐行处理大文件
示例:
with open("bigfile.txt", "r") as f:
for line in f: # 内存占用仅1行数据
process(line) # 自定义处理函数
性能对比:处理1GB文件时,逐行读取比readlines()快3倍
技巧⑤ 二进制文件处理
使用rb/wb模式处理非文本文件
示例:
with open("image.png", "rb") as f: # 二进制模式
data = f.read()
with open("copy.png", "wb") as f: # 写入二进制
f.write(data)
适用场景:图片/视频/加密文件传输
技巧⑥ 文件编码声明
显式指定编码格式
示例:
with open("chinese.txt", "r", encoding="utf-8") as f: # 指定编码
text = f.read()
# 处理未知编码文件
import chardet
with open("unknown.txt", "rb") as f:
result = chardet.detect(f.read())
encoding = result['encoding']
常见编码:utf-8/gbk/latin-1
技巧⑦ 文件元信息
获取文件属性信息
示例:
import os
stat_info = os.stat("data.txt")
print(stat_info.st_size) # 文件大小
print(stat_info.st_mtime) # 最后修改时间
时间戳转换:time.ctime(stat_info.st_ctime)
技巧⑧ 批量重命名
使用os.rename()实现自动化
示例:
import os
for i, filename in enumerate(os.listdir()):
if filename.endswith(".txt"):
new_name = f"log_{i:03d}.txt" # 001.txt格式
os.rename(filename, new_name)
改进方案:使用re模块实现正则表达式重命名
技巧⑨ 文件压缩处理
使用zipfile模块
示例:
import zipfile
# 创建压缩包
with zipfile.ZipFile("archive.zip", "w") as zipf:
zipf.write("data.txt")
# 解压文件
with zipfile.ZipFile("archive.zip", "r") as zipf:
zipf.extractall("extracted")
压缩加密:添加pwd=b"password"参数
技巧⑩内存映射文件
处理超大文件读取
示例:
import mmap
with open("huge.bin", "r+b") as f:
mm = mmap.mmap(f.fileno(), 0) # 内存映射
print(mm.find(b"pattern")) # 快速查找
mm.close()
适用场景:处理500MB+二进制文件
实战案例:日志文件分析
from collections import defaultdict
def analyze_logs(log_dir):
stats = defaultdict(int)
for log_file in glob.glob(f"{log_dir}/*.log"):
with open(log_file, "r") as f:
for line in f:
if"ERROR"in line:
stats["errors"] += 1
elif"WARNING"in line:
stats["warnings"] += 1
return dict(stats)
print(analyze_logs("server_logs"))
# 输出: {'errors': 127, 'warnings': 45}
- 上一篇:ZIP解压不求人,这4款软件帮你忙!
- 下一篇:如何使用7-Zip对文件进行加密压缩
相关推荐
- u盘莫名其妙要格式化(u盘总是要格式化什么意思)
-
如果您在使用U盘时突然收到提示需要格式化的消息,这可能是由于以下原因之一引起的:U盘感染病毒:U盘中可能存在恶意病毒,这些病毒可能会导致U盘无法正常使用。当您尝试打开U盘时,系统会提示您进行格式化操作...
- win7家庭版原版(win7家庭版价格)
-
你的win7旗舰版应该是个盗版软件,在你使用的过程中你可能触碰到了后台升级,升级完以后就变成了家庭版了,在你不知不觉中被改变的,厄这个软件属于盗版的,厄升级完以后没什么大区别,这个旗舰版家庭版在家里面...
- win10自动更新失败怎么办(win10自动升级失败)
-
安装更新失败有许多原因。WindowsUpdate需要能够扫描您的计算机以了解需要哪些更新,并能够下载和安装这些更新。如果某个阶段遇到问题,则可能阻止某个更新安装到计算机中。有关错误或失败的详细信...
- 截图的几种方法(截图的几种方法有哪些)
-
第一种截图方式:按printScreen键。按一下键盘上的printScreen键以后,整个屏幕会被截取下来,截图会默认保存在剪贴板中。第二种截图方式:使用微信截图。进入聊天界面,我们会发...
- 电脑装了两个系统怎么切换(电脑安装2个系统怎么更换启动)
-
1.点击运行打开电脑点击左下角的开始菜单栏选项,右击鼠标在序列栏中选择运行打开。2.输入msconfig接着在运行的输入框中输入msconfig点击确定即可打开系统配置。3.点击引导打开系统配置的页面...
- linux系统哪个版本好用(最好linux系统版本)
-
个人比较推荐Debian这个发行版本。DebianGNU/Linux于1993年首次公布,至今已经有近30年历史了。当然其他版本比如openSUSE,Slackware,ArchLinux,Ubu...
- win10激活在哪里查看(win10激活时间在哪里看)
-
在Windows10中,您可以通过以下方法查看激活状态:方法1:使用“设置”应用1.点击屏幕左下角的“开始”按钮,然后点击“设置”(齿轮图标)。2.在设置窗口中,点击“系统”图标。3.在“系统...
- 官方win10dll文件修复工具(官方win7dll文件修复工具)
-
当电脑丢失dll文件时,可以采用以下几种方法进行一键修复:从回收站还原:如果是不小心误删了一些计算机文件,导致电脑出现异常的情况时,首先就可以去回收站找回dll文件,如果文件还在,就可以通过还原操作来...
- qq所有历史旧版本大全(qq历史版本一览表)
-
有2种方法。一种是:你是QQ会员。你可以把旧版打开,聊天记录上传。然后打开新的QQ,下载。第2种是:你在硬盘上装了QQ软件,然后你就点卸载(uninst),把原来的卸了。然后按原位置覆盖,装上06版。...
- 电脑显示器分辨率怎么调(显示分辨率无法调整)
-
1、以win7为例,首先右键点击桌面,在右键菜单中直接显示了屏幕分辨率的选项,用鼠标点击一下这个选项。2、在分辨率设置选项页面中,有一个分辨率的选项,点击一下这个选项,上面默认显示的数值是你现在的屏幕...
- 8系统(8系统点检控制包含什么)
-
WIndows8系统是微软目前最新的操作系统,Moto的图形界面设计,使很多已经习惯于早期windows系统的用户难以接受,Windows8是一个向平板和桌面系统妥协的产物,存在着相当多的利弊。...
- 电脑软件管家(电脑软件管家在哪里找到)
-
电脑管家有着最大的安全云库,全新的杀毒引擎,深度清理电脑垃圾,为电脑重回巅峰状态,更有账号宝专版,10倍提升QQ防盗号能力,是很好用的。就自己而言,在电脑上用的是腾讯电脑管家这个第三方系统安全软件,管...
- 迅雷种子搜索器(迅雷种子搜索器手机版下载)
-
迅雷种子搜索方法: 1.在开始菜单栏或者到文件的安装路径文件夹中找到P2P种子搜索器。&nb...
- 手机怎么解压文件(苹果手机怎么解压文件)
-
手机解压文件方法:1、首先,在手机中找到文件管理,打开文件管理。2、打开文件管理之后找到压缩包,然后打开。3、打开安装包之后,选择需要的文件,。4、接下来找到“解压至”,点击“解压至”。5、点击之后,...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
失业程序员复习python笔记——条件与循环
-
慕ke 前端工程师2024「完整」
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
