百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python编程高手都在用的10个文件处理技巧,让你效率翻倍!

off999 2025-09-13 07:46 20 浏览 0 评论


前言

  • 批量自动化处理:日均处理1000+文件时,可节省80%人工操作时间
  • 跨平台兼容性:统一处理Windows/Linux/Mac文件路径问题
  • 数据预处理基础:为数据分析/机器学习提供结构化数据输入

适用人群:掌握Python基础语法 (变量/循环/函数) ,具备文件读写基础操作经验的开发者


技巧① 智能路径拼接

使用os.path.join()替代字符串拼接

示例:

import os
# 标准版
path = os.path.join("data", "2023", "logs.txt")  # 输出: data\2023\logs.txt (Windows)
# 优化版 (Python 3.4+) 
from pathlib import Path
path = Path("data") / "2023" / "logs.txt"  # 自动适配系统路径分隔符

警告:直接使用+拼接路径可能导致跨平台异常


技巧② 上下文管理器

with语句自动释放资源

示例:

# 标准版
f = open("data.txt", "r")
content = f.read()
f.close()

# 优化版
with open("data.txt", "r") as f:  # 文件在代码块结束后自动关闭
    content = f.read()

优势:防止文件句柄泄漏,建议100%使用


技巧③ 批量文件过滤

使用glob通配符匹配

示例:

import glob
# 匹配所有CSV文件
csv_files = glob.glob("data/*.csv")
# 递归搜索子目录
all_logs = glob.glob("**/*.log", recursive=True)

参数说明:*匹配任意字符,?匹配单个字符,[0-9]匹配数字范围


技巧④ 文件内容迭代

逐行处理大文件

示例:

with open("bigfile.txt", "r") as f:
    for line in f:  # 内存占用仅1行数据
        process(line)  # 自定义处理函数

性能对比:处理1GB文件时,逐行读取比readlines()快3倍


技巧⑤ 二进制文件处理

使用rb/wb模式处理非文本文件

示例:

with open("image.png", "rb") as f:  # 二进制模式
    data = f.read()
with open("copy.png", "wb") as f:  # 写入二进制
    f.write(data)

适用场景:图片/视频/加密文件传输


技巧⑥ 文件编码声明

显式指定编码格式

示例:

with open("chinese.txt", "r", encoding="utf-8") as f:  # 指定编码
    text = f.read()

# 处理未知编码文件
import chardet
with open("unknown.txt", "rb") as f:
    result = chardet.detect(f.read()) 
    encoding = result['encoding']

常见编码:utf-8/gbk/latin-1


技巧⑦ 文件元信息

获取文件属性信息

示例:

import os
stat_info = os.stat("data.txt")
print(stat_info.st_size)  # 文件大小
print(stat_info.st_mtime) # 最后修改时间

时间戳转换:time.ctime(stat_info.st_ctime)



技巧⑧ 批量重命名

使用os.rename()实现自动化

示例:

import os
for i, filename in enumerate(os.listdir()):
    if filename.endswith(".txt"):
        new_name = f"log_{i:03d}.txt"  # 001.txt格式
        os.rename(filename, new_name)

改进方案:使用re模块实现正则表达式重命名


技巧⑨ 文件压缩处理

使用zipfile模块

示例:

import zipfile
# 创建压缩包
with zipfile.ZipFile("archive.zip", "w") as zipf:
    zipf.write("data.txt")

# 解压文件
with zipfile.ZipFile("archive.zip", "r") as zipf:
    zipf.extractall("extracted")

压缩加密:添加pwd=b"password"参数


技巧⑩内存映射文件

处理超大文件读取

示例:

import mmap
with open("huge.bin", "r+b") as f:
    mm = mmap.mmap(f.fileno(), 0)  # 内存映射
    print(mm.find(b"pattern"))    # 快速查找
    mm.close()

适用场景:处理500MB+二进制文件


实战案例:日志文件分析

from collections import defaultdict

def analyze_logs(log_dir):
    stats = defaultdict(int)
    for log_file in glob.glob(f"{log_dir}/*.log"):
        with open(log_file, "r") as f:
            for line in f:
                if"ERROR"in line:
                    stats["errors"] += 1
                elif"WARNING"in line:
                    stats["warnings"] += 1
    return dict(stats)

print(analyze_logs("server_logs"))
# 输出: {'errors': 127, 'warnings': 45}

相关推荐

u盘莫名其妙要格式化(u盘总是要格式化什么意思)

如果您在使用U盘时突然收到提示需要格式化的消息,这可能是由于以下原因之一引起的:U盘感染病毒:U盘中可能存在恶意病毒,这些病毒可能会导致U盘无法正常使用。当您尝试打开U盘时,系统会提示您进行格式化操作...

win7家庭版原版(win7家庭版价格)

你的win7旗舰版应该是个盗版软件,在你使用的过程中你可能触碰到了后台升级,升级完以后就变成了家庭版了,在你不知不觉中被改变的,厄这个软件属于盗版的,厄升级完以后没什么大区别,这个旗舰版家庭版在家里面...

win10自动更新失败怎么办(win10自动升级失败)

安装更新失败有许多原因。WindowsUpdate需要能够扫描您的计算机以了解需要哪些更新,并能够下载和安装这些更新。如果某个阶段遇到问题,则可能阻止某个更新安装到计算机中。有关错误或失败的详细信...

截图的几种方法(截图的几种方法有哪些)

 第一种截图方式:按printScreen键。按一下键盘上的printScreen键以后,整个屏幕会被截取下来,截图会默认保存在剪贴板中。第二种截图方式:使用微信截图。进入聊天界面,我们会发...

电脑装了两个系统怎么切换(电脑安装2个系统怎么更换启动)

1.点击运行打开电脑点击左下角的开始菜单栏选项,右击鼠标在序列栏中选择运行打开。2.输入msconfig接着在运行的输入框中输入msconfig点击确定即可打开系统配置。3.点击引导打开系统配置的页面...

linux系统哪个版本好用(最好linux系统版本)

个人比较推荐Debian这个发行版本。DebianGNU/Linux于1993年首次公布,至今已经有近30年历史了。当然其他版本比如openSUSE,Slackware,ArchLinux,Ubu...

win10激活在哪里查看(win10激活时间在哪里看)

在Windows10中,您可以通过以下方法查看激活状态:方法1:使用“设置”应用1.点击屏幕左下角的“开始”按钮,然后点击“设置”(齿轮图标)。2.在设置窗口中,点击“系统”图标。3.在“系统...

官方win10dll文件修复工具(官方win7dll文件修复工具)

当电脑丢失dll文件时,可以采用以下几种方法进行一键修复:从回收站还原:如果是不小心误删了一些计算机文件,导致电脑出现异常的情况时,首先就可以去回收站找回dll文件,如果文件还在,就可以通过还原操作来...

qq所有历史旧版本大全(qq历史版本一览表)

有2种方法。一种是:你是QQ会员。你可以把旧版打开,聊天记录上传。然后打开新的QQ,下载。第2种是:你在硬盘上装了QQ软件,然后你就点卸载(uninst),把原来的卸了。然后按原位置覆盖,装上06版。...

电脑显示器分辨率怎么调(显示分辨率无法调整)

1、以win7为例,首先右键点击桌面,在右键菜单中直接显示了屏幕分辨率的选项,用鼠标点击一下这个选项。2、在分辨率设置选项页面中,有一个分辨率的选项,点击一下这个选项,上面默认显示的数值是你现在的屏幕...

8系统(8系统点检控制包含什么)

WIndows8系统是微软目前最新的操作系统,Moto的图形界面设计,使很多已经习惯于早期windows系统的用户难以接受,Windows8是一个向平板和桌面系统妥协的产物,存在着相当多的利弊。...

电脑软件管家(电脑软件管家在哪里找到)

电脑管家有着最大的安全云库,全新的杀毒引擎,深度清理电脑垃圾,为电脑重回巅峰状态,更有账号宝专版,10倍提升QQ防盗号能力,是很好用的。就自己而言,在电脑上用的是腾讯电脑管家这个第三方系统安全软件,管...

office2010破解(office2010破解密钥)
  • office2010破解(office2010破解密钥)
  • office2010破解(office2010破解密钥)
  • office2010破解(office2010破解密钥)
  • office2010破解(office2010破解密钥)
迅雷种子搜索器(迅雷种子搜索器手机版下载)

    迅雷种子搜索方法:    1.在开始菜单栏或者到文件的安装路径文件夹中找到P2P种子搜索器。&nb...

手机怎么解压文件(苹果手机怎么解压文件)

手机解压文件方法:1、首先,在手机中找到文件管理,打开文件管理。2、打开文件管理之后找到压缩包,然后打开。3、打开安装包之后,选择需要的文件,。4、接下来找到“解压至”,点击“解压至”。5、点击之后,...

取消回复欢迎 发表评论: