Python进阶-Day8:文件操作与数据处理
off999 2025-05-08 04:35 15 浏览 0 评论
文件操作与数据处理 的进阶学习任务,旨在帮助你深入掌握文件操作和数据处理的核心技能。以下是详细的学习计划和任务安排:
学习目标
- 熟练使用 os、shutil 和 pathlib 模块进行文件和目录操作。
- 掌握 CSV 和 JSON 文件的读写操作,理解数据处理的基本流程。
- 通过实践项目(批量重命名文件脚本),综合运用所学知识。
学习任务分解
1. 学习 os、shutil 和 pathlib 模块
- 学习内容: os 模块:文件和目录的基本操作。 os.listdir():列出目录内容。 os.path.join():路径拼接。 os.rename():重命名文件。 os.remove():删除文件。 os.makedirs():创建目录。 shutil 模块:高级文件操作。 shutil.copy():复制文件。 shutil.move():移动文件。 shutil.rmtree():删除目录树。 pathlib 模块:现代化的路径操作。 Path.cwd():获取当前工作目录。 Path.iterdir():迭代目录内容。 Path.rename():重命名文件或目录。 Path.glob():按模式匹配文件。
- 任务: 阅读官方文档或相关教程,理解三者区别。 编写代码测试:创建一个目录,复制一个文件到该目录,然后删除原文件。
2. 掌握 CSV 和 JSON 文件的读写
- 学习内容: csv 模块: 使用 csv.reader 和 csv.writer 读取和写入 CSV 文件。 使用 csv.DictReader 和 csv.DictWriter 处理带表头的数据。 json 模块: json.load() 和 json.dump():从文件读取/写入 JSON 数据。 json.loads() 和 json.dumps():处理 JSON 字符串。
- 任务: 创建一个简单的 CSV 文件(例如:name, age, city),写入 5 条数据,然后读取并打印。 将上述 CSV 数据转换为 JSON 格式并保存到文件,再读取验证。
3. 练习:编写批量重命名脚本
- 任务要求: 编写一个 Python 脚本,批量重命名指定文件夹中的文件。 重命名规则示例:将文件名改为 prefix_序号.扩展名(如 photo_001.jpg)。 支持用户输入文件夹路径和前缀。 添加错误处理(如文件不存在、权限不足等)。
- 实现步骤: 使用 pathlib.Path 获取文件夹中的所有文件。 遍历文件列表,生成新文件名。 使用 Path.rename() 执行重命名操作。 添加异常处理和用户交互。
学习计划
- 上午(2-3 小时): 学习 os、shutil 和 pathlib,完成模块测试代码。
- 下午(2-3 小时): 学习 CSV 和 JSON 文件操作,完成读写练习。
- 晚上(2-3 小时): 实现批量重命名脚本,测试并优化。
示例代码:批量重命名脚本
以下是一个基础实现,供你参考并扩展:
python
from pathlib import Path
def batch_rename_files(folder_path, prefix="file"):
try:
# 转换为 Path 对象
folder = Path(folder_path)
if not folder.exists() or not folder.is_dir():
raise ValueError("无效的文件夹路径")
# 获取所有文件
files = [f for f in folder.iterdir() if f.is_file()]
if not files:
print("文件夹中没有文件")
return
# 批量重命名
for i, file in enumerate(files, start=1):
new_name = f"{prefix}_{i:03d}{file.suffix}" # 如 file_001.jpg
new_path = folder / new_name
file.rename(new_path)
print(f"重命名: {file.name} -> {new_name}")
except Exception as e:
print(f"发生错误: {e}")
if __name__ == "__main__":
folder_path = input("请输入文件夹路径: ")
prefix = input("请输入文件名前缀(默认 'file'): ") or "file"
batch_rename_files(folder_path, prefix)
进阶挑战(可选)
- 修改脚本,支持按文件修改时间排序后重命名。
- 添加正则表达式支持,允许用户指定重命名规则(如提取文件名中的数字)。
- 将重命名操作记录到 CSV 文件中,包含旧名和新名。
学习资源建议
- Python 官方文档:os、shutil、pathlib、csv、json。
- 实践环境:本地创建一个测试文件夹,放入一些文件(如图片、文本)。
通过今天的任务,你将掌握 Python 文件操作和数据处理的核心技能,并具备编写实用脚本的能力。完成后,尝试将脚本应用到实际场景中,进一步巩固所学!有什么问题,随时问我。
相关推荐
- python入门到脱坑经典案例—清空列表
-
在Python中,清空列表是一个基础但重要的操作。clear()方法是最直接的方式,但还有其他方法也可以实现相同效果。以下是详细说明:1.使用clear()方法(Python3.3+推荐)...
- python中元组,列表,字典,集合删除项目方式的归纳
-
九三,君子终日乾乾,夕惕若,厉无咎。在使用python过程中会经常遇到这四种集合数据类型,今天就对这四种集合数据类型中删除项目的操作做个总结性的归纳。列表(List)是一种有序和可更改的集合。允许重复...
- Linux 下海量文件删除方法效率对比,最慢的竟然是 rm
-
Linux下海量文件删除方法效率对比,本次参赛选手一共6位,分别是:rm、find、findwithdelete、rsync、Python、Perl.首先建立50万个文件$testfor...
- 数据结构与算法——链式存储(链表)的插入及删除,
-
持续分享嵌入式技术,操作系统,算法,c语言/python等,欢迎小友关注支持上篇文章我们讲述了链表的基本概念及一些查找遍历的方法,本篇我们主要将一下链表的插入删除操作,以及采用堆栈方式如何创建链表。链...
- Python自动化:openpyxl写入数据,插入删除行列等基础操作
-
importopenpyxlwb=openpyxl.load_workbook("example1.xlsx")sh=wb['Sheet1']写入数据#...
- 在Linux下软件的安装与卸载(linux里的程序的安装与卸载命令)
-
通过apt安装/协助软件apt是AdvancedPackagingTool,是Linux下的一款安装包管理工具可以在终端中方便的安装/卸载/更新软件包命令使用格式:安装软件:sudoapt...
- Python 批量卸载关联包 pip-autoremove
-
pip工具在安装扩展包的时候会自动安装依赖的关联包,但是卸载时只删除单个包,无法卸载关联的包。pip-autoremove就是为了解决卸载关联包的问题。安装方法通过下面的命令安装:pipinsta...
- 用Python在Word文档中插入和删除文本框
-
在当今自动化办公需求日益增长的背景下,通过编程手段动态管理Word文档中的文本框元素已成为提升工作效率的关键技术路径。文本框作为文档排版中灵活的内容容器,既能承载多模态信息(如文字、图像),又可实现独...
- Python 从列表中删除值的多种实用方法详解
-
#Python从列表中删除值的多种实用方法详解在Python编程中,列表(List)是一种常用的数据结构,具有动态可变的特性。当我们需要从列表中删除元素时,根据不同的场景(如按值删除、按索引删除、...
- Python 中的前缀删除操作全指南(python删除前导0)
-
1.字符串前缀删除1.1使用内置方法Python提供了几种内置方法来处理字符串前缀的删除:#1.使用removeprefix()方法(Python3.9+)text="...
- 每天学点Python知识:如何删除空白
-
在Python中,删除空白可以分为几种不同的情况,常见的是针对字符串或列表中空白字符的处理。一、删除字符串中的空白1.删除字符串两端的空白(空格、\t、\n等)使用.strip()方法:s...
- Linux系统自带Python2&yum的卸载及重装
-
写在前面事情的起因是我昨天在测试Linux安装Python3的shell脚本时,需要卸载Python3重新安装一遍。但是通过如下命令卸载python3时,少写了个3,不小心将系统自带的python2也...
- 如何使用Python将多个excel文件数据快速汇总?
-
在数据分析和处理的过程中,Excel文件是我们经常会遇到的数据格式之一。本文将通过一个具体的示例,展示如何使用Python和Pandas库来读取、合并和处理多个Excel文件的数据,并最终生成一个包含...
- 【第三弹】用Python实现Excel的vlookup功能
-
今天继续用pandas实现Excel的vlookup功能,假设我们的2个表长成这样:我们希望把Sheet2的部门匹在Sheet1的最后一列。话不多说,先上代码:importpandasaspd...
- python中pandas读取excel单列及连续多列数据
-
案例:想获取test.xls中C列、H列以后(当H列后列数未知时)的所有数据。importpandasaspdfile_name=r'D:\test.xls'#表格绝对...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python自定义函数 (53)
- python进度条 (67)
- python吧 (67)
- python字典遍历 (54)
- python的for循环 (65)
- python格式化字符串 (61)
- python串口编程 (60)
- python读取文件夹下所有文件 (59)
- java调用python脚本 (56)
- python操作mysql数据库 (66)
- python字典增加键值对 (53)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python人脸识别 (54)
- python多态 (60)
- python命令行参数 (53)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)