百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python进阶-Day8:文件操作与数据处理

off999 2025-05-08 04:35 18 浏览 0 评论

文件操作与数据处理 的进阶学习任务,旨在帮助你深入掌握文件操作和数据处理的核心技能。以下是详细的学习计划和任务安排:


学习目标

  1. 熟练使用 os、shutil 和 pathlib 模块进行文件和目录操作。
  2. 掌握 CSV 和 JSON 文件的读写操作,理解数据处理的基本流程。
  3. 通过实践项目(批量重命名文件脚本),综合运用所学知识。

学习任务分解

1. 学习 os、shutil 和 pathlib 模块

  • 学习内容os 模块:文件和目录的基本操作。 os.listdir():列出目录内容。 os.path.join():路径拼接。 os.rename():重命名文件。 os.remove():删除文件。 os.makedirs():创建目录。 shutil 模块:高级文件操作。 shutil.copy():复制文件。 shutil.move():移动文件。 shutil.rmtree():删除目录树。 pathlib 模块:现代化的路径操作。 Path.cwd():获取当前工作目录。 Path.iterdir():迭代目录内容。 Path.rename():重命名文件或目录。 Path.glob():按模式匹配文件。
  • 任务: 阅读官方文档或相关教程,理解三者区别。 编写代码测试:创建一个目录,复制一个文件到该目录,然后删除原文件。

2. 掌握 CSV 和 JSON 文件的读写

  • 学习内容csv 模块: 使用 csv.reader 和 csv.writer 读取和写入 CSV 文件。 使用 csv.DictReader 和 csv.DictWriter 处理带表头的数据。 json 模块: json.load() 和 json.dump():从文件读取/写入 JSON 数据。 json.loads() 和 json.dumps():处理 JSON 字符串。
  • 任务: 创建一个简单的 CSV 文件(例如:name, age, city),写入 5 条数据,然后读取并打印。 将上述 CSV 数据转换为 JSON 格式并保存到文件,再读取验证。

3. 练习:编写批量重命名脚本

  • 任务要求: 编写一个 Python 脚本,批量重命名指定文件夹中的文件。 重命名规则示例:将文件名改为 prefix_序号.扩展名(如 photo_001.jpg)。 支持用户输入文件夹路径和前缀。 添加错误处理(如文件不存在、权限不足等)。
  • 实现步骤: 使用 pathlib.Path 获取文件夹中的所有文件。 遍历文件列表,生成新文件名。 使用 Path.rename() 执行重命名操作。 添加异常处理和用户交互。

学习计划

  • 上午(2-3 小时): 学习 os、shutil 和 pathlib,完成模块测试代码。
  • 下午(2-3 小时): 学习 CSV 和 JSON 文件操作,完成读写练习。
  • 晚上(2-3 小时): 实现批量重命名脚本,测试并优化。

示例代码:批量重命名脚本

以下是一个基础实现,供你参考并扩展:

python

from pathlib import Path

def batch_rename_files(folder_path, prefix="file"):
    try:
        # 转换为 Path 对象
        folder = Path(folder_path)
        if not folder.exists() or not folder.is_dir():
            raise ValueError("无效的文件夹路径")

        # 获取所有文件
        files = [f for f in folder.iterdir() if f.is_file()]
        if not files:
            print("文件夹中没有文件")
            return

        # 批量重命名
        for i, file in enumerate(files, start=1):
            new_name = f"{prefix}_{i:03d}{file.suffix}"  # 如 file_001.jpg
            new_path = folder / new_name
            file.rename(new_path)
            print(f"重命名: {file.name} -> {new_name}")

    except Exception as e:
        print(f"发生错误: {e}")

if __name__ == "__main__":
    folder_path = input("请输入文件夹路径: ")
    prefix = input("请输入文件名前缀(默认 'file'): ") or "file"
    batch_rename_files(folder_path, prefix)

进阶挑战(可选)

  1. 修改脚本,支持按文件修改时间排序后重命名。
  2. 添加正则表达式支持,允许用户指定重命名规则(如提取文件名中的数字)。
  3. 将重命名操作记录到 CSV 文件中,包含旧名和新名。



学习资源建议

  • Python 官方文档:os、shutil、pathlib、csv、json。
  • 实践环境:本地创建一个测试文件夹,放入一些文件(如图片、文本)。

通过今天的任务,你将掌握 Python 文件操作和数据处理的核心技能,并具备编写实用脚本的能力。完成后,尝试将脚本应用到实际场景中,进一步巩固所学!有什么问题,随时问我。

相关推荐

pip的使用及配置_pip怎么配置

要使用python必须要学会使用pip,pip的全称:packageinstallerforpython,也就是Python包管理工具,主要是对python的第三方库进行安装、更新、卸载等操作,...

Anaconda下安装pytorch_anaconda下安装tensorflow

之前的文章介绍了tensorflow-gpu的安装方法,也介绍了许多基本的工具与使用方法,具体可以看Ubuntu快速安装tensorflow2.4的gpu版本。pytorch也是一个十分流行的机器学...

Centos 7 64位安装 python3的教程

wgethttps://www.python.org/ftp/python/3.10.13/Python-3.10.13.tgz#下载指定版本软件安装包tar-xzfPython-3.10.1...

如何安装 pip 管理工具_pip安装详细步骤

如何安装pip管理工具方法一:yum方式安装Centos安装python3和python3-devel开发包>#yuminstallgcclibffi-develpy...

Python入门——从开发环境搭建到hello world

一、Python解释器安装1、在windows下步骤1、下载安装包https://www.python.org/downloads/打开后选择【Downloads】->【Windows】小编是一...

生产环境中使用的十大 Python 设计模式

在软件开发的浩瀚世界中,设计模式如同指引方向的灯塔,为我们构建稳定、高效且易于维护的系统提供了经过验证的解决方案。对于Python开发者而言,理解和掌握这些模式,更是提升代码质量、加速开发进程的关...

如何创建和管理Python虚拟环境_python怎么创建虚拟环境

在Python开发中,虚拟环境是隔离项目依赖的关键工具。下面介绍创建和管理Python虚拟环境的主流方法。一、内置工具:venv(Python3.3+推荐)venv是Python标准...

初学者入门Python的第一步——环境搭建

Python如今成为零基础编程爱好者的首选学习语言,这和Python语言自身的强大功能和简单易学是分不开的。今天千锋武汉Python培训小编将带领Python零基础的初学者完成入门的第一步——环境搭建...

全网最简我的世界Minecraft搭建Python编程环境

这篇文章将给大家介绍一种在我的世界minecraft里搭建Python编程开发环境的操作方法。目前看起来应该是全网最简单的方法。搭建完成后,马上就可以利用python代码在我的世界自动创建很多有意思的...

Python开发中的虚拟环境管理_python3虚拟环境

Python开发中,虚拟环境管理帮助隔离项目依赖,避免不同项目之间的依赖冲突。虚拟环境的作用隔离依赖:不同项目可能需要不同版本的库,虚拟环境可以为每个项目创建独立的环境。避免全局污染:全局安装的库可...

Python内置zipfile模块:操作 ZIP 归档文件详解

一、知识导图二、知识讲解(一)zipfile模块概述zipfile模块是Python内置的用于操作ZIP归档文件的模块。它提供了创建、读取、写入、添加及列出ZIP文件的功能。(二)ZipFile类1....

Python内置模块pydoc :文档生成器和在线帮助系统详解

一、引言在Python开发中,良好的文档是提高代码可读性和可维护性的关键。pydoc是Python自带的一个强大的文档生成器和在线帮助系统,它可以根据Python模块自动生成文档,并支持多种输出格式...

Python sys模块使用教程_python system模块

1.知识导图2.sys模块概述2.1模块定义与作用sys模块是Python标准库中的一个内置模块,提供了与Python解释器及其环境交互的接口。它包含了许多与系统相关的变量和函数,可以用来控制P...

Python Logging 模块完全解读_python logging详解

私信我,回复:学习,获取免费学习资源包。Python中的logging模块可以让你跟踪代码运行时的事件,当程序崩溃时可以查看日志并且发现是什么引发了错误。Log信息有内置的层级——调试(deb...

软件测试|Python logging模块怎么使用,你会了吗?

Pythonlogging模块使用在开发和维护Python应用程序时,日志记录是一项非常重要的任务。Python提供了内置的logging模块,它可以帮助我们方便地记录应用程序的运行时信息、错误和调...

取消回复欢迎 发表评论: