百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

使用 Python 列出目录中文件的 4 种简便方法

off999 2024-10-04 19:02 32 浏览 0 评论

你想了解如何使用 Python 列出目录中的文件吗?在本文中,你将了解如何以 4 种不同的方式进行操作,以便你可以选择自己喜欢的一种。

在所有示例中,我们将列出具有以下结构的目录中的文件。我们将调用目录test_dir

.
├── data
│   └── tech.txt
└── report.txt

1 directory, 2 files

如何使用 Python os.listdir() 列出目录中的文件

Python OS 模块允许执行操作系统任务。该模块带有多种功能,可用于创建、删除和获取文件和目录。OS 模块有一个名为listdir()的函数,它允许列出目录中的文件和子目录。

import os 

directory = '/Users/elio/temp/test_dir'
file_paths = os.listdir(directory) 
print(file_paths)

导入 OS 模块后,我们设置目录路径并将其传递给listdir()函数,该函数列出目录中存在的所有文件。

请注意,listdir()函数返回我们传递给它的目录中的文件和子目录列表,但它不会列出任何子目录中的文件。

事实上,下面的输出不包括数据目录中的tech.txt文件:

注意:如果你使用的是 Windows,则可以根据计算机上test_dir目录的位置设置目录变量的值。

让我们在最后一个 print() 函数之前添加以下 Python 语句以显示file_paths变量的类型。

print(type(file_paths))

当你执行该程序时,你将在输出中看到以下内容,表明file_paths变量是一个Python 列表

os.listdir()的输出中,我们不知道listdir()返回的列表的给定元素是文件还是目录,而无需进行任何额外检查。

Python os.walk() 函数如何工作?

要查看所有子目录中的文件列表,我们可以使用基于OS 模块的walk( ) 函数的不同方法。此函数递归地列出文件和子目录。

在使用os.walk()获取测试目录中的文件列表之前,让我们打开 Python shell 了解os.walk()的工作原理。

>>> import os 
>>> dir_content = os.walk( '.' ) 
>>> dir_content 
<generator object walk at 0x7fd09008c430 >

当我们将当前目录(由点标识)传递给os.walk时,我们会得到一个生成器对象

让我们通过使用next() 函数来了解更多关于生成器对象的信息。

>>> next (dir_content) 
( '.' , [ 'data' ], [ 'report.txt' ])

现在我们可以看到 os.walk() 生成一个Python 元组,其中第一个元素是当前目录,第二个元素是传递给它的目录中的子目录列表,第三个元素是该目录中的文件列表。

让我们再次调用next()函数

>>> next (dir_content) 
( './data' , [], [ 'tech.txt' ])

os.walk()函数自上而下遍历目录,因此当我们第二次调用next ()函数时,我们将它应用于数据子目录。

如果你再次调用next() ,你会得到一个 StopIteration 异常,因为考虑到子目录数据不包含任何子目录,生成器对象中没有更多的值。

>>> next(dir_content)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration

如何使用 Python os.walk() 递归地列出目录中的文件

现在我们已经了解了os.walk()的工作原理,让我们编写一些代码来获取我们测试目录中所有文件的列表。

import os

directory = '/Users/elio/temp/test_dir'
file_paths = []
for dir_path, dirs, files in os.walk(directory):
    file_paths.extend([os.path.join(dir_path, file) for file in files])

print(file_paths)

输出:

在上面的示例中,我们使用了三个新变量:

  • dir_path — 用于存储生成器对象返回的目录(还记得我们在上一节中看到的有关os.walk()的内容)。
  • dirs — 用于存储生成器对象返回的子目录。
  • files —用于存储生成器对象返回的文件。

函数os.path.join()通过将目录路径与文件名连接起来返回给定文件的完整路径。

我们还在for 循环中使用了列表理解

如何使用 Glob Python 模块列出目录中的文件

glob 模块可以返回匹配特定模式的文件的路径。该模块还允许在目录中列出文件。该模块使用通配符来搜索文件。

例如,如果我们只想列出文本文件,那么我们使用通配符 ( .txt )。

import glob 

directory = '/Users/elio/temp/test_dir/*'
file_paths = glob.glob(directory) 
print(file_paths)

导入 glob 模块后,我们指定了目录的路径,我们使用通配符(*)表示搜索所有文件和目录。

然后我们将它传递给 glob.glob 函数:

如果你只想匹配 .txt 文件,你可以更新以下行:

directory = '/Users/elio/temp/test_dir/*.txt'

使用 Python glob 模块列出目录中文件的一个好处是,这种方法会自动包含每个文件的完整路径。

在我们之前看到的os.listdir()os.walk()示例中,情况并非如此。

使用 Glob Python 模块以递归方式显示目录中的文件

在我们在上一节末尾创建的程序的输出中,你看不到数据目录中的文件tech.txt 。为此,你必须递归地列出文件。

要使用 Python glob 模块递归地列出目录中的文件,你必须将递归参数传递给 glob.glob() 函数并将其设置为 True。递归参数默认为 False。你还必须在你使用的模式中使用双星号。

我们将对上一节的代码进行两个更改:

  • 用双星号 (**)替换目录变量末尾的星号。
  • 将附加参数传递给glob函数 ( recursive = True )。
import glob 

directory = '/Users/elio/temp/test_dir/**'
file_paths = glob.glob(directory, recursive= True ) 
print (file_paths)

我们在传递给glob()函数的目录模式中使用的双星号仅在recursive为 True 时适用。

使用 Python PathLib 模块列出目录中的文件

PathLib 是另一个提供强大功能来处理文件的 Python 模块。

我们将使用Path()来定义目录的路径,然后我们将使用iterdir()来遍历目录。

然后,我们使用is_file()方法来检查我们是否正在处理文件。

import pathlib 
 
directory = '/Users/elio/temp/test_dir/'
file_paths = [] 

for file in pathlib.Path(directory).iterdir(): 
    if file.is_file(): 
        file_paths.append(file) 

print(file_paths)

请注意,上面的代码仅列出当前目录中的文件。它不通过子目录。

要列出当前目录和子目录中的文件,请修改上面的代码以使其递归。

让我们看一个例子:

from pathlib import Path

directory = Path('/Users/elio/temp/test_dir/')
file_paths = []
for file in directory.rglob('*'):
    if file.is_file():
        file_paths.append(str(file))

print(file_paths)

这次在输出中你还可以在数据子目录中看到文件tech.txt 。


在 Python 中,glob.glob()是一个函数,它返回与给定模式匹配的文件路径列表。rglob () 函数类似,但它在指定路径下的所有目录中递归搜索匹配项。

在输出中,我们还得到了数据目录下的tech.txt文件,因为我们使用了rglob()函数。

尝试通过将rglob('*')替换为glob('*')来更新之前的代码,并确认在输出中你只看到文件report.txt。换句话说,该行为不再是递归的。

结论

在本文中,你学习了如何使用 Python 列出目录中的文件。

我们已经看到使用 OS、Glob 和 Pathlib 模块列出文件的不同方式。

如果你发现我的任何文章对你有帮助或者有用,麻烦点赞或者转发。 谢谢!

相关推荐

使用 python-fire 快速构建 CLI_如何搭建python项目架构

命令行应用程序是开发人员最好的朋友。想快速完成某事?只需敲击几下键盘,您就已经拥有了想要的东西。Python是许多开发人员在需要快速组合某些东西时选择的第一语言。但是我们拼凑起来的东西在大多数时候并...

Python 闭包:从底层逻辑到实战避坑,附安全防护指南

一、闭包到底是什么?你可以把闭包理解成一个"带记忆的函数"。它诞生时会悄悄记下自己周围的变量,哪怕跑到别的地方执行,这些"记忆"也不会丢失。就像有人出门时总会带上...

使用Python实现九九乘法表的打印_用python打印一个九九乘法表

任务要求九九乘法表的结构如下:1×1=11×2=22×2=41×3=32×3=63×3=9...1×9=92×9=18...9×9=81使用Python编写程序,按照上述格式打印出完整的九...

吊打面试官(四)--Java语法基础运算符一文全掌握

简介本文介绍了Java运算符相关知识,包含运算规则,运算符使用经验,特殊运算符注意事项等,全文5400字。熟悉了这些内容,在运算符这块就可以吊打面试官了。Java运算符的规则与特性1.贪心规则(Ma...

Python三目运算基础与进阶_python三目运算符判断三个变量

#头条创作挑战赛#Python中你学会了三步运算,你将会省去很多无用的代码,我接下来由基础到进阶的方式讲解Python三目运算基础在Python中,三目运算符也称为条件表达式。它可以通过一行代码实现条...

Python 中 必须掌握的 20 个核心函数——set()详解

set()是Python中用于创建集合的核心函数,集合是一种无序、不重复元素的容器,非常适合用于成员检测、去重和数学集合运算。一、set()的基本用法1.1创建空集合#创建空集合empty_se...

15个让Python编码效率翻倍的实用技巧

在软件开发领域,代码质量往往比代码数量更重要。本文整理的15个Python编码技巧,源自开发者在真实项目中验证过的工作方法,能够帮助您用更简洁的代码实现更清晰的逻辑。这些技巧覆盖基础语法优化到高级特性...

《Python从小白到入门》自学课程目录汇总(和猫妹学Python)

小朋友们好,大朋友们好!不知不觉,这套猫妹自学Python基础课程已经结束了,猫妹体会到了水滴石穿的力量。水一直向下滴,时间长了能把石头滴穿。只要坚持不懈,细微之力也能做出很难办的事。就比如咱们的学习...

8÷2(2+2) 等于1还是16?国外网友为这道小学数学题吵疯了……

近日,国外网友因为一道小学数学题在推特上争得热火朝天。事情的起因是一个推特网友@pjmdoll发布了一条推文,让他的关注者解答一道数学题:Viralmathequationshavebeen...

Python学不会来打我(21)python表达式知识点汇总

在Python中,表达式是由变量、运算符、函数调用等组合而成的语句,用于产生值或执行特定操作。以下是对Python中常见表达式的详细讲解:1.1算术表达式涉及数学运算的表达式。例如:a=5b...

Python运算符:数学助手,轻松拿咧

Python中的运算符就像是生活中的数学助手,帮助我们快速准确地完成这些计算。比如购物时计算总价、做家务时分配任务等。这篇文章就来详细聊聊Python中的各种运算符,并通过实际代码示例帮助你更好地理解...

Python学不会来打我(17)逻辑运算符的使用方法与使用场景

在Python编程中,逻辑运算符(LogicalOperators)是用于组合多个条件表达式的关键工具。它们可以将多个布尔表达式连接起来,形成更复杂的判断逻辑,并返回一个布尔值(True或Fa...

Python编程基础:运算符的优先级_python中的运算符优先级问题

多个运算符同时出现在一个表达式中时,先执行哪个,后执行哪个,这就涉及运算符的优先级。如数学表达式,有+、-、×、÷、()等,优先级顺序是()、×、÷、+、-,如5+(5-3)×4÷2,先计算(5-3)...

Python运算符与表达式_python中运算符&的功能

一、运算符分类总览1.Python运算符全景图2.运算符优先级表表1.3.1Python运算符优先级(从高到低)优先级运算符描述结合性1**指数右→左2~+-位非/一元加减右→左3*//...

Python操作Excel:从基础到高级的深度实践

Python凭借其丰富的库生态系统,已成为自动化处理Excel数据的强大工具。本文将深入探讨五个关键领域,通过实际代码示例展示如何利用Python进行高效的Excel操作,涵盖数据处理、格式控制、可视...

取消回复欢迎 发表评论: