使用 Python 列出目录中文件的 4 种简便方法
off999 2024-10-04 19:02 25 浏览 0 评论
你想了解如何使用 Python 列出目录中的文件吗?在本文中,你将了解如何以 4 种不同的方式进行操作,以便你可以选择自己喜欢的一种。
在所有示例中,我们将列出具有以下结构的目录中的文件。我们将调用目录test_dir:
.
├── data
│ └── tech.txt
└── report.txt
1 directory, 2 files
如何使用 Python os.listdir() 列出目录中的文件
Python OS 模块允许执行操作系统任务。该模块带有多种功能,可用于创建、删除和获取文件和目录。OS 模块有一个名为listdir()的函数,它允许列出目录中的文件和子目录。
import os
directory = '/Users/elio/temp/test_dir'
file_paths = os.listdir(directory)
print(file_paths)
导入 OS 模块后,我们设置目录路径并将其传递给listdir()函数,该函数列出目录中存在的所有文件。
请注意,listdir()函数返回我们传递给它的目录中的文件和子目录列表,但它不会列出任何子目录中的文件。
事实上,下面的输出不包括数据目录中的tech.txt文件:
注意:如果你使用的是 Windows,则可以根据计算机上test_dir目录的位置设置目录变量的值。
让我们在最后一个 print() 函数之前添加以下 Python 语句以显示file_paths变量的类型。
print(type(file_paths))
当你执行该程序时,你将在输出中看到以下内容,表明file_paths变量是一个Python 列表。
从os.listdir()的输出中,我们不知道listdir()返回的列表的给定元素是文件还是目录,而无需进行任何额外检查。
Python os.walk() 函数如何工作?
要查看所有子目录中的文件列表,我们可以使用基于OS 模块的walk( ) 函数的不同方法。此函数递归地列出文件和子目录。
在使用os.walk()获取测试目录中的文件列表之前,让我们打开 Python shell 了解os.walk()的工作原理。
>>> import os
>>> dir_content = os.walk( '.' )
>>> dir_content
<generator object walk at 0x7fd09008c430 >
当我们将当前目录(由点标识)传递给os.walk时,我们会得到一个生成器对象。
让我们通过使用next() 函数来了解更多关于生成器对象的信息。
>>> next (dir_content)
( '.' , [ 'data' ], [ 'report.txt' ])
现在我们可以看到 os.walk() 生成一个Python 元组,其中第一个元素是当前目录,第二个元素是传递给它的目录中的子目录列表,第三个元素是该目录中的文件列表。
让我们再次调用next()函数
>>> next (dir_content)
( './data' , [], [ 'tech.txt' ])
os.walk()函数自上而下遍历目录,因此当我们第二次调用next ()函数时,我们将它应用于数据子目录。
如果你再次调用next() ,你会得到一个 StopIteration 异常,因为考虑到子目录数据不包含任何子目录,生成器对象中没有更多的值。
>>> next(dir_content)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
如何使用 Python os.walk() 递归地列出目录中的文件
现在我们已经了解了os.walk()的工作原理,让我们编写一些代码来获取我们测试目录中所有文件的列表。
import os
directory = '/Users/elio/temp/test_dir'
file_paths = []
for dir_path, dirs, files in os.walk(directory):
file_paths.extend([os.path.join(dir_path, file) for file in files])
print(file_paths)
输出:
在上面的示例中,我们使用了三个新变量:
- dir_path — 用于存储生成器对象返回的目录(还记得我们在上一节中看到的有关os.walk()的内容)。
- dirs — 用于存储生成器对象返回的子目录。
- files —用于存储生成器对象返回的文件。
函数os.path.join()通过将目录路径与文件名连接起来返回给定文件的完整路径。
我们还在for 循环中使用了列表理解。
如何使用 Glob Python 模块列出目录中的文件
glob 模块可以返回匹配特定模式的文件的路径。该模块还允许在目录中列出文件。该模块使用通配符来搜索文件。
例如,如果我们只想列出文本文件,那么我们使用通配符 ( .txt )。
import glob
directory = '/Users/elio/temp/test_dir/*'
file_paths = glob.glob(directory)
print(file_paths)
导入 glob 模块后,我们指定了目录的路径,我们使用通配符(*)表示搜索所有文件和目录。
然后我们将它传递给 glob.glob 函数:
如果你只想匹配 .txt 文件,你可以更新以下行:
directory = '/Users/elio/temp/test_dir/*.txt'
使用 Python glob 模块列出目录中文件的一个好处是,这种方法会自动包含每个文件的完整路径。
在我们之前看到的os.listdir()和os.walk()示例中,情况并非如此。
使用 Glob Python 模块以递归方式显示目录中的文件
在我们在上一节末尾创建的程序的输出中,你看不到数据目录中的文件tech.txt 。为此,你必须递归地列出文件。
要使用 Python glob 模块递归地列出目录中的文件,你必须将递归参数传递给 glob.glob() 函数并将其设置为 True。递归参数默认为 False。你还必须在你使用的模式中使用双星号。
我们将对上一节的代码进行两个更改:
- 用双星号 (**)替换目录变量末尾的星号。
- 将附加参数传递给glob函数 ( recursive = True )。
import glob
directory = '/Users/elio/temp/test_dir/**'
file_paths = glob.glob(directory, recursive= True )
print (file_paths)
我们在传递给glob()函数的目录模式中使用的双星号仅在recursive为 True 时适用。
使用 Python PathLib 模块列出目录中的文件
PathLib 是另一个提供强大功能来处理文件的 Python 模块。
我们将使用Path()类来定义目录的路径,然后我们将使用iterdir()来遍历目录。
然后,我们使用is_file()方法来检查我们是否正在处理文件。
import pathlib
directory = '/Users/elio/temp/test_dir/'
file_paths = []
for file in pathlib.Path(directory).iterdir():
if file.is_file():
file_paths.append(file)
print(file_paths)
请注意,上面的代码仅列出当前目录中的文件。它不通过子目录。
要列出当前目录和子目录中的文件,请修改上面的代码以使其递归。
让我们看一个例子:
from pathlib import Path
directory = Path('/Users/elio/temp/test_dir/')
file_paths = []
for file in directory.rglob('*'):
if file.is_file():
file_paths.append(str(file))
print(file_paths)
这次在输出中你还可以在数据子目录中看到文件tech.txt 。
在 Python 中,glob.glob()是一个函数,它返回与给定模式匹配的文件路径列表。rglob () 函数类似,但它在指定路径下的所有目录中递归搜索匹配项。
在输出中,我们还得到了数据目录下的tech.txt文件,因为我们使用了rglob()函数。
尝试通过将rglob('*')替换为glob('*')来更新之前的代码,并确认在输出中你只看到文件report.txt。换句话说,该行为不再是递归的。
结论
在本文中,你学习了如何使用 Python 列出目录中的文件。
我们已经看到使用 OS、Glob 和 Pathlib 模块列出文件的不同方式。
如果你发现我的任何文章对你有帮助或者有用,麻烦点赞或者转发。 谢谢!
相关推荐
- python爬取电子课本,送给居家上课的孩子们
-
在这个全民抗疫的日子,中小学生们也开启了居家上网课的生活。很多没借到书的孩子,不得不在网上看电子课本,有的电子课本是老师发的网络链接,每次打开网页去看,既费流量,也不方便。今天我们就利用python的...
- 高效办公!Python 批量生成PDF文档是如何做到的?
-
前言:日常办公中,经常会使用PDF文档,难免需要对PDF文档进行编辑,有时候PDF文档中的大部分内容都是一样的,只是发送对象不同。这种模板套用的场景下,使用Python进行自动化就尤为方便,用最短的时...
- 如何用Python将PDF完整的转成Word?
-
PDF文件完整的转为Word,转换后格式排版不会乱,图片等信息完整显示不丢失。这个很简单,有很多方法都可以实现。方法一:Python利用Python将PDF文件转换为Word,有许多库可以帮你实现这一...
- 使用Python拆分、合并PDF(python合并多个pdf)
-
知识点使用Python操作PDF!主要内容有:1、PDF拆分;2、PDF合并。在工作中,难免会和PDF打交道,所以掌握一点处理PDF的技能非常有必要,本文将介绍几个常用的功能。PDF拆分很多时候,获取...
- 10分钟实现PDF转Word神器!看DeepSeek如何用Python解放打工人
-
开篇痛点每个被PDF折磨过的职场人都懂——领导发来的扫描件要修改,手动抄到Word需要2小时;网上下载的报告想复制数据,却变成乱码…今天我们用Python+DeepSeek,10分钟打造一个智能转换工...
- 《Python知识手册》,高清全彩pdf版开放下载
-
Python编程还不懂?今天我要把我参与编写的这套《Python知识手册》免费分享出来,看完文末有惊喜哦。...
- 利用python进行数据分析,PDF文档给你答案
-
本书详细介绍利用Python进行操作、处理、清洗和规整数据等方面的具体细节和基本要点。虽然本书的标题是“数据分析”,重点却是Python编程、库,以及用于数据分析的工具。兄弟,毫无套路!PDF版无偿获...
- OCRmypdf:一款可以让扫描PDF文件变得可搜索、可复制!
-
简介在日常工作中,我们经常会接触到各种PDF文件,其中不少是扫描版文档。处理这些扫描PDF时,尽管内容看似完整,但往往无法直接复制或搜索其中的文本。尤其是在需要对大量文档进行文本分析、存档或后期编辑时...
- 高效的OCR处理工具!让扫描PDF文件变得可搜索、可复制!
-
在工作中,我们常常遇到各种各样的PDF文件,其中不乏一些扫描版的文档。而在处理扫描的PDF文件时,虽然文件内容看似完整,但你却无法复制、搜索其中的文本。特别是对大量文档需要进行文本分析、存档、或者...
- 三步教你用Elasticsearch+PyMuPDF实现PDF大文件秒搜!
-
面对100页以上的大型PDF文件时,阅读和搜索往往效率低下。传统关系型数据库在处理此类数据时容易遇到性能瓶颈,而Elasticsearch凭借其强大的全文检索和分布式架构,成为理想解决方案。通过...
- 用 Python 去除 PDF 水印,你学会吗?
-
今天介绍下用Python去除PDF(图片)的水印。思路很简单,代码也很简洁。首先来考虑Python如何去除图片的水印,然后再将思路复用到PDF上面。这张图片是前几天整理《数据结构和算法...
- 扫描PDF档案效率提升300%!OCRmyPDF:告别无法搜索的PDF噩梦,这款26K Star的开源神器让文本识别轻松上手!
-
要在PDF中搜索某个关键词,结果发现啥也找不到?这种情况大多数人都遇到过吧,特别是处理扫描文档或图片PDF时。就在前几天,我还在为这事抓狂呢!后来无意中发现了OCRmyPDF这个宝藏项目...简直就...
- Python自动化办公之PDF版本发票识别并提取关键信息教程(上篇)
-
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Python自动化办公发票数据处理的问题,一起来看看吧。二、实现过程这个问题在实际工作中还是非常常见的,实用性和通用性都比...
- PDF解锁神器:用PyMuPDF与pdfplumber告别手动提取
-
前言大家好,今天咱们来聊聊如何用Python中的PyMuPDF和pdfplumber库,轻松提取PDF文件里的文本和元数据。你是否曾经在处理一个复杂的PDF文件时,感到信息难以触及,提取过程让人抓狂?...
- 《Python知识手册》,高清pdf免费获取
-
今天我要把我参与编写的这套《Python知识手册》免费分享出来,真正弘扬Python开源精神!手册的部分页面如下:获取方式:...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- python爬取电子课本,送给居家上课的孩子们
- 高效办公!Python 批量生成PDF文档是如何做到的?
- 如何用Python将PDF完整的转成Word?
- 使用Python拆分、合并PDF(python合并多个pdf)
- 10分钟实现PDF转Word神器!看DeepSeek如何用Python解放打工人
- 《Python知识手册》,高清全彩pdf版开放下载
- 利用python进行数据分析,PDF文档给你答案
- OCRmypdf:一款可以让扫描PDF文件变得可搜索、可复制!
- 高效的OCR处理工具!让扫描PDF文件变得可搜索、可复制!
- 三步教你用Elasticsearch+PyMuPDF实现PDF大文件秒搜!
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python自定义函数 (53)
- python进度条 (67)
- python吧 (67)
- python字典遍历 (54)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python串口编程 (60)
- python读取文件夹下所有文件 (59)
- java调用python脚本 (56)
- python操作mysql数据库 (66)
- python字典增加键值对 (53)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python人脸识别 (54)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)