百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

开眼界!Python遍历文件可以这样做

off999 2024-12-04 14:34 20 浏览 0 评论

来源:【公众号】

Python技术

Python 对于文件夹或者文件的遍历一般有两种操作方法,一种是至二级利用其封装好的 walk 方法操作:


import os
for root,dirs,files in os.walk("/Users/cxhuan/Downloads/globtest/hello"):
    for dir in dirs:
        print(os.path.join(root, dir))
    for file in files:
        print(os.path.join(root, file))

上面代码运行结果如下:

/Users/cxhuan/Downloads/globtest/hello/world
/Users/cxhuan/Downloads/globtest/hello/.DS_Store
/Users/cxhuan/Downloads/globtest/hello/hello3.txt
/Users/cxhuan/Downloads/globtest/hello/hello2.txt
/Users/cxhuan/Downloads/globtest/hello/hello1.txt
/Users/cxhuan/Downloads/globtest/hello/world/world1.txt
/Users/cxhuan/Downloads/globtest/hello/world/world3.txt
/Users/cxhuan/Downloads/globtest/hello/world/world2.txt

上述程序,将 os.walk 读取到的所有路径 root 、目录名 dirs 与文件名 files ,也就是三个文件数组利用 foreach 循环输出。join方法就是将其路径与目录名或者文件名连接起来,组成一个完整的目录。

另一种是用递归的思路,写成下面的形式:


import os
files = list()
def dirAll(pathname):
    if os.path.exists(pathname):
        filelist = os.listdir(pathname)
        for f in filelist:
            f = os.path.join(pathname, f)
            if os.path.isdir(f):
                dirAll(f)
            else:
                dirname = os.path.dirname(f)
                baseName = os.path.basename(f)
                if dirname.endswith(os.sep):
                    files.append(dirname+baseName)
                else:
                    files.append(dirname+os.sep+baseName)


dirAll("/Users/cxhuan/Downloads/globtest/hello")
for f in files:
    print(f)

运行上面代码,得到的结果和上面一样。

这两种方法都没问题,就是写起来比较麻烦,特别是第二种,一不小心还有可能写出 bug 。

今天我们来介绍第三种方法——利用 glob 模块来遍历文件。

简介

glob 是 python 自带的一个操作文件的模块,以简洁实用著称。由于这个模块的功能比较简单,所以也很容易上手和使用。它主要用来查找符合特定规则的文件路径。使用这个模块来查找文件,只需要用到*?[] 这三个匹配符:

 * : 匹配0个或多个字符;
 ? : 匹配单个字符;
 [] :匹配指定范围内的字符,如:[0-9]匹配数字。

glob.glob 方法

glob.glob 方法主要返回所有匹配的文件路径列表。它只有一个参数 pathname ,定义了文件路径匹配规则,这里可以是绝对路径,也可以是相对路径。

使用 * 匹配

我们可以用 * 匹配零个或者多个字符。

输出目录下的子目录或者文件:


for p1 in glob.glob('/Users/cxhuan/Downloads/globtest/*'):
    print(p1)

运行上面代码,会将 globtest 文件夹下仅有的目录输出出来,输出内容如下:


/Users/cxhuan/Downloads/globtest/hello

我们也可以通过制定层级来遍历文件或者文件夹:


for p in glob.glob('/Users/cxhuan/Downloads/globtest/*/*'):
    print(p)

上面的代码会遍历 globtest 文件夹以及子文件夹,将所有的文件或文件夹路径打印出来:

/Users/cxhuan/Downloads/globtest/hello/world
/Users/cxhuan/Downloads/globtest/hello/hello3.txt
/Users/cxhuan/Downloads/globtest/hello/hello2.txt
/Users/cxhuan/Downloads/globtest/hello/hello1.txt

我们也可以对文件或者文件夹进行过滤:


for p in glob.glob('/Users/cxhuan/Downloads/globtest/hello/*3.txt'):
    print(p)

上面代码值匹配 hello 目录下的文件名末尾为 ‘3’ 的 txt 文件,运行结果如下:

/Users/cxhuan/Downloads/globtest/hello/hello3.txt

使用 ? 匹配

我们可以用问号(?)匹配任何单个的字符。


for p in glob.glob('/Users/cxhuan/Downloads/globtest/hello/hello?.txt'):
    print(p)

上面的代码输出 hello 目录下的以 ‘hello’ 开头的 txt 文件,输出结果如下:


/Users/cxhuan/Downloads/globtest/hello/hello3.txt
/Users/cxhuan/Downloads/globtest/hello/hello2.txt
/Users/cxhuan/Downloads/globtest/hello/hello1.txt

使用 [] 匹配

我们可以使用 [] 来匹配一个范围:


for p in glob.glob('/Users/cxhuan/Downloads/globtest/hello/*[0-2].*'):
    print(p)

我们想要得到 hello 目录下的文件名结尾数字的范围为 0到2的文件,运行上面代码,获得的输出为:

/Users/cxhuan/Downloads/globtest/hello/hello2.txt
/Users/cxhuan/Downloads/globtest/hello/hello1.txt

glob.iglob 方法

python 的 glob 方法可以对文件夹下所有文件进行遍历,并返回一个 list 列表。而 iglob 方法一次只获取一个匹配路径。下面是一个简单的例子来说明二者的区别:

p = glob.glob('/Users/cxhuan/Downloads/globtest/hello/hello?.*')
print(p)

print('----------------------')

p = glob.iglob('/Users/cxhuan/Downloads/globtest/hello/hello?.*')
print(p)

运行上面代码,结果返回是:


['/Users/cxhuan/Downloads/globtest/hello/hello3.txt', '/Users/cxhuan/Downloads/globtest/hello/hello2.txt', '/Users/cxhuan/Downloads/globtest/hello/hello1.txt']
----------------------
<generator object _iglob at 0x1040d8ac0>

从上面的结果我们可以很容易看到二者的区别,前者返回的是一个列表,后者返回的是一个可迭代对象。

我们针对这个可迭代对象做一下操作看看:

p = glob.iglob('/Users/cxhuan/Downloads/globtest/hello/hello?.*')
print(p.__next__())
print(p.__next__())

运行结果如下:

/Users/cxhuan/Downloads/globtest/hello/hello3.txt
/Users/cxhuan/Downloads/globtest/hello/hello2.txt

我们可以看到,针对这个可迭代对象,我们一次可以获取到一个元素。这样做的好处是节省内存,试想如果一个路径下有大量的文件夹或者文件,我们使用这个迭代对象不用一次性全部获取到内存,而是可以慢慢获取。

总结

今天分享的模块虽然功能简单,但是对于我们遍历文件或者目录来说足够使用了,并且方法简单易懂,值得大家经常使用。如果你觉得今天分享的模块有用,点个“”支持一下吧!

相关推荐

qq密码安全中心官网(qq安全中心密码保护)
  • qq密码安全中心官网(qq安全中心密码保护)
  • qq密码安全中心官网(qq安全中心密码保护)
  • qq密码安全中心官网(qq安全中心密码保护)
  • qq密码安全中心官网(qq安全中心密码保护)
win7升win10会丢数据吗(win7升级win10会丢失数据吗)

你打开电脑那个控制面板,然后硬件硬盘管理。你看一下在那里应该是可以吧,d盘e盘f盘都拉出来的。只要您的那个硬盘没有坏。如果说这里面找不到的话你就拿到,那个,卖电脑那里重新装个系统就可以了。不会!安卓手...

win10系统在哪里(win10系统在哪里看显卡配置)

在Windows10系统中,您可以使用以下步骤查看所有程序:1.点击“开始”按钮。2.在“搜索”框中键入“程序”,然后按“搜索”。3.在搜索结果页面中,您可以使用分类浏览程序列表,也可以按...

win7内部版本7601怎么激活(win7内部版本7601激活必须今天激活)

没法激活,win7本身不具备激活7601的功能右击计算机--属性,拉倒最下面,会提示该系统未激活,然后点击激活,输入密钥就可以了,需要连接互联网。如果没有互联网,也可以电话激活。Windows7内部版...

win8pe是什么意思(win8pe系统)

Windows8.1和PEWindows都是操作系统,但它们有一些不同之处。Windows8.1是微软推出的正式版操作系统,拥有更多的功能和应用程序。它适用于个人用户和商业用户,并提供更好的兼容性...

电脑桌面此电脑没了怎么恢复

1.在桌面上单击鼠标右键。将光标移到查看选项上。2.此时在右边找到显示桌面图标选项。此时在右边找到显示桌面图标选项。3.此时即可发现桌面的图标回来了。电脑桌面什么都没有了,可以建议找到设置,尝试恢复电...

台式电脑怎么重置系统(台式电脑怎么重新设置)

1、Win10系统启动到LOGO界面后,强制重启,反复3次左右,至到显示疑难解答,我们点击疑难解答进入;2.选重置此点电脑;3.接下来这里,我选择的删除所有内容。这里是准备要格式化系统分区C盘,如果想...

电脑与打印机连的最简单步骤
  • 电脑与打印机连的最简单步骤
  • 电脑与打印机连的最简单步骤
  • 电脑与打印机连的最简单步骤
  • 电脑与打印机连的最简单步骤
如何登录hotmail邮箱(国内怎么登陆hotmail)
  • 如何登录hotmail邮箱(国内怎么登陆hotmail)
  • 如何登录hotmail邮箱(国内怎么登陆hotmail)
  • 如何登录hotmail邮箱(国内怎么登陆hotmail)
  • 如何登录hotmail邮箱(国内怎么登陆hotmail)
电脑公司模拟器破解版下载(电脑公司模拟器1.0.8)

直接先将xci程序复制到switch存储卡根目录,而后通过主机自带的安装程序直接安装

xp系统永久激活密钥2020年(xp系统激活秘钥)

windowsxp产品密钥大全YBVJB-YV2JW-7FHPT-6D8XG-RT83GHRXTR-FKTCV-X8QCH-D7PTH-KYYPBJF8MD-XB4Y4-HHB28-Q3G2K-QW...

手写中文输入法下载安装(中文手写输入器)

1、首先第一步就是打开手机主界面,然后依次打开“设置”、“通用”、“键盘”,2、跳转的页面再点击“键盘”,3、勾选自己喜欢的中文手写模式,最后点击设定即可。仅参考先打开手机设置,然后点击一个语言和输入...

office2007的产品密钥(office 产品密钥)

下载一个kms软件关闭杀毒软件大概三十秒就会完成相应的注册然后就可以正常的使用了

十大杀毒app排行(知名杀毒软件)

360安全卫士今天就为您推荐杀毒软件排行榜第一的免费软件——360安全卫士,首创即扫即清功能,操作流程更简单,而且在用户使用过程当中还能有效拦截病毒的侵入,提供强力守护。状元:BitDefender ...

制作u盘系统安装盘win7(u盘制作win7操作系统)
  • 制作u盘系统安装盘win7(u盘制作win7操作系统)
  • 制作u盘系统安装盘win7(u盘制作win7操作系统)
  • 制作u盘系统安装盘win7(u盘制作win7操作系统)
  • 制作u盘系统安装盘win7(u盘制作win7操作系统)

取消回复欢迎 发表评论: