Pathlib库:Python面向对象的文件路径处理
off999 2024-10-26 12:08 16 浏览 0 评论
前言
Pathlib库提供了一个面向对象的API来解析,建立,测试和处理文件名和路径,而不是使用底层字符串操作。
其中Pathlib库有2个非常关键的类名:PurePosixPath,PureWindowsPath。它们可以在任意操作系统上实例化和使用,因为它们只处理文件名与目录名。
要实例化一个具体的类来处理真正的文件系统,需要使用Path得到一个PosixPath或WindowsPath,至于取哪个,取决于你是什么系统。
建立路径
下面,我们来通过Pathlib库建立路径。示例如下:
import pathlib
users = pathlib.PurePosixPath('/Users')
print(users)
users_liyuanjing = users / 'liyuanjinglyj'
print(users_liyuanjing)
users_yellow = users / pathlib.PurePosixPath('yellow')
print(users_yellow)
users_etc = users / '/ect/'
print(users_etc)
运行之后,效果如下:
如上面代码所示,我们通过PurePosixPath实例化一个新路径,新路径的对象表示的就是这个字符串的值。
而像之前使用os.path.join()组合路径,这里可以直接使用"/"符号进行拼接,即可以拼接字符串,也可以在拼接一个新路径的PurePosixPath对象。不过,有一点和os.path.join()一样,就是组合路径中,一旦后面也有“/”符号,那么就会舍弃前面的路径,比如最后的/etc路径。
joinPath()
既然提到了os.path.join()函数,我们就先来介绍一个Pathlib库中很像它的函数:joinPath()。它也是用于拼接路径的,具体示例如下:
import pathlib
users = pathlib.PurePosixPath()
paths = ['liyuanjinglyj', 'yellow']
result = users.joinpath(*paths)
print(result)
运行之后,效果如下:
路径格式化
既然是字符串路径,那么拼接的时候,肯定会有不规范的地方。所以,我们需要使用resolve()函数进行字符串路径规范化,示例如下:
import pathlib
users = pathlib.Path()
result = users / '..' / 'liyuanjing'
print(result.resolve())
users = pathlib.Path('/Users/local')
result = users / '..' / 'liyuanjing'
print(result.resolve())
运行之后,效果如下:
如上图所示,它会自动格式化路径,同时转化为绝对路径。
with_name()与with_suffix()
with_name():创建一个新路径,将一个路径中的文件名替换成为另一个不同的文件名。
with_suffix():创建一个新路径,将文件名的扩展名替换为一个不同的值。
示例如下:
import pathlib
one = pathlib.PurePosixPath('/base_demo/demo.py')
print(one)
two = one.with_name("yellow.py")
print(two)
three = two.with_suffix(".pyc")
print(three)
运行之后,效果如下:
如上图所示,with_name将文件名demo替换成了yellow。而with_suffix将文件名后缀py替换成了pyc。
解析路径
既然有组合路径,替换路径等。那么也会有解析路径,毕竟有时候我们只想要文件名,那么就必须分解路径。
分解路径会用到PurePosixPath成员变量parts,示例如下:
import pathlib
one = pathlib.PurePosixPath('D:/Users/base_demo/demo.py')
print(one.parts)
运行之后,效果如下:
可以看到,这里将路径中的所有“/”分割的符号都分解了,最后一个肯定就是文件名或者文件(只有文件的话)。
既然这里,我们可以通过一层层的分解得到各个文件的名称,那么PurePosixPath类也肯定有层级给文件名分类,比如像获取某个文件的父目录,可以通过如下代码做到:
import pathlib
one = pathlib.PurePosixPath('D:/Users/base_demo/demo.py')
print(one.parent)
print("----------")
for name in one.parents:
print(name)
运行之后,效果如下:
通过parents,我们可以一级一级地返回其父亲目录,直到根目录为止。
这里,还有一些成员变量在实际的应用中会经常的用到,示例如下:
import pathlib
one = pathlib.PurePosixPath('D:/Users/base_demo/demo.py')
print(one.name)
print(one.suffix)
print(one.stem)
运行之后,效果如下:
name:用于获取最后的文件名与后缀。
suffix:用于获取文件名的后缀
stem:用于获取文件名不要后缀
home()与cwd()
home():直接生成系统用户目录的路径
cwd():用于获取项目的绝对路径
示例如下:
import pathlib
one = pathlib.Path.home()
print(one)
two = pathlib.Path.cwd()
print(two)
运行之后,效果如下:
获取当前路径下的所有文件路径
在编写文件夹应用之时,我们每访问一个目录都会显示该目录下的所有文件与文件夹。而Pathlib库也能够做到这些,具体代码很简单,迭代iterdir()就行,示例如下:
import pathlib
one = pathlib.Path.cwd()
two = pathlib.Path('.')
for f1, f2 in zip(one.iterdir(), two.iterdir()):
print('{} : {}'.format(f1, f2))
运行之后,效果如下:
设置条件获取文件(glob()与rglob())
在遍历获取文件时,我们可能并不需要获取所有文件,而只要获取某些特定后缀的文件。比如上面的目录中,我们只需要txt后缀的文本怎么办?
可以直接使用glob()进行过滤,示例如下:
import pathlib
one = pathlib.Path('.')
for f in one.glob('*.txt'):
print(f)
运行之后,效果如下:
glob()与rglob()不同之处,在于rglob()是递归的,比如这层测试目录一直有一个.idea文件夹,使用glob()不会遍历到.idea文件夹里面的文件,而rglob()就会,而且只要继续有层级,会一直遍历符合条件的数据。
示例如下:
import pathlib
one = pathlib.Path('.')
for f in one.rglob('*'):
print(f)
运行之后,效果如下:
读写文件
既然通过Pathlib库管理文件非常的方便,那么它能过读写文件,是不是就是一个完美的文件操作库呢?
其实,Pathlib库还真能直接对文件进行读写。下面,我们随机创建一个文件进行读写操作,示例如下:
import pathlib
f = pathlib.Path('text.txt')
f.write_bytes("My name is Li Yuanjing".encode('utf-8'))
with f.open('r',encoding='utf-8') as content:
print(content.read())
print(f.read_text('utf-8'))
运行之后,效果如下:
这里,我们使用2种读取文件的方式,一种是通过with f.open()读取文件,一种是直接使用read_text()进行读取。唯一不同的是,如果要一行一行读取,可能前一种方式更合适。而写入文件直接使用write_bytes()函数就行,不过需要记得给写入内容指定编码。(当然直接写字符串可以用write_text()函数)
至于创建文件夹,直接使用f.mkdir()就行。
删除文件夹
在实际的文件操作中,我们还需要删除文件夹或者文件。而Pathlib库给我们提供了rmdir()函数进行空文件夹的删除,示例如下:
import pathlib
f = pathlib.Path('123')
f.rmdir()
如果文件夹不是空的,会直接报错,当然如果是空的就直接成功删除了。
如果是要删除文件,可以使用unlink()函数进行操作,示例如下:
import pathlib
f = pathlib.Path('a.txt')
f.unlink()
文件属性
在编写文件管理器应用时,我们往往还会获取文件的属性,比如创建时间,修改时间等等。Pathlib库可以很方便地获取这些数据的集合,示例如下:
import pathlib
f = pathlib.Path('英文文档.txt')
stat_info=f.stat()
print(stat_info)
运行之后,效果如下:
这里一共获取到文件的10个属性,具体含义如下表:
参数 | 含义 |
st_mode | inode 保护模式 |
st_ino | inode 节点号 |
st_dev | inode 驻留的设备 |
st_nlink | inode 的链接数 |
st_uid | 所有者的用户ID |
st_gid | 所有者的组ID |
st_size | 普通文件以字节为单位的大小;包含等待某些特殊文件的数据 |
st_atime | 上次访问的时间 |
st_mtime | 最后一次修改的时间 |
st_ctime | 创建时间 |
文件判断
os.path库有一大堆返回布尔类型的函数进行文件的判断,同样的Pathlib库也可以进行这些判断。博主这里列出了一张表格,判断文件的函数如下:
函数 | 意义 |
exists() | 判断文件或文件夹是否存在 |
is_dir() | 判断路径是否为文件夹 |
is_file() | 判断路径是否为文件 |
is_symlink() | 判断路径文件是否为快捷方式 |
is_socket() | 是否是socket文件 |
is_fifo() | 是否为管道 |
is_block_device() | 是否是块设备 |
is_char_device() | 是否是字符设备 |
is_absolute() | 是否是绝对路径 |
创建快捷方式
在Windows系统中,我们经常使用的桌面图标就是应用程序的快捷方式,真正的exe运行程序其实在安装目录,而通过Pathlib库我们也可以直接创建文件的快捷打开方式。示例如下:
import pathlib
f = pathlib.Path('1234.txt')
f.symlink_to('英文文档.txt')
运行之后,你会发现打开1234.txt也就是打开了英文文档.txt,两者内容一样。效果如下:
需要注意的是,直接运行程序会报错,因为Windows生成快捷方式需要管理员权限,所以在运行脚本时,记得一定要给权限。(以管理员的方式运行)
相关推荐
- Python中的两个内置函数id()和type()
-
id()>>>id(3)2531362761072>>>id(3.222222)2531397393680>>>id(3.0)25313...
- python 函数中,如何将另一个函数作为参数传递
-
python函数中,如何将另一个函数作为参数传递,类似C#委托defadd(a,b):"""这是一个简单的加法函数,接受两个参数并返回它们的和。""...
- Python性能暴涨10倍的终极指南:7个核心技巧+代码压缩秘籍
-
提升Python程序运行性能,使代码运行更流畅更快,以及压缩代码,减小代码大小,下面的方法仅供大家参考,有什么更好的方法在评论区说说。1.使用NumPy/SciPy替代纯Python循环...
- Python 匿名函数(Lambda 函数)详解
-
匿名函数(AnonymousFunction),在Python中称为lambda函数,是一种不需要使用def关键字定义的小型函数。它主要用于简化代码,特别适合需要函数对象的地方。1.基...
- Python学习笔记 | 匿名函数lambda、映射函数map和过滤函数filter
-
什么是匿名函数?定义:没有函数名的自定义函数场景:函数体非常简单,使用次数很少,没有必要声明函数,通常搭配高阶函数使用。高阶函数是能够把函数当成参数进行传递的函数,如:映射函数map和过滤函数fil...
- python练习:自定义函数调用:商品购物实例
-
1、商品录入dict_myshanpin_iof={101:{"商品名称":"毛毛熊","单价":25},102:{"商品名称":...
- Python中如何使用Lambda函数(lambda在python中的用法)
-
Python和其他编程语言一样,都在其语法中添加了lambda函数,Pythonlambda是匿名函数,比常规Python自定义函数有更简洁的语法。虽然Lambda语法在开始时可能会觉得有点混乱,...
- 8-Python内置函数(python内置函数代码)
-
Python提供了丰富的内置函数,这些函数可以直接使用而无需导入任何模块。以下是一些常用的内置函数及其示例:1-print()1-1-说明输出指定的信息到控制台。1-2-例子2-len()2-1-说...
- 用Python进行函数式编程(python函数程序)
-
什么是函数式编程?函数式程序设计是一种编程范例,它把计算当作数学函数的评价,避免状态和可变数据。换句话说,函数编程(FunctionalProgramming,FP)促进没有副作用和不变变量的代码。它...
- python 函数进阶(python如何进阶)
-
1.有名函数和匿名函数#该函数有名称,名称是adddefadd(x,y):returnx+y#改函数没有名称属于匿名函数,也叫lambda表达式lambda_add...
- python自学者的分享:自定义函数、参数作用域、匿名函数、装饰器
-
#自定义新函数函数名newhsdefnewhs(a,b=1):#b的默认值为1,在没有传入b值时,采用默认值,,默认值参数不能放前边returna-bprint(newh...
- Python 函数式编程的 8 大核心技巧,不允许你还不会
-
函数式编程是一种强调使用纯函数、避免共享状态和可变数据的编程范式。Python虽然不是纯函数式语言,但提供了丰富的函数式编程特性。以下是Python函数式编程的8个核心技巧:1.纯函数(...
- 零基础到发布:手把手教你创建并分发 Python 自定义库
-
作为程序员,我们经常依赖各种外部库来解决不同的问题。这些库由技术娴熟的开发者创建,为我们提供了节省时间和精力的解决方案。但你是否曾想过:“我也能创建属于自己的自定义库吗?”答案是肯定的!本文将为你详细...
- 打工人学Python:(七)自定义函数,打造自己的武器库
-
从一个简单的函数开始#!/usr/bin/envpython#-*-encoding:utf-8-*-'''@Purpose:Wordcount@...
- 肖sir_python自定义函数format、zip函数
-
python自定义函数一、常见的自定义函数已经学过的函数:list、print、set、str、type、tuple、dict、range、input等今天学的函数:format二、实战讲解(一)f...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python自定义函数 (53)
- python进度条 (54)
- python的for循环 (56)
- python串口编程 (60)
- python写入txt (51)
- python读取文件夹下所有文件 (59)
- java调用python脚本 (56)
- python操作mysql数据库 (66)
- python字典增加键值对 (53)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python qt (52)
- python人脸识别 (54)
- python多态 (60)
- python命令行参数 (53)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- centos7安装python (53)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)