百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python处理文件的6个常用代码,使用频率很高,值得收藏

off999 2024-09-23 11:27 34 浏览 0 评论

日常工作中,我们经常会遇到一些查找、存储文件的问题,比如文件合并、文件分解等,这些问题涉及到对文件进行操作处理。对此,Python的OS库提供了很多功能模块供使用,本文整理了其中6个使用频率很高的常用代码,基本能满足大部分需求。另外,通过对一个excel文件合并案例代码进行解析,进一步加深印象,建议收藏。

一、6个常用代码

1、得到指定文件路径:os.path.dirname(带路径文件名)

查找处理文件要调用os库,和openpyxl一样,先用import 导入。

import os

file = r'e:\python\删除最小值.xlsx'

pwd = os.path.dirname(file)

print(pwd)

运行结果为:e:\python

也可从分离文件名后的列表中提取:os.path.split(带路径文件名)[0]

2、得到当前文件名:os.path.dasename(带路径文件名)

import os

file = r'e:\python\删除最小值.xlsx'

pwdn = os.path.basename(file)

print(pwdn)

运行结果为:删除最小值.xlsx

也可从分离文件名后的列表中提取:os.path.split(带路径文件名)[1]

3、判断文件路径是否存在:os.path.exists(带路径文件名)

import os

file = r'e:\python\删除最小值.xlsx'

pwdbool = os.path.exists(file)

print(pwdbool)

运行结果为:true

若给定的路径文件不存在,则返回false

4、获得指定文件夹下所有文件:print(os.listdir(文件夹路径))

import os

pwdns = os.listdir(r'e:\python')

print(pwdns[1])

运行结果:8.py 为'e:\python'文件夹下第2个文件(或文件夹)名。

5、获得文件后缀:os.path.splitext(文件名)

import os

pdn= os.path.splitext('试验.py')

print(pdn[1])

运行结果:.py,若最后一句改为print(pdn[0]),则得到文件名。

6、拼接路径和文件名:os.path.join(路径,文件名)

f2 = os.path.join(f1, '汇总.xlsx')

运行结果:'e:\python\汇总\汇总.xlsx'

二、文件合并案例代码解析:

在下面的文件夹“e:\python\汇总”里,有2个xlsx文件和一个txt文件,要求先判断当前文件夹内是否存在“汇总.xlsx”文件,若不存在则新建一个,若存在则直接打开使用,要求将其他.xlsx文件的第1个表单数据,汇总至“汇总.xlsx”文件。

1、导入os库和openpyxl库,给定当前路径为模块参数

import os

import openpyxl

if __name__ == "__main__":

tj(r'e:\python\汇总')# 指定文件夹作为参数,**文末有提醒事项"

2、在tj模块内写代码,先判断是否存在汇总.excle文件,若无则创建

def tj(f1):

f2 = os.path.join(f1, '汇总.xlsx')# 组合文件路径,**文末有提醒事项"

bl = os.path.exists(f2)# 判断'e:\python\汇总\汇总.xlsx'是否存在,存在返回true,不存在返回false

if bl is False:

wb = openpyxl.Workbook()# 如果不存在,创建新excel文件

ws = wb.active

ws.title = "汇总"# 设置当前表单名为“汇总”

wb.save(f2)# 将刚才创建的文件保存为:'e:\python\汇总\汇总.xlsx'

wb = openpyxl.load_workbook(f2)# 打开'e:\python\汇总\汇总.xlsx'文件

ws = wb['汇总']

ks = ws.max_row# 得到汇总表单的最大行,**文末有提醒事项"

3、遍历指定文件夹,将目标.xlsx文件放入列表k备用

pns = os.listdir(f1)# 获得f1文件夹下带后缀文件名列表

k = []

for i in range(len(pns)):

hz = os.path.splitext(pns[i])[1]# 获得f1文件夹下文件名列表

qz = os.path.splitext(pns[i])[0]# 获得f1文件夹下文件后缀列表

if hz == '.xlsx' and qz != '汇总':

k.append(pns[i])# 将后缀为.xlsx,且文件名不是汇总的文件名放入K列表

5、逐个打开目标文件,将第一个表单内的数据复制粘贴在汇总表内汇总表单内

m = 0

for w in k:

f3 = os.path.join(f1, w)

wb1 = openpyxl.load_workbook(f3)

ws1 = wb1._sheets[0]# 选第一个表单,默认数据在第一个表单,也可根据表单名进行选取。

for jj in range(1, ws1.max_row):

m += 1

for j in range(2, ws1.max_column + 1):

ws.cell(ks+m, j).value = ws1.cell(jj+1, j).value

ws.cell(ks+m, 1).value = ks+m-1# 重新写序号

ws.cell(ks+m, ws1.max_column+1).value = w# 写入当前行数据的来源文件名

wb.save(f2)# 保存文件

6、运行代码完成,此时汇总文件内已经合并了其他两个文件的数据。

三、几个细节

1、tj(r'e:\python\汇总'):给定参数时,路径前面有个字母“r”,为消除转义字符功能用。

2、os.path.join(f1, w):路径和文件名组合,也可用f1+'\\'+w的方法,但只能限定于在打开文件的代码里用,单独使用会出现双“\”符号,导致地址无法使用。

3、ws1.max_row:得到表单的最大行数,当末行没有数据,只是设置过单元格格式,也被视为表单的最大行,这点不如VBA的end(3).row,需注意。

相关推荐

日志文件转运工具Filebeat笔记_日志转发工具

一、概述与简介Filebeat是一个日志文件转运工具,在服务器上以轻量级代理的形式安装客户端后,Filebeat会监控日志目录或者指定的日志文件,追踪读取这些文件(追踪文件的变化,不停的读),并将来自...

K8s 日志高效查看神器,提升运维效率10倍!

通常情况下,在部署了K8S服务之后,为了更好地监控服务的运行情况,都会接入对应的日志系统来进行检测和分析,比如常见的Filebeat+ElasticSearch+Kibana这一套组合...

如何给网站添加 https_如何给网站添加证书

一、简介相信大家都知道https是更加安全的,特别是一些网站,有https的网站更能够让用户信任访问接下来以我的个人网站五岁小孩为例子,带大家一起从0到1配置网站https本次配置的...

10个Linux文件内容查看命令的实用示例

Linux文件内容查看命令30个实用示例详细介绍了10个Linux文件内容查看命令的30个实用示例,涵盖了从基本文本查看、分页浏览到二进制文件分析的各个方面。掌握这些命令帮助您:高效查看各种文本文件内...

第13章 工程化实践_第13章 工程化实践课

13.1ESLint+Prettier代码规范统一代码风格配置//.eslintrc.jsmodule.exports={root:true,env:{node...

龙建股份:工程项目中标_龙建股份有限公司招聘网

404NotFoundnginx/1.6.1【公告简述】2016年9月8日公告,公司于2016年9月6日收到苏丹共和国(简称“北苏丹”)喀土穆州基础设施与运输部公路、桥梁和排水公司出具的中标通知书...

福田汽车:获得政府补助_福田 补贴

404NotFoundnginx/1.6.1【公告简述】2016年9月1日公告,自2016年8月17日至今,公司共收到产业发展补助、支持资金等与收益相关的政府补助4笔,共计5429.08万元(不含...

翰宇药业:获得发明专利_翰宇药业创新产业

404NotFoundnginx/1.6.1【公告简述】2016年9月2日公告,申请的一项发明专利获得中华人民共和国国家知识产权局颁发的发明专利证书,公司于2016年9月1日取得了该专利证书,该专...

川金诺:取得发明专利证书_川金诺(300505)

404NotFoundnginx/1.6.1【公告简述】2016年9月1日公告,近日,公司申请的一项发明专利获得国家知识产权局颁发的发明专利证书:一种提高和稳定湿法磷酸中和脱氟浓度方法。本发明是稀...

使用WTM框架创建博客系统后台并在云服务器发布

阅读导航关于lqclass.com博客后台前后端部署2.1已部署访问链接2.2nginx部署2.2.1后台后端发布2.2.2后台前端发布2.2.3云服务器部署下次分享1.关于lqcl...

Nginx的location匹配规则,90%的人都没完全搞懂,一张图让你秒懂

为什么你的Nginx配置总是不生效?改了Nginx配置无数次,reload命令执行了几十遍,浏览器访问时却依然返回404?运维工程师小张上周就遇到了这个问题:明明配置了location/static...

全网最新的Dify(1.7.2)私有化离线部署教程(ARM架构)

Hello,大家好!近期工作中有涉及到Dify私有化离线部署,特别是针对于一些国产设备。因此特别整理了该教程,实测有效!有需要的小伙伴可以参考下!本文主要针对Dify1.7.2最新版本+国产操作系...

如何使用 Certbot 为域名配置永久免费的 HTTPS 证书

本文手把手教你如何在Linux上使用Certbot配置HTTPS,包括安装Certbot、修改Nginx配置、设置server_name、申请证书及证书续期。文章内容C一.安装...

docker run 中 --name 参数介绍_docker run -itd --name

在Docker中,--name是dockerrun命令的一个重要参数,用于为新创建的容器指定一个唯一的自定义名称。以下是详细介绍和使用场景:一、--name的功能与语法作用:为容器分配一个...

403 Forbidden:无权限访问请求的资源如何处理

403Forbidden错误表示客户端(如浏览器或应用)已成功连接服务器,但服务器拒绝了该请求。这通常是由于用户或请求没有足够的权限访问目标资源。以下是常见的可能原因和解决方法:1.常见原因1....

取消回复欢迎 发表评论: