百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python文件读写技巧(python的文件读写)

off999 2024-10-02 18:47 37 浏览 0 评论

一、Python绝对路径和相对路径

明确一个文件所在的路径,有 2 种表示方式,分别是:

绝对路径:总是从根文件夹开始,Window 系统中以盘符(C:、D:)作为根文件夹,而 OS X 或者 Linux 系统中以 / 作为根文件夹。

相对路径:指的是文件相对于当前工作目录所在的位置。例如,当前工作目录为 "C:\Windows\System32",若文件demo.txt 就位于这个System32 文件夹下,则 demo.txt 的相对路径表示为 ".\demo.txt"(其中 .\ 就表示当前所在目录)

os 模块

Python中使用os模块来文件名称或文件路径:

import os

# 获取当前文件名称
print(os.path.basename(os.path.abspath(__file__)))  
# 21_1_os_path.py

# 获取当前文件的绝对路径
print(__file__)  
# C:/auto_test/common_auto_test_frame/demo/python_base/21_1_os_path.py
print(os.path.abspath(__file__))  
# C:\auto_test\common_auto_test_frame\demo\python_base\21_1_os_path.py

# 获取当前文件所在目录,以下两个方法均可
print(os.path.abspath("."))  
# C:\auto_test\common_auto_test_frame\demo\python_base
print(os.path.dirname(os.path.abspath(__file__)))  
# C:\auto_test\common_auto_test_frame\demo\python_base

二、Python读取文件

Python 中,对文件的操作有很多种,常见的操作包括创建、删除、修改权限、读取、写入等,这些操作可大致分为以下 2 类:

? 删除、修改权限:作用于文件本身,属于系统级操作。

? 写入、读取:是文件最常用的操作,作用于文件的内容,属于应用级操作。

文件的应用级操作可以分为以下 3 步,每一步都需要借助对应的函数实现:

  1. 打开文件:使用 open() 函数,该函数会返回一个文件对象;
  2. 对已打开文件做读/写操作:读取文件内容可使用 read()、readline() 以及 readlines() 函数;向文件中写入内容,可以使用write() 函数。
  3. 关闭文件:完成对文件的读/写操作之后,最后需要关闭文件,可以使用 close() 函数。

1.open()函数详解

  • r:只读模式
  • b:以二进制格式
  • w:只写模式
  • a:追加模式
  • +:写模式

模式

意义

注意事项

r

只读模式打开文件,读文件内容的指针会放在文件的开头。


rb

以二进制格式、采用只读模式打开文件,读文件内容的指针位于文件的开头,一般用于非文本文件,如图片文件、音频文件等


r+

打开文件后,既可以从头读取文件内容,也可以从开头向文件中写入新的内容,写入的新内容会覆盖文件中等长度的原有内容

操作的文件必须存在

rb+

以二进制格式、采用读写模式打开文件,读写文件的指针会放在文件的开头,通常针对非文本文件(如音频文件)


w

以只写模式打开文件,若该文件存在,打开时会清空文件中原有的内容


wb

以二进制格式、只写模式打开文件,一般用于非文本文件(如音频文件)

若文件存在,会清空其原有内容(覆 盖文件);反之,则创建新文件

w+

打开文件后,会对原有内容进行清空,并对该文件有读写权限


wb+

以二进制格式、读写模式打开文件,一般用于非文本文件


a

以追加模式打开一个文件,对文件只有写入权限,如果文件已经存在,文件指针将放在文件的末尾(即新写入内容会位于已有内容之后);反之,则会创建新文件


ab

以二进制格式打开文件,并采用追加模式,对文件只有写权限。如果该文件已存在,文件指针位于文件末尾(新写入文件会位于已有内容之后);反之,则创建新文件


a+

以读写模式打开文件;如果文件存在,文件指针放在文件的末尾(新写入文件会位于已有内容之后),反之,则创建新文件


ab+

以二进制模式打开文件,并采用追加模式,对文件具有读写权限,如果文件存在,则文件指针位于文件的末尾(新写入文件会位于已有内容之后);反之,则创建新文件


open() 函数用于创建或打开指定文件,该函数的常用语法格式如下:

file = open(file_name [, mode='r' [ , buffering=-1 [ , encoding = None ]]])

此格式中,用 [] 括起来的部分为可选参数。其中,常用参数所代表的含义如下:

  • file:表示要创建的文件对象。
  • file_name:要创建或打开文件的文件名称,该名称要用引号(单引号或双引号都可以)括起来。
  • mode:可选参数,用于指定文件的打开模式。如果不写,则默认以只读(r)模式打开文件。
  • encoding:手动设定打开文件时所使用的编码格式,不同平台的 ecoding 参数值也不同,以 Windows 为例,其默认为 cp936(实际上就是 GBK 编码)。

open 函数支持的文件打开模式:

2.read()函数:按字节(字符)读取文件

Python 提供了如下 3 种函数,它们都可以帮我们实现读取文件中数据的操作:

◆ read() 函数:逐个字节或者字符读取文件中的内容;

◆ readline() 函数:逐行读取文件中的内容;

◆ readlines() 函数:一次性读取文件中多行内容。

1)Python read()函数

read() 函数的基本语法格式如下:

file.read([size])

其中,file 表示已打开的文件对象;size 作为一个可选参数,用于指定一次最多可读取的字符(字节)个数,如果省略,则默认一次性读取所有内容。

2)read()函数抛出UnicodeDecodeError异常的解决方法

在使用 read() 函数时,如果 Python 解释器提示UnicodeDecodeError异常或者显示为乱码,其原因在于,目标文件使用的编码格式和 open() 函数打开该文件时使用的编码格式不匹配。

file = "read.txt"
f1 = open(file, encoding='utf-8')  # 解码方式必须与文件编码方式一直,否则会报UnicodeDecodeError异常
print(f1.read())  # 读取所有内容
f1.close()
f2 = open(file, encoding='utf-8')
print(f2.read(5))  # 读取前5个字符
f2.close()

3.readline()和readlines()函数:按行读取文件

和 read() 函数不同,这 2 个函数都以“行”作为读取单位,即每次都读取目标文件中的一行。对于读取以文本格式打开的文件,读取一行很好理解;对于读取以二进制格式打开的文件,它们会以“\n”作为读取一行的标志。

1)Python readline()函数

readline() 函数用于读取文件中的一行,包含最后的换行符“\n”。此函数的基本语法格式为:

file.readline([size])

其中,file 为打开的文件对象;size 为可选参数,用于指定读取每一行时,一次最多读取的字符(字节)数。

# python readline()逐行读取,返回str类型
f3 = open(file, encoding='utf-8')
print(f3.readline())  # 读取第一行
print(f3.readline())  # 读取第二行
f3.close()

2)Python readlines()函数

readlines() 函数用于读取文件中的所有行,它和调用不指定 size 参数的 read() 函数类似,只不过该函数返回是一个字符串列表,其中每个元素为文件中的一行内容。

readlines() 函数的基本语法格式如下:

file.readlines()

其中,file 为打开的文件对象。和 read()、readline() 函数一样,它要求打开文件的模式必须为可读模式(包括 r、rb、r+、rb+ 4 种)。

# python readlines()读取所有行,返回list类型
f4 = open(file, encoding='utf-8')
print(f4.readlines())  
# ['hello python\n', 'hello java\n', 'hello django\n', 'hello go\n', 'hello ruby\n', '爱我中华\n']
f4.close()
f5 = open(file, encoding='utf-8')
for i in f5:
    print(i)  # readlines返回列表类型,使用for循环遍历列表内容
f5.close()

4.读取大文件(GB)

Python读取文件一般是利用open()函数以及read()函数来完成,但该方式仅适合读取小文件。因为调用read()会一次性读取文件的全部内容,调用readlines()一次读取所有内容并按行返回list。如果文件过大,如10G,会造成MemoryError 内存溢出,正确的做法:可以反复调用read(size)法,每次指定读取size个字节的内容。

处理大文件核心思路:通过参数指定每次读取的大小长度,这样就避免了因为文件太大读取出问题。

# 读取大文件
def read_in_chunks(file_path, chunk_size=1024 * 1024):
    """读取大文件,读取指定大小"""
    file_object = open(file_path)
    while True:
        chunk_data = file_object.read(chunk_size)
        if not chunk_data:
            break
        yield chunk_data
        
def read_in_chunk(file_path):
    """结合生成器、读取大文件"""
    lines = (line for line in open(file_path))
    while True:
        for line in lines:
            print(line)
            if not line:
                break
            yield line

5.seek()和tell()函数详解

实现对文件指针的移动,文件对象提供了 tell() 函数和 seek() 函数。tell() 函数用于判断文件指针当前所处的位置,而seek() 函数用于移动文件指针到文件的指定位置。

1)tell() 函数-获取指针位置

tell() 函数的用法很简单,其基本语法格式如下:

file.tell()

# tell()函数获取文件指针位置
f = open(file='read.txt', encoding='utf-8')
f.read(5)
print(f.tell())  # 指针位置为5
f.read(5)
print(f.tell())  # 指针位置为10
f.close()

2)seek()函数-设置指针位置

seek() 函数用于将文件指针移动至指定位置,该函数的语法格式如下:

file.seek(offset[, whence])

参数释义:

  • offset:偏移量
  • whence:指针所在位置,默认为0-开头位置,1表示当前位置,2表示文件尾
# seek()函数设置文件指针位置
f1 = open(file='read.txt', encoding='utf-8')
f1.read(5)
print(f1.tell())  # 指针位置为5
f1.seek(9)  # 设置指针位置为9
print(f1.tell())  # 指针位置为9
f1.close()

6.使用with...as...语法读写文件

在 Python 中,使用 with...as... 语句操作上下文管理器(context manager),它能够帮助我们自动分配并且释放资源。

with as 语句示例:

# with...as...上下文管理器
# with...as...能够自动释放资源,无需手动关闭
with open('read.txt', encoding='utf-8') as f:
    print(f.read())

由于with...as...语句自带资源调度能力,所以上面的读取大文件也可以使用with...as...语句来实现:

def read_book(file_path):
    """读取大文件,逐行读取"""
    with open(file_path, encoding='utf-8') as file_object:
        while True:
            chunk_data = file_object.readlines()
            for chunk in chunk_data:
                print(chunk)
                if not chunk_data:
                    break
                time.sleep(1)

7.fileinput模块:逐行读取多个文件

Python 提供了 fileinput 模块,通过该模块中的 input() 函数,我们能同时打开指定的多个文件,还可以逐个读取这些文件中的内容。

fileinput 模块中 input() 该函数的语法格式如下:

fileinput.input(files="filename1, filename2, ...", inplace=False, backup='', bufsize=0, mode='r', openhook=None)

其中,各个参数的含义如下:

  • files:多个文件的路径列表;
  • inplace:用于指定是否将标准输出的结果写回到文件,此参数默认值为 False;
  • backup:用于指定备份文件的扩展名;
  • bufsize:指定缓冲区的大小,默认为 0;
  • mode:打开文件的格式,默认为 r(只读格式);
  • openhook:控制文件的打开方式,例如编码格式等。
import fileinput

# 同时读取多个文件
for line in fileinput.input(files=('read.txt', 'write.txt'), openhook=fileinput.hook_encoded('utf-8')):
    print(line, end="\n")
fileinput.close()

# 替换指定内容,并备份
# 注:openhook=fileinput.hook_encoded('utf-8')指定编码方式
# inplace=True不能和openhook参数同时使用,否则会报错
for content in fileinput.input(files='read.txt', backup='.bak', inplace=True):
    print(content.replace('hello', 'HELLO'))
fileinput.close()

8.linecache模块:读取文件指定行

除了可以借助 fileinput 模块实现读取文件外,Python 还提供了 linecache 模块。和前者不同,linecache 模块擅长读取指定文件中的指定行。换句话说,如果我们想读取某个文件中指定行包含的数据,就可以使用 linecache 模块。 示例:

import linecache
import string
# linecache()读取指定行
print(linecache.getline(string.__file__, 3))  # 读取string文件的第三行
for line in linecache.getlines('read.txt'):  # 读取文件的所有行,返回结果为一个列表
    print(line)

三、Python写入文件

1.Python write()函数

Python 中的文件对象提供了 write() 函数,可以向文件中写入指定内容。该函数的语法格式:

file.write(string)

其中:

  • file 表示已经打开的文件对象;
  • string 表示要写入的字符串(或字节,仅适用写入二进制文件)。
# write()方法写入文件
f = open('write.txt', 'w')
f.write("hello world 1\n")
f.write("hello world 2\n")
f.write("hello world 3\n")
f.close()

2.Python writelines()函数

Python 的文件对象中,不仅提供了 write() 函数,还提供了 writelines() 函数,可以实现将字符串列表写入文件中。

# write()方法批量写入文件
f_w = open('write.txt', 'w+', encoding='utf-8')
f_r = open("E:/很纯很暧昧.txt", encoding='utf-8')
book = f_r.read(100)
f_w.writelines(book)
f_w.close()

总结

Python绝对路径和相对路径:

◆ 借助os模块获取文件名称、当前文件路径、当前目录的上一层目录

Python读取文件:

◆ read() 函数:逐个字节或者字符读取文件中的内容;

◆ readline() 函数:逐行读取文件中的内容;

◆ readlines() 函数:一次性读取文件中多行内容;

◆ fileinput模块:逐行读取多个文件;

◆ linecache模块:读取文件指定行;

◆ 读取大文件:可以借助with...as...上下文管理器;

Python写入文件:

◆ write()函数:写入指定字符串(或字节,仅适用写入二进制文件);

◆ writelines()函数:可以实现将字符串列表批量写入文件;

相关推荐

电脑uac是什么意思

UAC就是用户帐户控制,在对计算机进行更改之前,用户帐户控制(UAC)会通知您。比如安装软件驱动什么的,默认UAC设置会在程序尝试对计算机进行更改时通知您,但您可以通过调整设置来控制UAC...

笔记本找不到自己家的wifi怎么办

1.笔记本电脑缺少无线网卡驱动,需要下载驱动如果笔记本电脑开机之后,无法显示WiFi网络的图标,这个时候多半是因为电脑缺少无线网卡驱动造成的,有时候自己在清理电脑的时候,不小心清理了驱动程序,便会...

电信宽带办理电话是多少(电信宽带办理联系电话)

电信宽带不一定需要电信手机号码,可以根据自身需要选择,有单独的宽带业务,一般要求预存一定时间的使用费。不过一般包含了宽带、手机号码的融合套餐总体上更优惠,对客户来说更划算。如果有相应需求的话,建议同时...

开机进入ghost启动项(电脑启动进入ghost)

电脑启动的时候进入GHOST界面方法:  1、首先确认电脑装了GHOST软件。  2、重启电脑,注意仔细观察电脑屏幕,会有一个3s或者10s的选择界面。让选择是进入GHOST界面,或者正常启动进入系...

华硕bios修复蓝屏图解(华硕bios修复蓝屏视频教程)

先看下BIOS是否可以识别到硬盘设备,若看不到,硬盘故障的可能性很大。若可以看到硬盘,建议先尝试进行BIOS兼容性设置:1,在BIOS界面,通过方向键进【Secure】菜单,通过方向键选择【Sec...

老电脑怎么装win7系统(老电脑装win7系统可以吗)

6年前的电脑,如果是用的当时最新的CPU的话,应该是第7代或者第6代酷睿等级的。运行windows7和windows10都应该没有压力。从软件的兼容性来说,还是建议安装windows10,因为现在有好...

电脑怎么设置到点自动关机(电脑怎样设置到点关机)

1、首先我们点击电脑屏幕左下角的开始按钮,在所有程序里依次选择附件---系统工具,接着打开任务计划程序。2、我们打开任务计划程序后,在最右边的操作框里选择创建基本任务,然后在创建基本任务对话框的名称一...

2025年笔记本电脑排行榜(20201年笔记本电脑推荐)

2023华为笔记本电脑matebook16系列很好用的。因为这个系列她是有非常好的性价,比的是能够让你有非常轻薄的厚度,并且能够有11.6寸的屏幕,而且还有120赫兹的刷新率作为大学生,您可能需要经常...

powerpoint激活密钥(ppt密钥 激活码2010)

1/4进入文件打开一个PPT文件进入到软件界面,在界面左上方找到文件选项,点击该选项进入到文件页面。2/4点击账户文件页面中,页面左侧找到账户选项,点击该选项,页面右侧会出现相应的操作选择。3/4点击...

水星usb无线网卡驱动下载(水星usb无线网卡驱动下载安装)
  • 水星usb无线网卡驱动下载(水星usb无线网卡驱动下载安装)
  • 水星usb无线网卡驱动下载(水星usb无线网卡驱动下载安装)
  • 水星usb无线网卡驱动下载(水星usb无线网卡驱动下载安装)
  • 水星usb无线网卡驱动下载(水星usb无线网卡驱动下载安装)
qq恢复删除好友官网(qq恢复已删好友)
qq恢复删除好友官网(qq恢复已删好友)

qq恢复官方网站,http://huifu.qq.com/1、什么是QQ恢复系统?QQ恢复系统是腾讯公司提供的一项找回QQ联系人、QQ群的服务,向所有QQ用户免费开放。2、QQ恢复系统能恢复多长时间内删除的好友?普通用户可以申请恢复3个月内...

2025-12-28 16:03 off999

优启通u盘重装win7系统教程(优启通u盘装win7系统教程图解)

系统显示未找到万能驱动的解决方法是:1、重插下usb口1、造成“找不到驱动器设备驱动程序”的原因,可能是usb口出现问题。2、换个usb口可能是单独这个usb口出现问题,可以选择另外的usb口重试wi...

笔记本mac地址在哪看(笔记本电脑mac地址怎么查询)
  • 笔记本mac地址在哪看(笔记本电脑mac地址怎么查询)
  • 笔记本mac地址在哪看(笔记本电脑mac地址怎么查询)
  • 笔记本mac地址在哪看(笔记本电脑mac地址怎么查询)
  • 笔记本mac地址在哪看(笔记本电脑mac地址怎么查询)
wifi加密方式怎么设置(wifi网络加密怎么设置)

若你想将自己的无线网改成加密的,可以按照以下步骤操作:1.打开你的路由器管理界面。一般来说,在浏览器地址栏输入“192.168.1.1”或“192.168.0.1”,然后输入用户名和密码登录就可以打...

sql数据库自学(数据库入门必看——《sql基础教程》)

SQLServer数据库基础知识:1.数据库是由数据组成的,这些数据可以被组织成有序的数据结构,以支持特定的应用程序。2.数据库管理系统(DBMS)是一种软件工具,用于创建、管理和操作数据库。...

取消回复欢迎 发表评论: