百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python之文件操作(python文件操作的方法)

off999 2024-10-14 12:15 30 浏览 0 评论

12.1 open()

open()函数作用是打开文件,返回一个文件对象。

用法格式:open(name[, mode[, buffering[,encoding]]]) -> file object

name 文件名

mode 模式,比如以只读方式打开

buffering 缓冲区

encoding 返回数据采用的什么编码,一般utf8或gbk

Mode

Description

r

只读,默认

w

只写,打开前清空文件内容

a

追加

a+

读写,写到文件末尾

w+

可读写,清空文件内容

r+

可读写,能写到文件任何位置

rb

二进制模式读

wb

二进制模式写,清空文件内容

例如:打开一个文件

>>> f = open('test.txt', 'r')

>>> f.

f.__class__( f.__new__( f.encoding f.readinto(

f.__delattr__( f.__reduce__( f.errors f.readline(

f.__doc__ f.__reduce_ex__( f.fileno( f.readlines(

f.__enter__( f.__repr__( f.flush( f.seek(

f.__exit__( f.__setattr__( f.isatty( f.softspace

f.__format__( f.__sizeof__( f.mode f.tell(

f.__getattribute__( f.__str__( f.name f.truncate(

f.__hash__( f.__subclasshook__( f.newlines f.write(

f.__init__( f.close( f.next( f.writelines(

f.__iter__( f.closed f.read( f.xreadlines(

open()函数打开文件返回一个文件对象,并赋予遍历f,f就拥有了这个文件对象的操作方法。

方法

描述

f.read([size])

读取size字节,当未指定或给负值时,读取剩余所有的字节,作为字符串返回

f.readline([size])

从文件中读取下一行,作为字符串返回。如果指定size则返回size字节

f.readlines([size])

读取size字节,当未指定或给负值时,读取剩余所有的字节,作为列表返回

f.write(str)

写字符串到文件

f.writelines(seq)

写序列到文件,seq必须是一个可迭代对象,而且要是一个字符串序列

f.seek(offset[, whence=0])

在文件中移动文件指针,从whence(0代表文件起始位置,默认。1代表当前位置。2代表文件末尾)偏移offset个字节

f.tell()

返回当前在文件中的位置

f.close()

关闭文件

f.flush

刷新缓冲区到磁盘

博客地址:http://lizhenliang.blog.51cto.com and https://yq.aliyun.com/u/lizhenliang

QQ群:323779636(Shell/Python运维开发群)

12.2 文件对象操作

写一个测试文件test.txt举例:

# cat test.txt

1.Python

2.Java

3.C++

4.Ruby

12.2.1 read()读取所有内容

>>> f = open('test.txt', 'r')

>>> f.read()

'1.Python\n2.Java\n3.C++\n4.Ruby\n'

# 获取指定字节

指定读取多少字节:

>>> f = open('test.txt', 'r')

>>> f.read(9)

'1.Python\n'

12.2.2 readline()读取下一行内容

>>> f = open('test.txt', 'r')

>>> f.readline()

'1.Python\n'

>>> f.readline()

'2.Java\n'

12.2.3 readlines()读取所有内容返回一个列表

>>> f = open('test.txt', 'r')

>>> f.readlines()

['1.Python\n', '2.Java\n', '3.C++\n', '4.Ruby\n']

12.2.4 wirte()写入字符串到文件

>>> f = open('test.txt', 'a') # 以追加方式打开文件

>>> f.write("5.Shell\n") # 这一步并没有真正写到文件

>>> f.flush() # 刷新到磁盘才写到文件

# cat test.txt

1.Python

2.Java

3.C++

4.Ruby

5.Shell

12.2.5 wirtelines()写入一个序列字符串到文件

>>> f = open('test.txt', 'a')

>>> f.writelines(['a','b','c'])

>>> f.flush()

# cat test.txt

1.Python

2.Java

3.C++

4.Ruby

5.Shell

abc

12.2.6 seek()从指定位置读取

>>> f = open('test.txt', 'r')

>>> f.tell()

0

>>> f.seek(9)

>>> f.tell()

9

>>> f.seek(5,1) # 1表示从当前位置开始

>>> f.tell()

14

12.2.7 tell()返回当前指针位置

>>> f = open('test.txt', 'r')

>>> f.tell()

0

>>> f.readline()

'1.Python\n'

>>> f.tell()

9

>>> f.readline()

'2.Java\n'

>>> f.tell()

16

>>> f.close() # 使用完后关闭文件

12.3 文件对象增删改查

在shell中,我们要想对文件指定行插入内容、替换等情况,使用sed工具很容易就实现。在本章节讲的open()函数并没有直接类似与sed工具的方法,要想实现这样的操作,变通的处理能到达此效果,主要思路是先读取内容修改,再写会文件,以下举几个常用的情况 。

12.3.1 在第一行增加一行

例如:在开头添加一个test字符串

#!/usr/bin/python

# -*- coding: utf-8 -*-

f = open('test.txt', 'r')

data = f.read()

data = "test\n" + data

f = open('test.txt', 'w')

f.write(data)

f.flush()

f.close()

# python test.py

# cat test.txt

test

1.Python

2.Java

3.C++

4.Ruby

先将数据读出来,然后把要添加的test字符串拼接到原有的数据,然后在写入这个文件。

12.3.2 在指定行添加一行

例如:在第二行添加一个test字符串

#!/usr/bin/python

# -*- coding: utf-8 -*-

f = open('test.txt', 'r')

data_list = f.readlines() # 经测试,此方法比下面迭代效率高

# data_list = []

# for line in f:

# data_list.append(line)

data_list.insert(1, 'test\n')

# data = ''.join(data)

f = open('test.txt', 'w')

# f.write(data)

f.writelines(data_list)

f.flush()

f.close

# python test.py

# cat test.txt

1.Python

test

2.Java

3.C++

4.Ruby

先将数据以列表存储,就可以根据下标插入到指定位置,也就是哪一行了。再通过join把列表拼接成字符串,最后写到文件。

12.3.3 在匹配行前一行或后一行添加test字符串

#!/usr/bin/python

# -*- coding: utf-8 -*-

f = open('test.txt', 'r')

data_list = f.readlines()

data_list.insert(2-1, 'test\n') # 在指定行减去一行就是上一行了,下一行插入同理

f = open('test.txt', 'w')

f.writelines(data_list)

f.flush()

f.close

12.3.4 删除指定行

例如:删除第三行,与在指定行添加同理

#!/usr/bin/python

# -*- coding: utf-8 -*-

f = open('test.txt', 'r')

data_list = f.readlines()

data_list.pop(2)

f = open('test.txt', 'w')

f.writelines(data_list)

f.flush()

f.close

例如:只保留第一行至第三行

#!/usr/bin/python

# -*- coding: utf-8 -*-

f = open('test.txt', 'r')

data_list = f.readlines()[0:2] # 列表切片

f = open('test.txt', 'w')

f.write(data_list)

f.flush()

f.close

12.3.5 删除匹配行

例如:删除匹配Py字符的行

#!/usr/bin/python

# -*- coding: utf-8 -*-

f = open('test.txt', 'r')

data = f.readlines()

# data_list = []

# for line in data:

# if line.find('Py') == -1: # 如果当前行不包含Py字符,会返回-1,否则返回下标

# data_list.append(line)

data_list = [line for line in data if line.find('Py') == -1]

f = open('test.txt', 'w')

f.writelines(data_list)

f.flush()

f.close

12.3.6 全局替换字符串

#!/usr/bin/python

# -*- coding: utf-8 -*-

f = open('test.txt', 'r')

data = f.read()

data.replace('old string', 'new string')

f = open('test.txt', 'w')

f.write(data)

f.flush()

f.close

12.3.7 在指定行替换字符串

例如:将C++改为C#

#!/usr/bin/python

# -*- coding: utf-8 -*-

f = open('test.txt', 'r')

data = f.readlines()

data_list = []

for line in data:

if data.index(line) == 2:

data_list.append(line.replace('++', '#'))

else:

data_list.append(line)

f = open('test.txt', 'w')

f.writelines(data_list)

f.flush()

f.close

12.3.8 处理大文件

在读取上G文件时,直接读取所有内容会导致内存占用过多,内存爆掉。要想提高处理效率,有以下两种方法:

方法1:open()打开文件返回的对象本身就是可迭代的,利用for循环迭代可提高处理性能

>>> f = open('test.txt')

>>> for line in f:

... print line # 每行后面会有一个换行符\n,所以会打印出来换行符,可以使用line.strip('\n')去除

...

1.Python

2.Java

3.C++

4.Ruby

方法2:每次只读取固定字节

#!/usr/bin/python

# -*- coding: utf-8 -*-

f = open('test.txt')

while True:

data = f.read(1024) # 每次只读取1024字节

if not data: break

12.3.9 下载文件

方法1:

import urllib

url = "http://nginx.org/download/nginx-1.10.1.tar.gz"

urllib.urlretrieve(url, "nginx-1.10.1.tar.gz")

方法2:

import urllib2

url = "http://nginx.org/download/nginx-1.10.1.tar.gz"

f = urllib2.urlopen(url).read()

with open("nginx-1.10.1.tar.gz", "wb") as data:

data.write(f)

12.4 fileinput

fileinput模块是Python内建模块,用于遍历文件,可对多文件操作。

方法

描述

fileinput.input([files[, inplace[, backup[, mode[, openhook]]]]])

files:文件路径,多文件这样写['1.txt,'2.txt'']

inplace:是否将标准输出写到原文件,默认是0,不写

backup:备份文件扩展名,比如.bak

mode:读写模式,默认r,只读

openhook:

fileinput.isfirstline()

检查当前行是否是文件的第一行 fileinput.lineno()

返回当前已经读取行的数量

fileinput.fileno()

返回当前文件数量

fileinput.filelineno()

返回当前读取行的行号

fileinput.filename()

返回当前文件名

12.4.1 遍历文件内容

#!/usr/bin/python

# -*- coding: utf-8 -*-

import fileinput

for line in fileinput.input('test.txt'):

print line

# python test.py

1.Python

2.Java

3.C++

4.Ruby

12.4.2 返回当前读取行的行号

#!/usr/bin/python

# -*- coding: utf-8 -*-

import fileinput

for line in fileinput.input('test.txt'):

print fileinput.filelineno()

print line, # 逗号忽略换行符

# python test.py

1

1.Python

2

2.Java

3

3.C++

4

4.Ruby

12.4.3 全局替换字符,修改原文件

#!/usr/bin/python

# -*- coding: utf-8 -*-

import fileinput

for line in fileinput.input('test.txt', backup='.bak', inplace=1):

line = line.replace('++','#')

print line,

先把要操作的文件备份一个以.bak的后缀文件,inplace=1是将标准输出写到原文件,也就是这个脚本如果没有标准输出,就会以空数据写到原文件。

12.4.4 对多文件操作

#!/usr/bin/python

# -*- coding: utf-8 -*-

import fileinput

for line in fileinput.input(['test.txt', 'test2.txt']):

print line,

12.4.5 实时读取文件新增内容,类似tail -f

#!/usr/bin/python

# -*- coding: utf-8 -*-

with open('access.log') as f:

f.seek(0,2) # 每次打开文件都将文件指针移动到末尾

while True:

line = f.readline()

if line:

print line,

这个死循环会一直执行下面的操作。很消耗性能。

我们可以加个休眠,每秒读取一次:

#!/usr/bin/python

# -*- coding: utf-8 -*-

import time

with open('access.log') as f:

f.seek(0,2)

while True:

line = f.readline()

if line:

print line,

else:

time.sleep(1)

12.5 shutil

shutil模块是Python内建模块,用于文件或目录拷贝,归档。

方法

描述

shutil.copyfile(src, dst)

复制文件

shutil.copytree(src, dst)

复制文件或目录

shutil.move(src, dst)

移动文件或目录

shutil.rmtree(path,ignore_errors=False, onerror=None)

递归删除目录。os.rmdir()不能删除有文件的目录,就可以用这个了

shutil.make_archive(base_name, format, root_dir=None, base_dir=None, verbose=0, dry_run=0, owner=None, group=None, logger=None)

Python2.7以后才有这个方法。

功能是创建zip或tar归档文件。

base_name:要创建归档文件名

format:归档文件格式,有zip、tar、bztar、gztar

root_dir:要压缩的目录

base_dir:?

用法:shutil.make_archive('wp','zip','/root/wordpress')

12.6 with语句

在处理一些事务时,可能会出现异常和后续的清理工作,比如读取失败,关闭文件等。这就用到了异常处理语句try...except,如下:

#!/usr/bin/python

# -*- coding: utf-8 -*-

f = open('test.txt')

try:

data = f.read()

finally:

f.close()

Python对于这种情况提供了一种更简单的处理方式,with语句。处理一个文件时,先获取一个文件句柄,再从文件中读取数据,最后关闭文件句柄。如下:

#!/usr/bin/python

# -*- coding: utf-8 -*-

with open('test.txt') as f:

data = f.read()

相关推荐

戴尔官网保修查询入口(戴尔售后保质期查询)

可以按照以下步骤查询戴尔笔记本电脑的保修期:1.打开戴尔官网:https://www.戴尔.com/zh-cn/售后服务/保修政策.html2.点击页面上方的“服务与支持”按钮,进入戴尔的服务支持...

手机号邮箱登录入口(手机号邮箱官网)

手机163邮箱登录入口如下:163邮箱官网入口:https://smart.mail.163.com/login.htm点击进入登录或者注册邮箱即可。手机浏览器访问进入官网http://www.123...

sd卡(sd卡无法读取怎么修复)

  SD卡是大卡,相机用的;普通的手机内存卡,是小卡,正规的名称是macrosd卡,也就是微型SD卡。可以通过卡套转为普通的SD卡的大小。  其实就是大小不同。但手机上的内存卡,人们经常也俗称为SD...

路由器连接图(网络路由器连接图)
  • 路由器连接图(网络路由器连接图)
  • 路由器连接图(网络路由器连接图)
  • 路由器连接图(网络路由器连接图)
  • 路由器连接图(网络路由器连接图)
windows7蓝牙功能在哪里打开

点击搜索框在windows7系统主界面点击开始菜单,点击打开搜索框。输入命令输入services.msc后回车,在列表中找到并右击BluetoothSupportS...点击属性选择进入属性菜单,...

2010激活密钥(microsoft2010激活密钥)
2010激活密钥(microsoft2010激活密钥)

步骤/方式1officeprofessionalplus2010:(office专业版)6QFdx-pYH2G-ppYFd-C7RJM-BBKQ8Bdd3G-xM7FB-Bd2HM-YK63V-VQFdKVYBBJ-TRJpB-QFQ...

2025-11-19 04:03 off999

联想官方刷新bios工具(联想电脑刷新bios)

刷新BIOS需要使用联想的官方网站或授权维修中心来进行操作。以下是一些基本步骤:1.访问联想的官方网站,找到BIOS更新程序并下载。在下载过程中,请确保选择与您计算机型号匹配的版本。2.将下载的B...

苹果ios14系统下载(苹果ios14.1下载)
苹果ios14系统下载(苹果ios14.1下载)

1方法一步骤/方式一打开Appstore。步骤/方式二在搜索栏点击搜索框。步骤/方式三搜索并点击需要下载的软件。步骤/方式四点击获取。步骤/方式五最后验证ID密码即可。1.在应用商店搜索你要下载的应用名称。2.点击下载按钮,如果要求登...

2025-11-19 03:03 off999

office2010怎么免费永久激活密钥

用这个试试,一个KMS激活工具可以激活2010到2019的Office自家的目前用的就是这个microsoft6477.moe/1716.html直接使用这个Microsoftoffice2010...

类似爱加速的国内ip(类似爱加速的app)
类似爱加速的国内ip(类似爱加速的app)

推荐“V8盒子”。这一款免费无广告的模拟器,不同于其它软件盒子,而是类似于X8沙箱,满足游戏多开,画中画,悬浮球操作,熄屏后台运行等多功能的沙箱盒子.支持一键root,一键安装xposed框架,能在安卓/苹果手机上运行多个安卓/ios虚拟系...

2025-11-19 02:03 off999

阿里旺旺手机客户端(阿里旺旺手机app)

手机淘宝的旺旺在打开商品后,会看到左下角有个旺旺的图标,点击就可以联系了。  阿里旺旺是将原先的淘宝旺旺与阿里巴巴贸易通整合在一起的一个新品牌。它是淘宝和阿里巴巴为商人量身定做的免费网上商务沟通软件,...

最纯净的pe装机工具(pe工具哪个纯净)

U盘装系统步骤:1.制作U盘启动盘。这里推荐大白菜U盘启动盘制作工具,在网上一搜便是。2.U盘启动盘做好了,我们还需要一个GHOST文件,可以从网上下载一个ghost版的XP/WIN7/WIN8系统,...

装一个erp系统多少钱(wms仓库管理软件)

现在主流有客户端ERP和云端ERP两种客户端通常一次买断,价格在万元左右,但是还有隐性费用,你需要支付服务器、数据管理员,此外如果系统需要更新维护,你还需要支付另外一笔不菲的费用。云端ERP:优势...

cad2014序列号和密钥永久(autocad2014序列号和密钥)

1在cad2014中修改标注样式后,需要将其保存2单击“样式管理器”按钮,在弹出的窗口中选择修改后的标注样式,然后单击“设置为当前”按钮,再单击“保存当前样式”按钮,将其保存为新的样式名称3为了...

qq修改密保手机号(qq修改密保手机号是什么意思)

QQ更改绑定的手机号码操作步骤如下:1、打开手机主界面,找到“QQ”软件点击打开。2、输入正确的QQ账户和密码登录到qq主界面。3、点击左上角的头像“图片”,进入到个人中心界面。4、进入到个人中心界面...

取消回复欢迎 发表评论: