百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python学习的窍门:如何读取大文件

off999 2024-10-10 07:52 24 浏览 0 评论

生活中,学习中很多事情做起来都是有一些小窍门的,Python学习也不例外。今天给大家分享Python学习的窍门:如何读取大文件

readlines、read()、readline()等一次性读取遇到很大的文件都可能面临内存崩溃,所以我们将读取操作细化一点

1. read(size) + yield

固定每次读取的长度,使用生成器返回

def read_file1(file='articles.txt'):
 time.sleep(1)
 block_size = 1024
 with open(file, 'r', encoding='utf-8') as f:
 while True:
 block = f.read(block_size)
 if block:
 yield block
 else:
 break

2. for line in

迭代遍历,这个方法会自动地使用缓冲IO(buffered IO)以及内存管理,但是如果大量数据都在一行还是会出状况

def read_file2(file='articles.txt'):
 with open(file, 'r', encoding='utf-8') as f:
 for line in f:
 print(line)


3. buff机制

对于所有数据都在一行的话,用for line in不仅仅没法处理而且获取数据的时候也没法获取到有效内容,这一行数据里明显会包含换行符、分隔符等,这个时候我们就可以自建一个buff管理来处理数据了,将每一次读取的内容加入缓存,对分隔符做处理后下次就从这之后依次处理

def read_file3(split_str, size, file='articles.txt', ):
 with open(file, 'r', encoding='utf-8') as f:
 buff = "" #定义缓冲区
 while True:
 print("buff:", buff)
 while split_str in buff: #若分隔符在缓冲区内
 print("捕捉到分隔符", buff)
 position = buff.index(split_str) #查找分隔符第一次出现的索引
 yield buff[:position] #返回从初始索引到次索引之间的缓冲区内容
 buff = buff[position + len(split_str):] #更新缓冲区,除去分隔符以及之前的内容
 chunk = f.read(size) #缓冲区内无分隔符则读取size个字符
 if chunk: #读取到内容,将内容添加到缓冲区
 buff += chunk
 else:
 yield buff #没读取到内容,退出循环
 break

怎么样,这些Python学习的小窍门你掌握了多少!更多的Python学习教程也会继续为大家更新!

相关推荐

一键打包,随时运行,Python3项目虚拟环境一键整合包的制作(Venv)

之前我们介绍了如何使用嵌入式Python3环境给项目制作一键整合包,在使用嵌入式Python环境时,通常是作为另一个应用程序的一部分,而Python3虚拟环境是为了在开发过程中隔离项目所需的...

PyInstaller 是一个将 Python 代码打包成可执行文件的工具

PyInstaller是一个将Python代码打包成可执行文件的工具。它可以将Python代码打包成Windows、Mac、Linux等平台下的可执行文件,使得你可以将Python应...

知识储备之用py2app将Python代码打包成MacOS可用的APP

自己电脑上有完整的python环境,所以偶尔写个小工具什么的都很easy,直接命令行run一波就OK,但是如果需要再朋友的电脑上运行,帮别人写了一个小工具,他没有运行环境,就很麻烦。不能让人家也从ho...

使用PyInstaller将Python文件打包成Windows系统可执行文件

官网PyInstaller官方网站:http://www.pyinstaller.org/国内镜像库PyInstallerGitee:https://gitee.com/mirrors/pyinst...

松勤技术精选:Python打包exe,换电脑也可直接运行哦!

为什么要打包exe有的时候只需要让别人运行某种功能,传输文件以及代码是需要别人配置好一定的环境才可以操作,而打包成exe文件就可以直接运行文件。pyinstaller打包python中毕竟常用的打包方...

111.Python——基于pipenv打包PaddlePaddle的GUI项目

飞桨PaddlePaddle是百度的深度学习框架,用来做一些项目还是非常不错。但是打包就是一件非常麻烦的过程。在文中有讲过打包问题。29.Python程序打包成可执行文件——常见疑难问题解决办法。本文...

「Python自学笔记」Beeware初体验之Python全平台应用打包

内容更新地址:【Python自学笔记】Beeware初体验,Python如何实现全平台应用打包(exeapkios)_xiaoqiangclub的博客-CSDN博客第一个应用安装环境这里的环境是W...

Python项目pyinstaller打包工具提示词整理出来了,太酷了

Python项目pyinstaller打包工具的提示词整理出来了,下面是完整的提示词请开发一个PythonGUI程序,功能是Python项目打包工具,具有以下特点:1.界面要求:使用PyQt5开发...

Python GUI开发:打包PySide2应用(spyder打包python)

之前的文章我们介绍了怎么使用PySide2来开发一个简单PythonGUI应用。这次我们来将上次完成的代码打包。我们使用pyinstaller。注意,pyinstaller默认会将所有安装的pack...

用Docker打包Python应用的关键要点与实践

引言在微服务架构和云原生时代,Docker已成为应用打包与部署的标准工具。本文将通过一个完整示例,介绍如何用Docker高效打包Python应用,并提炼出关键实践要点。一、Dockerfile基础结构...

精品收藏!Python 程序封装!打包成exe程序!

在Windows操作系统中,我们常用的桌面软件都是带有操作界面的软件,那么Python编写的程序如何才能让用户方便使用呢?因此,程序打包也成为用户的需求,下面详细介绍一下如何进行Python的程序打包...

用python开发的APP程序如何打包成APK安装文件

要将Python开发的APP程序打包成APK安装文件,可以使用第三方工具PyInstaller和Buildozer。下面是一个简单的步骤指南:安装PyInstaller和Buildozer:使用pip...

python打包按部就班(python打包安装文件)

一步一步安装软件包1,pywin32python.exe-mpipinstall--upgradepip更新pippipinstallPyInstaller安装打包工具编写最简单的hel...

爆强!直接把 Python 编写的图形程序打包为安卓 APP

请大家多多关注点赞哦如果想使用Python语言编写图形界面程序,那么有不少的框架可以提供支持,比如Tkinter、QtforPython、WxPython等等。不过这些框架都是只能创建桌面图...

PyOxidizer:将 Python 应用打包成单一可执行文件的神器

三、PyOxidizer基本使用使用PyOxidizer打包应用的基本流程如下:1.创建新项目首先,我们使用pyoxidizerinit命令创建一个新的PyOxidizer项目:py...

取消回复欢迎 发表评论: