Python学习的窍门:如何读取大文件
off999 2024-10-10 07:52 24 浏览 0 评论
生活中,学习中很多事情做起来都是有一些小窍门的,Python学习也不例外。今天给大家分享Python学习的窍门:如何读取大文件
readlines、read()、readline()等一次性读取遇到很大的文件都可能面临内存崩溃,所以我们将读取操作细化一点
1. read(size) + yield
固定每次读取的长度,使用生成器返回
def read_file1(file='articles.txt'): time.sleep(1) block_size = 1024 with open(file, 'r', encoding='utf-8') as f: while True: block = f.read(block_size) if block: yield block else: break
2. for line in
迭代遍历,这个方法会自动地使用缓冲IO(buffered IO)以及内存管理,但是如果大量数据都在一行还是会出状况
def read_file2(file='articles.txt'): with open(file, 'r', encoding='utf-8') as f: for line in f: print(line)
3. buff机制
对于所有数据都在一行的话,用for line in不仅仅没法处理而且获取数据的时候也没法获取到有效内容,这一行数据里明显会包含换行符、分隔符等,这个时候我们就可以自建一个buff管理来处理数据了,将每一次读取的内容加入缓存,对分隔符做处理后下次就从这之后依次处理
def read_file3(split_str, size, file='articles.txt', ): with open(file, 'r', encoding='utf-8') as f: buff = "" #定义缓冲区 while True: print("buff:", buff) while split_str in buff: #若分隔符在缓冲区内 print("捕捉到分隔符", buff) position = buff.index(split_str) #查找分隔符第一次出现的索引 yield buff[:position] #返回从初始索引到次索引之间的缓冲区内容 buff = buff[position + len(split_str):] #更新缓冲区,除去分隔符以及之前的内容 chunk = f.read(size) #缓冲区内无分隔符则读取size个字符 if chunk: #读取到内容,将内容添加到缓冲区 buff += chunk else: yield buff #没读取到内容,退出循环 break
怎么样,这些Python学习的小窍门你掌握了多少!更多的Python学习教程也会继续为大家更新!
相关推荐
- 一键打包,随时运行,Python3项目虚拟环境一键整合包的制作(Venv)
-
之前我们介绍了如何使用嵌入式Python3环境给项目制作一键整合包,在使用嵌入式Python环境时,通常是作为另一个应用程序的一部分,而Python3虚拟环境是为了在开发过程中隔离项目所需的...
- PyInstaller 是一个将 Python 代码打包成可执行文件的工具
-
PyInstaller是一个将Python代码打包成可执行文件的工具。它可以将Python代码打包成Windows、Mac、Linux等平台下的可执行文件,使得你可以将Python应...
- 知识储备之用py2app将Python代码打包成MacOS可用的APP
-
自己电脑上有完整的python环境,所以偶尔写个小工具什么的都很easy,直接命令行run一波就OK,但是如果需要再朋友的电脑上运行,帮别人写了一个小工具,他没有运行环境,就很麻烦。不能让人家也从ho...
- 使用PyInstaller将Python文件打包成Windows系统可执行文件
-
官网PyInstaller官方网站:http://www.pyinstaller.org/国内镜像库PyInstallerGitee:https://gitee.com/mirrors/pyinst...
- 松勤技术精选:Python打包exe,换电脑也可直接运行哦!
-
为什么要打包exe有的时候只需要让别人运行某种功能,传输文件以及代码是需要别人配置好一定的环境才可以操作,而打包成exe文件就可以直接运行文件。pyinstaller打包python中毕竟常用的打包方...
- 111.Python——基于pipenv打包PaddlePaddle的GUI项目
-
飞桨PaddlePaddle是百度的深度学习框架,用来做一些项目还是非常不错。但是打包就是一件非常麻烦的过程。在文中有讲过打包问题。29.Python程序打包成可执行文件——常见疑难问题解决办法。本文...
- 「Python自学笔记」Beeware初体验之Python全平台应用打包
-
内容更新地址:【Python自学笔记】Beeware初体验,Python如何实现全平台应用打包(exeapkios)_xiaoqiangclub的博客-CSDN博客第一个应用安装环境这里的环境是W...
- Python项目pyinstaller打包工具提示词整理出来了,太酷了
-
Python项目pyinstaller打包工具的提示词整理出来了,下面是完整的提示词请开发一个PythonGUI程序,功能是Python项目打包工具,具有以下特点:1.界面要求:使用PyQt5开发...
- Python GUI开发:打包PySide2应用(spyder打包python)
-
之前的文章我们介绍了怎么使用PySide2来开发一个简单PythonGUI应用。这次我们来将上次完成的代码打包。我们使用pyinstaller。注意,pyinstaller默认会将所有安装的pack...
- 用Docker打包Python应用的关键要点与实践
-
引言在微服务架构和云原生时代,Docker已成为应用打包与部署的标准工具。本文将通过一个完整示例,介绍如何用Docker高效打包Python应用,并提炼出关键实践要点。一、Dockerfile基础结构...
- 精品收藏!Python 程序封装!打包成exe程序!
-
在Windows操作系统中,我们常用的桌面软件都是带有操作界面的软件,那么Python编写的程序如何才能让用户方便使用呢?因此,程序打包也成为用户的需求,下面详细介绍一下如何进行Python的程序打包...
- 用python开发的APP程序如何打包成APK安装文件
-
要将Python开发的APP程序打包成APK安装文件,可以使用第三方工具PyInstaller和Buildozer。下面是一个简单的步骤指南:安装PyInstaller和Buildozer:使用pip...
- python打包按部就班(python打包安装文件)
-
一步一步安装软件包1,pywin32python.exe-mpipinstall--upgradepip更新pippipinstallPyInstaller安装打包工具编写最简单的hel...
- 爆强!直接把 Python 编写的图形程序打包为安卓 APP
-
请大家多多关注点赞哦如果想使用Python语言编写图形界面程序,那么有不少的框架可以提供支持,比如Tkinter、QtforPython、WxPython等等。不过这些框架都是只能创建桌面图...
- PyOxidizer:将 Python 应用打包成单一可执行文件的神器
-
三、PyOxidizer基本使用使用PyOxidizer打包应用的基本流程如下:1.创建新项目首先,我们使用pyoxidizerinit命令创建一个新的PyOxidizer项目:py...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- 一键打包,随时运行,Python3项目虚拟环境一键整合包的制作(Venv)
- PyInstaller 是一个将 Python 代码打包成可执行文件的工具
- 知识储备之用py2app将Python代码打包成MacOS可用的APP
- 使用PyInstaller将Python文件打包成Windows系统可执行文件
- 松勤技术精选:Python打包exe,换电脑也可直接运行哦!
- 111.Python——基于pipenv打包PaddlePaddle的GUI项目
- 「Python自学笔记」Beeware初体验之Python全平台应用打包
- Python项目pyinstaller打包工具提示词整理出来了,太酷了
- Python GUI开发:打包PySide2应用(spyder打包python)
- 用Docker打包Python应用的关键要点与实践
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python自定义函数 (53)
- python进度条 (67)
- python吧 (67)
- python字典遍历 (54)
- python的for循环 (65)
- python串口编程 (60)
- python读取文件夹下所有文件 (59)
- java调用python脚本 (56)
- python操作mysql数据库 (66)
- python字典增加键值对 (53)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python人脸识别 (54)
- python多态 (60)
- python命令行参数 (53)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- centos7安装python (53)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)