Python使用pandas读取excel或txt文件
off999 2024-09-20 22:42 46 浏览 0 评论
在本文中,我们将介绍在Python中,使用pandas库来读取excel或者txt文件,以及在读取文件时的一些常用设置。在工作中我们经常会遇到需要从外部获取数据的情况,比如别人给我们传过来的excel,或者从系统上导出来的txt文件。在我们进行数据分析之前,我们都需要先将这些文件读取出来。pandas为我们提供了read_excel和read_cvs两个函数,分别用于读取excel和txt文件。
以上是一个例子Excel文件,它只有一个sheet页。我们可以使用read_excel函数读取文件内容。程序的源代码如下:
read_excel的参数就是Excel文件的完整路径名。文件如果读取成功,将返回一个DataFrame数据。这里大家要注意一下,如果文件名或路径是带有汉字的,那么一定要使用unicode存储字符串,就像上面的例子一样。df.head()函数将默认返回DataFrame的前5行数。通过这个函数我们可以很方便地看出来DataFrame读取的数据是否正确。这对于程序的调试非常方便。
在实际工作中,我们的很多Excel里会包含多个sheet,那么我们在调用read_excel时就需要指定sheet_name参数。下面我们假定要读取一个包含两个sheet的Excel文件,sheet的名字分别为"法人"和"个人"。
以下是程序的源代码:
程序的第8行和第11行,分别用两种形式,演示了指定sheet_name的方法。
pandas可以使用read_cvs函数读取txt文件中的内容。默认情况下,txt文件的文件格式应该是以逗号分隔开不同的字段。以下是我们用于演示的txt文件内容。
文件的第1行是标题,从第2行开始是文件内容,每个字段都是以逗号间隔开。读取文件的源代码如下:
read_cvs函数的参数是txt文件的完整路径。这里要特殊说明一下是,txt文件是UTF-8编码的,而我们的源代码也是UTF-8编码的。文件的编码对于解决乱码问题很重要。我们可以看到df.head()的结果是正确的。
但是有的时候,我们从不同的系统上下载到的txt数据文件,编码不一定都是UTF-8,那么我们在读取时就要指定encoding参数,以便正确的解析内容。大家如果想知道自己的txt文件是什么编码,可以使用UEStudio打开txt文件,在窗口的最下面可以看到编码。
我们可以看到这个txt文件是GBK编码的。那么我们在读取txt文件时应该指定encoding参数,源代码如下图所示。
通常科技部门为我们从后台导出的txt数据文件都是不带标题的,那么我们在使用pandas读取时,就需要指定header参数,否则pandas会将第1行默认为标题。我们先来看一下程序源代码。
txt文件的内容如下:
在使用read_cvs时,指定header=None,就可以不读取标题行,这时pandas将默认使用从0开始的数据作为标题名称。
在使用这样的文件之前,我们可以向科技部门要一份导出文件的表头,然后手工将表头添加进数据中。例如上面程序的第12行,就是我们为数据指定了一个表头,数据类型是列表(List),设置了表头标题之后,我们再使用df.head()看一下效果。
现在标题就都设置成功了,在pandas中,默认有一个索引列,就是在我们这个例子中,序号之前的这列。有的时候我们会使用这个索引列作为序号,但是由于它默认是从0开头,不太符合我们的阅读习惯,所以我们可以修改一下,使序号是从1开始。我们需要设置index属性,将其赋值为一个从1开始的列表类型(List)数据。例如上面程序的第16行,使用range函数构造一个列表类型数据,然后赋给index。处理后的txt文件内容如下。
以上就是关于在Python中,读取excel或者txt文件的一些常用操作。希望对大家的工作能有所帮助。
我使用的环境:Windows 7 + Python 2.7.17 + PyCharm Community Edition 2016.1.5
如果大家认为我的文章还可以,真心希望能帮我点一个"关注",粉丝的数量真的对我很重要,也算是对我努力结果的一个支持,谢谢大家了。
相关推荐
- 路由器账号和密码忘了怎么办
-
你好,如果你忘记了路由器的用户名和密码,你可以尝试重置一下路由器,大多数路由器都配备了一个复位按键。在重置路由器之后,用户名和密码将被还原为默认值,你可以在路由器的用户手册或厂家网站上找到默认的用户名...
- win10永久禁止自动更新(win10禁止自动更新彻底)
-
阻止Windows10自动更新的方法如下:使用“本地组策略编辑器”:按下“Win+R”键,输入“gpedit.msc”打开本地组策略编辑器,找到“计算机配置”>“管理模板”>“W...
- 联想笔记本怎么看配置和型号
-
联想笔记本看配置的方法如下1、打开电脑,点击桌面的计算机,右键菜单里选择【属性】;打开后,即可看到电脑系统的大概信息;2、如果要看比较详细的设备相关信息,点击桌面的计算机,点击右键,在菜单里选择【系统...
- win10下载应用商店(win10应用商店打不开)
-
1、点击Win10系统的开始菜单,然后在点击应用商店;2、打开Win10应用商店后,在搜索框里输入想要搜索的应用软件,然后点击检索;3、点击搜索到的应用,点击安装;4、点击安装后,系统会提示要切换到这...
- dell电脑重装系统win10(dell 重装win10系统)
-
戴尔笔记本重装系统win10的步骤如下:制作好wepe启动盘之后,将win10系统iso镜像直接复制到U盘。在需要重装系统的戴尔电脑上插入pe启动盘,重启后不停按F12启动快捷键,调出启动菜单对话框,...
- android升级包下载安装(android 升级包)
-
打开手机系统更新升级,前提是官方有新系统推送才能更新 哪个大不一定,但一般规律如下: 1、小版本的更新,通常越更新越大。比如3.1更新到3.2,通常是修复bug,代码量通常会增大,体积就会增大。 ...
- hdd硬盘和ssd(ssd硬盘和hdd硬盘是什么意思)
-
HDD硬盘和SSD硬盘是两种不同类型的电脑存储设备,它们有着以下区别:1.工作原理:HDD硬盘使用机械旋转的磁盘和读写磁头来存储和读取数据,而SSD硬盘则使用闪存存储数据,类似于USB闪存盘。2....
- 电脑免费软件下载大全(电脑上免费的下载软件)
-
正常情况下,如果我们想要在自己的电脑上面下载一个不要钱的单机游戏,那么我们是可以直接在我们的软件管理中心进行一个下载的,这个时候我们只需要通过一个权限就能够正常的下载,当然我们也是可以在一些小游戏的软...
- mpp文件转换excel(mpp转换成pdf)
-
要将Excel表格转换为MPP格式,您可以按照以下步骤操作:1.打开Excel表格并确保数据按照项目的不同阶段或任务进行组织。2.将Excel表格中的数据复制到一个新的MicrosoftProj...
- win7旗舰版开机密码忘记按f2
-
方法如下:开始-控制面板-用户帐户;在打开的更改用户帐户界面点击要更改的帐户;然后点击帐户左面的更改密码按钮;在打开的页面上,输入一次当前使用的密码,输入2次要更改的新密码然后保存退出就可以了...
- 笔记本无音频输出设备(笔记本无音频输出设备)
-
1、没有声卡驱动,解决方法就是找到笔记本的官网,下载电脑声卡的驱动安装即可。2、没有外界的音频播放设备,解决方法就是买一个外界的音频播放设备插到电脑主机的音频接口上即可。笔记本电脑显示未安装任何音频输...
- iso文件能用手机打开吗(iso文件能用手机打开吗安全吗)
-
一般的压缩软件就可以打开的,比如,好压软件,这个打开只是解压形式的,如果你说的是运行iso文件,这个没有,况且安卓系统也不支持iso运行ISO文件一般用于光盘镜像文件的存储,如果想要在手机上运行ISO...
- win7系统卡顿怎么优化(win7很慢很卡怎么优化)
-
1、首先打开安全卫士,进入安全卫士首页,单击软件窗口右下角的“更多”图标,打开扩展应用程序。2、单击选择“我的工具”。3、在我的工具菜单里面找到“人工服务”单击打开人工服务。4、在人工服务对话框有很多...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
python入门到脱坑 输入与输出—str()函数
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
失业程序员复习python笔记——条件与循环
-
系统u盘安装(win11系统u盘安装)
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
