Python使用pandas读取excel或txt文件
off999 2024-09-20 22:42 36 浏览 0 评论
在本文中,我们将介绍在Python中,使用pandas库来读取excel或者txt文件,以及在读取文件时的一些常用设置。在工作中我们经常会遇到需要从外部获取数据的情况,比如别人给我们传过来的excel,或者从系统上导出来的txt文件。在我们进行数据分析之前,我们都需要先将这些文件读取出来。pandas为我们提供了read_excel和read_cvs两个函数,分别用于读取excel和txt文件。
以上是一个例子Excel文件,它只有一个sheet页。我们可以使用read_excel函数读取文件内容。程序的源代码如下:
read_excel的参数就是Excel文件的完整路径名。文件如果读取成功,将返回一个DataFrame数据。这里大家要注意一下,如果文件名或路径是带有汉字的,那么一定要使用unicode存储字符串,就像上面的例子一样。df.head()函数将默认返回DataFrame的前5行数。通过这个函数我们可以很方便地看出来DataFrame读取的数据是否正确。这对于程序的调试非常方便。
在实际工作中,我们的很多Excel里会包含多个sheet,那么我们在调用read_excel时就需要指定sheet_name参数。下面我们假定要读取一个包含两个sheet的Excel文件,sheet的名字分别为"法人"和"个人"。
以下是程序的源代码:
程序的第8行和第11行,分别用两种形式,演示了指定sheet_name的方法。
pandas可以使用read_cvs函数读取txt文件中的内容。默认情况下,txt文件的文件格式应该是以逗号分隔开不同的字段。以下是我们用于演示的txt文件内容。
文件的第1行是标题,从第2行开始是文件内容,每个字段都是以逗号间隔开。读取文件的源代码如下:
read_cvs函数的参数是txt文件的完整路径。这里要特殊说明一下是,txt文件是UTF-8编码的,而我们的源代码也是UTF-8编码的。文件的编码对于解决乱码问题很重要。我们可以看到df.head()的结果是正确的。
但是有的时候,我们从不同的系统上下载到的txt数据文件,编码不一定都是UTF-8,那么我们在读取时就要指定encoding参数,以便正确的解析内容。大家如果想知道自己的txt文件是什么编码,可以使用UEStudio打开txt文件,在窗口的最下面可以看到编码。
我们可以看到这个txt文件是GBK编码的。那么我们在读取txt文件时应该指定encoding参数,源代码如下图所示。
通常科技部门为我们从后台导出的txt数据文件都是不带标题的,那么我们在使用pandas读取时,就需要指定header参数,否则pandas会将第1行默认为标题。我们先来看一下程序源代码。
txt文件的内容如下:
在使用read_cvs时,指定header=None,就可以不读取标题行,这时pandas将默认使用从0开始的数据作为标题名称。
在使用这样的文件之前,我们可以向科技部门要一份导出文件的表头,然后手工将表头添加进数据中。例如上面程序的第12行,就是我们为数据指定了一个表头,数据类型是列表(List),设置了表头标题之后,我们再使用df.head()看一下效果。
现在标题就都设置成功了,在pandas中,默认有一个索引列,就是在我们这个例子中,序号之前的这列。有的时候我们会使用这个索引列作为序号,但是由于它默认是从0开头,不太符合我们的阅读习惯,所以我们可以修改一下,使序号是从1开始。我们需要设置index属性,将其赋值为一个从1开始的列表类型(List)数据。例如上面程序的第16行,使用range函数构造一个列表类型数据,然后赋给index。处理后的txt文件内容如下。
以上就是关于在Python中,读取excel或者txt文件的一些常用操作。希望对大家的工作能有所帮助。
我使用的环境:Windows 7 + Python 2.7.17 + PyCharm Community Edition 2016.1.5
如果大家认为我的文章还可以,真心希望能帮我点一个"关注",粉丝的数量真的对我很重要,也算是对我努力结果的一个支持,谢谢大家了。
相关推荐
- 免费无需排队的云电脑(不需要排队的云电脑)
-
目前市场上有一些云游戏平台提供无限时长且无需排队的服务。这些平台通常采用先进的云计算技术和高性能服务器,能够提供稳定流畅的游戏体验。用户可以随时登录并畅玩游戏,无需等待排队。这些平台还提供多种游戏选择...
- wps官方下载(wps官方下载官网电脑版网址)
-
具体的步骤如下:1、首先在电脑上打开浏览器,在浏览器中输入“WPS”,找到WPS官方网站。2、接下来进入WPS官方网站中,找到WPS软件,点击“免费下载”。3、点击下载后在弹出来的对话框中修改下载位置...
- win vista与win7有什么区别(win7与vista关系)
-
WindowsVista和Windows7是微软公司推出的两个桌面操作系统,它们之间有以下主要区别:1.界面设计:Windows7的界面设计更加简洁明了,而WindowsVista的界面...
- winxp系统版本(winxp 版本)
-
1、微软官方3个版本:WINDOWSXPHOME(家庭版)、Professional(专业版)、MediaCenter2005(媒体中心版),每个版本的功能不一样。使用最多的是Professional...
- 打印机无法共享怎么回事(打印机无法共享出去)
-
共享打印机无法打印原因一:可能是由于病毒死机解决方法:确定是否由于病毒死机,找一张干净(确信无病毒)的系统盘,从A驱动舒上启动电脑,检查此时打印机和主机能否联机。如果正常联机,估计这种故障是由攻击硬件...
- ipv6无网络访问权限怎么解决
-
ipv6无网络访问权限解决方法如下1、点击电脑左下角的开始,进入到开始的菜单栏,在菜单栏中找到“运行”。或者通过快捷键Windows+R打开运行窗口。 2、打开运行的窗口页面后,在页面上输入“CMD...
- office ltsc版(Office LTSC版本区别)
-
office2021和2021ltsc的区别如下:1.更新策略不同。前者采用每个月月度更新的方法,提供功能更新、安全更新。后者不采用每个月月度更新的方法,且不提供功能更新。2.界面不同。2021采用了...
- 安装win7需要激活吗(现在安装win7旗舰版还需密钥吗)
-
要激活 Windows7如果是预装在计算机中的,买来之后便不用激活,这里预装指的是在厂商那里。正版的Windows7安装到计算机中,有三十天的试用期,若要永久使用,就要使...
- originos 3升级计划公布(originos升级包)
-
2023年2月。1.OriginOS3.0系统第一批升级时间为11月25日。2、包含iQOONeo7,X80系列,S15系列,iQOO9、iQOO10系列,以及折叠屏XFold系列和大屏XNo...
- 鸿蒙系统适配第三方机型(鸿蒙 第三方适配)
-
最新华为官方公布了鸿蒙系统3.0支持的机型名单,具体如下。鸿蒙系统3.0升级名单:1.Mate系列:MateXs2、MateX2、MateXs、Mate40、Mate40Pro、Mate...
- imei怎么下载(imei changer apk)
-
如果您的steam序列号激活了,可以尝试以下方法下载:1.使用steam自带的下载工具,如“下载工具”,在软件的“下载”选项卡中选择“序列号下载”。2.在下载页面中,选择要下载的游戏,然后点击“下...
- 电脑系统优化软件哪个好(系统优化软件排行榜)
-
有必要用,非常好用,WINDOWS优化大师是一个网络上下载率极高的系统维护软件。多年未曾清理过系统和硬盘的电脑,系统内部将产生大量的垃圾文件、临时文件、废旧程序等等win10系统不需要经常更新,关闭...
- 重装系统后硬盘不见了(重装系统后磁盘不见了)
-
硬盘不见可能是因为重装系统时未正确安装驱动程序或未对硬件进行正确设置。你可以按以下步骤排查问题:进入BIOS检查硬盘是否被识别,尝试重新连接数据线和电源线,更新或安装适当的硬件驱动程序,或者使用硬件故...
- 冰封u盘装win7系统教程图解(冰封u盘启动装机教程)
-
1.查找激活工具:通常来说,Win7冰封系统已经包含了必要的驱动,所以如果你的电脑上并没有出现设备错误,那你就可以正常使用。如果你需要添加任何驱动,请尝试从厂商下载相应的驱动并执行自动安装程序。如果...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
慕ke 前端工程师2024「完整」
-
失业程序员复习python笔记——条件与循环
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
