百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python使用pandas读取excel或txt文件

off999 2024-09-20 22:42 47 浏览 0 评论

在本文中,我们将介绍在Python中,使用pandas库来读取excel或者txt文件,以及在读取文件时的一些常用设置。在工作中我们经常会遇到需要从外部获取数据的情况,比如别人给我们传过来的excel,或者从系统上导出来的txt文件。在我们进行数据分析之前,我们都需要先将这些文件读取出来。pandas为我们提供了read_excel和read_cvs两个函数,分别用于读取excel和txt文件。

以上是一个例子Excel文件,它只有一个sheet页。我们可以使用read_excel函数读取文件内容。程序的源代码如下:

read_excel的参数就是Excel文件的完整路径名。文件如果读取成功,将返回一个DataFrame数据。这里大家要注意一下,如果文件名或路径是带有汉字的,那么一定要使用unicode存储字符串,就像上面的例子一样。df.head()函数将默认返回DataFrame的前5行数。通过这个函数我们可以很方便地看出来DataFrame读取的数据是否正确。这对于程序的调试非常方便。

在实际工作中,我们的很多Excel里会包含多个sheet,那么我们在调用read_excel时就需要指定sheet_name参数。下面我们假定要读取一个包含两个sheet的Excel文件,sheet的名字分别为"法人"和"个人"。

以下是程序的源代码:

程序的第8行和第11行,分别用两种形式,演示了指定sheet_name的方法。

pandas可以使用read_cvs函数读取txt文件中的内容。默认情况下,txt文件的文件格式应该是以逗号分隔开不同的字段。以下是我们用于演示的txt文件内容。

文件的第1行是标题,从第2行开始是文件内容,每个字段都是以逗号间隔开。读取文件的源代码如下:

read_cvs函数的参数是txt文件的完整路径。这里要特殊说明一下是,txt文件是UTF-8编码的,而我们的源代码也是UTF-8编码的。文件的编码对于解决乱码问题很重要。我们可以看到df.head()的结果是正确的。

但是有的时候,我们从不同的系统上下载到的txt数据文件,编码不一定都是UTF-8,那么我们在读取时就要指定encoding参数,以便正确的解析内容。大家如果想知道自己的txt文件是什么编码,可以使用UEStudio打开txt文件,在窗口的最下面可以看到编码。

我们可以看到这个txt文件是GBK编码的。那么我们在读取txt文件时应该指定encoding参数,源代码如下图所示。

通常科技部门为我们从后台导出的txt数据文件都是不带标题的,那么我们在使用pandas读取时,就需要指定header参数,否则pandas会将第1行默认为标题。我们先来看一下程序源代码。

txt文件的内容如下:

在使用read_cvs时,指定header=None,就可以不读取标题行,这时pandas将默认使用从0开始的数据作为标题名称。

在使用这样的文件之前,我们可以向科技部门要一份导出文件的表头,然后手工将表头添加进数据中。例如上面程序的第12行,就是我们为数据指定了一个表头,数据类型是列表(List),设置了表头标题之后,我们再使用df.head()看一下效果。

现在标题就都设置成功了,在pandas中,默认有一个索引列,就是在我们这个例子中,序号之前的这列。有的时候我们会使用这个索引列作为序号,但是由于它默认是从0开头,不太符合我们的阅读习惯,所以我们可以修改一下,使序号是从1开始。我们需要设置index属性,将其赋值为一个从1开始的列表类型(List)数据。例如上面程序的第16行,使用range函数构造一个列表类型数据,然后赋给index。处理后的txt文件内容如下。

以上就是关于在Python中,读取excel或者txt文件的一些常用操作。希望对大家的工作能有所帮助。

我使用的环境:Windows 7 + Python 2.7.17 + PyCharm Community Edition 2016.1.5

如果大家认为我的文章还可以,真心希望能帮我点一个"关注",粉丝的数量真的对我很重要,也算是对我努力结果的一个支持,谢谢大家了。

相关推荐

查看电脑ip地址的命令(查看电脑ip地址用什么命令)
查看电脑ip地址的命令(查看电脑ip地址用什么命令)

1、在“本地连接”的状态中查看。2、使用“ipconfig/all”命令查看。3、打开电脑网页,输入IP地址,点击确定,就能看到本机IP。扩展资料IP地址(InternetProtocolAddress),全称为网际协议地址,是一种在...

2025-12-30 10:03 off999

ie浏览器9(IE浏览器9.0如何升级)

1、首先,我们点击开始菜单,找到控制面板,点击一下。2、之后,找到程序和功能选项,点击一下。3、点击进入后,我们找到左边的打开或关闭windows功能,点击一下。4、点击进入后,找到Internet...

hp1020打印机驱动怎么下载(hp1020打印机驱动怎么下载)

惠普1020打印机驱动怎么安装:  1.首先到下载软件名称:惠普1020打印机驱动程序官方版(支持win7/8)32位/64位软件大小:5.09MB更新时间:2014-09-05立即下载  2.然后...

win2003是windows7系统(win2003哪个版本好)

win2003是专门用于服务器的操作系统,现在最主流的windows服务器系统主要是win2003server和win2008server,winXP是个人电脑专用的操作系统,现在微软已经不再提供XP...

路由器账号和密码忘了怎么办

你好,如果你忘记了路由器的用户名和密码,你可以尝试重置一下路由器,大多数路由器都配备了一个复位按键。在重置路由器之后,用户名和密码将被还原为默认值,你可以在路由器的用户手册或厂家网站上找到默认的用户名...

win10永久禁止自动更新(win10禁止自动更新彻底)

阻止Windows10自动更新的方法如下:使用“本地组策略编辑器”:按下“Win+R”键,输入“gpedit.msc”打开本地组策略编辑器,找到“计算机配置”>“管理模板”>“W...

联想笔记本怎么看配置和型号

联想笔记本看配置的方法如下1、打开电脑,点击桌面的计算机,右键菜单里选择【属性】;打开后,即可看到电脑系统的大概信息;2、如果要看比较详细的设备相关信息,点击桌面的计算机,点击右键,在菜单里选择【系统...

怎样把打印机连接到电脑上(怎么把打印机连接电脑上)
  • 怎样把打印机连接到电脑上(怎么把打印机连接电脑上)
  • 怎样把打印机连接到电脑上(怎么把打印机连接电脑上)
  • 怎样把打印机连接到电脑上(怎么把打印机连接电脑上)
  • 怎样把打印机连接到电脑上(怎么把打印机连接电脑上)
photoshop6序列号(photoshop8.01序列号)
  • photoshop6序列号(photoshop8.01序列号)
  • photoshop6序列号(photoshop8.01序列号)
  • photoshop6序列号(photoshop8.01序列号)
  • photoshop6序列号(photoshop8.01序列号)
win10下载应用商店(win10应用商店打不开)

1、点击Win10系统的开始菜单,然后在点击应用商店;2、打开Win10应用商店后,在搜索框里输入想要搜索的应用软件,然后点击检索;3、点击搜索到的应用,点击安装;4、点击安装后,系统会提示要切换到这...

dell电脑重装系统win10(dell 重装win10系统)

戴尔笔记本重装系统win10的步骤如下:制作好wepe启动盘之后,将win10系统iso镜像直接复制到U盘。在需要重装系统的戴尔电脑上插入pe启动盘,重启后不停按F12启动快捷键,调出启动菜单对话框,...

android升级包下载安装(android 升级包)

打开手机系统更新升级,前提是官方有新系统推送才能更新  哪个大不一定,但一般规律如下:  1、小版本的更新,通常越更新越大。比如3.1更新到3.2,通常是修复bug,代码量通常会增大,体积就会增大。 ...

hdd硬盘和ssd(ssd硬盘和hdd硬盘是什么意思)

HDD硬盘和SSD硬盘是两种不同类型的电脑存储设备,它们有着以下区别:1.工作原理:HDD硬盘使用机械旋转的磁盘和读写磁头来存储和读取数据,而SSD硬盘则使用闪存存储数据,类似于USB闪存盘。2....

电脑免费软件下载大全(电脑上免费的下载软件)

正常情况下,如果我们想要在自己的电脑上面下载一个不要钱的单机游戏,那么我们是可以直接在我们的软件管理中心进行一个下载的,这个时候我们只需要通过一个权限就能够正常的下载,当然我们也是可以在一些小游戏的软...

mpp文件转换excel(mpp转换成pdf)

要将Excel表格转换为MPP格式,您可以按照以下步骤操作:1.打开Excel表格并确保数据按照项目的不同阶段或任务进行组织。2.将Excel表格中的数据复制到一个新的MicrosoftProj...

取消回复欢迎 发表评论: