百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

使用pandas读取excel(使用pandas读取excel文件的代码示例)

off999 2024-10-11 13:59 27 浏览 0 评论

摘要:Excel是微软的经典之作,在日常工作中的数据整理、分析和可视化方面,有其独到的优势。但如果数据量超大,Excel的劣势也就随之而来,甚至因为内存溢出无法打开文件,后续的分析更是难上加难。那么,有什么更好的解决办法吗?工欲善其事,必先利其器,在这里我们介绍使用Python的pandas数据分析包的read_excel()方法来解决此问题。

pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, parse_dates=False, date_parser=None, thousands=None, comment=None, skipfooter=0, convert_float=True, **kwds)

pandas读取Excel后返回DataFrame,接下来我们就pd.read_excel()常用参数进行详细解析。


io,即Excel工作簿的存储路径,建议使用英文路径以及英文命名方式。

import pandas as pd
io = r'C:\Users\Administrator\Desktop\data.xlsx'

sheet_name,要读取的工作表名,可以是整型数字、列表名或SheetN,也可以是上述三种组成的列表。

  • 整型数字:目标sheet所在的位置,以0为起始,sheet_name = 1代表第2个工作表。
data = pd.read_excel(io, sheet_name = 1)
data.head()
  • 列表名:目标sheet的名称,中英文皆可。
data = pd.read_excel(io, sheet_name = '英超射手榜')
data.head()
  • SheetN:代表第N个sheet,S要大写,注意与整型数字的区别。
data = pd.read_excel(io, sheet_name = 'Sheet5')
data.head()
  • 组合列表: sheet_name = [0, '英超射手榜', 'Sheet4'],代表读取三个工作表,分别为第1个工作表、名为“英超射手榜”的工作表和第4个工作表,显然,Sheet4未经重命名。
  • sheet_name 默认为0,取Excel第一个工作表。如果读取多个工作表,则显示表格的字典。因此对于初学者而言,建议每次读取一个工作表,然后进行二次整合。
data = pd.read_excel(io, sheet_name = ['英超积分榜', '西甲积分榜'], nrows = 5)
# sheet_name = ['英超积分榜', '西甲积分榜'] ,返回两个工作表组成的字典
data

header, 哪一行用作列名,默认为0 ,如果设置为[0,1],则表示将前两行作为多重索引

data = pd.read_excel(io, sheet_name = '英超积分榜', header = [0,1]) 
# 前两行作为列名。
data.head()

names, 用自定义的列名作为最终的列名。一般适用于Excel缺少列名,或者需要重新定义列名的情况。注意:names的长度必须和Excel列长度一致,否则会报错。

data = pd.read_excel(io, sheet_name = '英超射手榜', 
 names = ['rank','player','club','goal','common_goal','penalty'])
data.head()

index_col, 用以作为索引的列,可以是工作表列名称(index_col = '排名'),也可以是整型或整型列表(index_col = 0 或 [0, 1]),如果选择多个列,则返回多重索引。

data = pd.read_excel(io, sheet_name = '英超射手榜', index_col = '排名')
data.head()
data = pd.read_excel(io, sheet_name = '英超射手榜', index_col = [0, 1])
data.head()

usecols,需要读取哪些列。可以使用整型(从0开始,如[0,2,3])或者“A”、“B”等字母(Excel常用),如“A:C, E” ="A, B, C, E",并且两边都包括。

data = pd.read_excel(io, sheet_name = '西甲射手榜', usecols = [0, 1, 3])
data.head()
data = pd.read_excel(io, sheet_name = '西甲射手榜', usecols = 'A:C, E')
data.head()

squeeze,如果数据仅包含一列,squeeze为True时,返回Series,反之返回DataFrame。

data = pd.read_excel(io, sheet_name = 'squeeze', squeeze = True)
data.head()
data = pd.read_excel(io, sheet_name = 'squeeze', squeeze = False)
data.head()

converters ,强制规定列的数据类型,converters = {'排名': str, '场次': int}, 将“排名”列数据类型强制规定为字符串,“场次”为整型,主要用途:保留以文本形式存储的数字。

data = pd.read_excel(io, sheet_name = 'converters', converters = {'排名': str, '场次': float})
data['排名'].dtype

skiprows = n, 表示跳过前n行数据; skiprows = [a, b, c],表示跳过第a,b,c行数据(索引从0开始)。使用skiprows 后,有可能首行(即列名)也会被跳过。

data = pd.read_excel(io, sheet_name = '英超射手榜', skiprows = [1,2,3]) 
# 跳过第2,3,4行数据(索引从0开始,包括列名)
data.head()
data = pd.read_excel(io, sheet_name = '英超射手榜', skiprows = 3)
data.head()

nrows ,需要读取的行数,如果数据量太过庞大,或者只想了解Excel的列名及概况,nrows会十分有用。

data = pd.read_excel(io, sheet_name = '英超射手榜', nrows = 10)
data

skipfooter = n, 跳过末尾n行(索引从0开始)。

data = pd.read_excel(r'C:\Users\Administrator\Desktop\data.xlsx' , 
 sheet_name = '英超射手榜', skipfooter = 43)
# skipfooter = 43, 跳过末尾43行(索引从0开始)
data

***新手自学,欢迎拍砖***

相关推荐

Python函数参数和返回值类型:让你的代码更清晰、更健壮

在Python开发中,你是否遇到过这些抓狂时刻?同事写的函数参数类型全靠猜调试两小时发现传了字符串给数值计算函数重构代码时不知道函数返回的是列表还是字典今天教你两招,彻底解决类型混乱问题!让你的...

有公司内部竟然禁用了python开发,软件开发何去何从?

今天有网友在某社交平台发文:有公司内部竟然禁止了python开发!帖子没几行,评论却炸锅了。有的说“太正常,Python本就不适合做大项目”,还有的反驳“飞书全员用Python”。暂且不说这家公司...

写 Python 七年才发现的七件事:真正提高生产力的脚本思路

如果你已经用Python写了不少脚本,却总觉得代码只是“能跑”,这篇文章或许会刷新你对这门语言的认知。以下七个思路全部来自一线实战,没有花哨的概念,只有可落地的工具与习惯。它们曾帮我省下大量无意义...

用Python写一个A*搜索算法含注释说明

大家好!我是幻化意识流。今天我们用Python写一个A*搜索算法的代码,我做了注释说明,欢迎大家一起学习:importheapq#定义搜索节点类,包括当前状态、从初始状态到该状态的代价g、从该状态...

使用python制作一个贪吃蛇游戏,并为每一句添加注释方便学习

今天来设计一个贪吃蛇的经典小游戏。先介绍下核心代码功能(源代码请往最后面拉):游戏功能:-四个难度等级:简单(8FPS)、中等(12FPS)、困难(18FPS)、专家(25FPS)-美...

Python 之父 Guido van Rossum 宣布退休

Python之父GuidovanRossum在推特公布了自己从Dropbox公司离职的消息,并表示已经退休。他还提到自己在Dropbox担任工程师期间学到了很多东西——Python的类型注解(T...

4 个早该掌握的 Python 类型注解技巧

在Python的开发过程中,类型注解常常被忽视。但当面对一段缺乏类型提示、逻辑复杂的代码时,理解和维护成本会迅速上升,极易陷入“阅读地狱”。本文整理了4个关于Python类型注解的重要技巧...

让你的Python代码更易读:7个提升函数可读性的实用技巧

如果你正在阅读这篇文章,很可能你已经用Python编程有一段时间了。今天,让我们聊聊可以提升你编程水平的一件事:编写易读的函数。请想一想:我们花在阅读代码上的时间大约是写代码的10倍。所以,每当你创建...

Python异常模块和包

异常当检测到一个错误时,Python解释器就无法继续执行了,反而出现了一些错误的提示,这就是所谓的“异常”,也就是我们常说的BUG例如:以`r`方式打开一个不存在的文件。f=open('...

别再被 return 坑了!一文吃透 Python return 语句常见错误与调试方法

Pythonreturn语句常见错误与调试方法(结构化详解)一.语法错误:遗漏return或返回值类型错误错误场景pythondefadd(a,b):print(a+b)...

Python数据校验不再难:Pydantic库的工程化实践指南

在FastAPI框架横扫Python后端开发领域的今天,其默认集成的Pydantic库正成为处理数据验证的黄金标准。这个看似简单的库究竟隐藏着哪些让开发者爱不释手的能力?本文将通过真实项目案例,带您解...

python防诈骗的脚本带注释信息

以下是一个简单但功能完整的防诈骗脚本,包含URL检测、文本分析和风险评估功能。代码结构清晰,带有详细注释,适合作为个人或家庭防诈骗工具使用。这个脚本具有以下功能:文本诈骗风险分析:检测常见诈骗关键...

Python判断语句

布尔类型和比较运算符布尔类型的定义:布尔类型只有两个值:True和False可以通过定义变量存储布尔类型数据:变量名称=布尔类型值(True/False)布尔类型不仅可以自行定义,同时也可通过...

使用python编写俄罗斯方块小游戏并为每一句添加注释,方便学习

先看下学习指导#俄罗斯方块游戏开发-Python学习指导##项目概述这个俄罗斯方块游戏是一个完整的Python项目,涵盖了以下重要的编程概念:-面向对象编程(OOP)-游戏开发基础-数据...

Python十大技巧:不掌握这些,你可能一直在做无用功!

在编程的世界里,掌握一门语言只是起点,如何写出优雅、高效的代码才是真功夫。Python作为最受欢迎的编程语言之一,拥有简洁明了的语法,但要想真正精通这门语言,还需要掌握一些实用的高级技巧。一、列表推导...

取消回复欢迎 发表评论: