使用pandas读取excel（使用pandas读取excel文件的代码示例）

off999 2024-10-11 13:59 49 浏览 0 评论

摘要：Excel是微软的经典之作，在日常工作中的数据整理、分析和可视化方面，有其独到的优势。但如果数据量超大，Excel的劣势也就随之而来，甚至因为内存溢出无法打开文件，后续的分析更是难上加难。那么，有什么更好的解决办法吗？工欲善其事，必先利其器，在这里我们介绍使用Python的pandas数据分析包的read_excel()方法来解决此问题。

pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, parse_dates=False, date_parser=None, thousands=None, comment=None, skipfooter=0, convert_float=True, **kwds)

pandas读取Excel后返回DataFrame，接下来我们就pd.read_excel()常用参数进行详细解析。

io，即Excel工作簿的存储路径，建议使用英文路径以及英文命名方式。

import pandas as pd
io = r'C:\Users\Administrator\Desktop\data.xlsx'

sheet_name，要读取的工作表名，可以是整型数字、列表名或SheetN，也可以是上述三种组成的列表。

整型数字：目标sheet所在的位置，以0为起始，sheet_name = 1代表第2个工作表。

data = pd.read_excel(io, sheet_name = 1)
data.head()

列表名：目标sheet的名称，中英文皆可。

data = pd.read_excel(io, sheet_name = '英超射手榜')
data.head()

SheetN：代表第N个sheet，S要大写，注意与整型数字的区别。

data = pd.read_excel(io, sheet_name = 'Sheet5')
data.head()

组合列表： sheet_name = [0, '英超射手榜', 'Sheet4']，代表读取三个工作表，分别为第1个工作表、名为“英超射手榜”的工作表和第4个工作表，显然，Sheet4未经重命名。
sheet_name 默认为0，取Excel第一个工作表。如果读取多个工作表，则显示表格的字典。因此对于初学者而言，建议每次读取一个工作表，然后进行二次整合。

data = pd.read_excel(io, sheet_name = ['英超积分榜', '西甲积分榜'], nrows = 5)
# sheet_name = ['英超积分榜', '西甲积分榜'] ，返回两个工作表组成的字典
data

header，哪一行用作列名，默认为0 ，如果设置为[0,1]，则表示将前两行作为多重索引

data = pd.read_excel(io, sheet_name = '英超积分榜', header = [0,1]) 
# 前两行作为列名。
data.head()

names，用自定义的列名作为最终的列名。一般适用于Excel缺少列名，或者需要重新定义列名的情况。注意：names的长度必须和Excel列长度一致，否则会报错。

data = pd.read_excel(io, sheet_name = '英超射手榜', 
 names = ['rank','player','club','goal','common_goal','penalty'])
data.head()

index_col，用以作为索引的列，可以是工作表列名称（index_col = '排名'），也可以是整型或整型列表（index_col = 0 或 [0, 1]），如果选择多个列，则返回多重索引。

data = pd.read_excel(io, sheet_name = '英超射手榜', index_col = '排名')
data.head()

data = pd.read_excel(io, sheet_name = '英超射手榜', index_col = [0, 1])
data.head()

usecols，需要读取哪些列。可以使用整型（从0开始，如[0,2,3]）或者“A”、“B”等字母（Excel常用），如“A：C, E” ="A, B, C, E"，并且两边都包括。

data = pd.read_excel(io, sheet_name = '西甲射手榜', usecols = [0, 1, 3])
data.head()

data = pd.read_excel(io, sheet_name = '西甲射手榜', usecols = 'A:C, E')
data.head()

squeeze，如果数据仅包含一列，squeeze为True时，返回Series，反之返回DataFrame。

data = pd.read_excel(io, sheet_name = 'squeeze', squeeze = True)
data.head()

data = pd.read_excel(io, sheet_name = 'squeeze', squeeze = False)
data.head()

converters ，强制规定列的数据类型，converters = {'排名': str, '场次': int}，将“排名”列数据类型强制规定为字符串，“场次”为整型，主要用途：保留以文本形式存储的数字。

data = pd.read_excel(io, sheet_name = 'converters', converters = {'排名': str, '场次': float})
data['排名'].dtype

skiprows = n，表示跳过前n行数据； skiprows = [a, b, c]，表示跳过第a,b,c行数据（索引从0开始）。使用skiprows 后，有可能首行（即列名）也会被跳过。

data = pd.read_excel(io, sheet_name = '英超射手榜', skiprows = [1,2,3]) 
# 跳过第2,3,4行数据（索引从0开始，包括列名）
data.head()

data = pd.read_excel(io, sheet_name = '英超射手榜', skiprows = 3)
data.head()

nrows ，需要读取的行数，如果数据量太过庞大，或者只想了解Excel的列名及概况，nrows会十分有用。

data = pd.read_excel(io, sheet_name = '英超射手榜', nrows = 10)
data

skipfooter = n，跳过末尾n行（索引从0开始）。

data = pd.read_excel(r'C:\Users\Administrator\Desktop\data.xlsx' , 
 sheet_name = '英超射手榜', skipfooter = 43)
# skipfooter = 43， 跳过末尾43行（索引从0开始）
data

***新手自学，欢迎拍砖***

python读取xlsx文件

上一篇：Python使用xlrd和xlwt读写Excel的简单用法
下一篇：Python读写Excel表格，就是这么简单粗暴又好用

使用pandas读取excel（使用pandas读取excel文件的代码示例）

io，即Excel工作簿的存储路径，建议使用英文路径以及英文命名方式。

sheet_name，要读取的工作表名，可以是整型数字、列表名或SheetN，也可以是上述三种组成的列表。

header，哪一行用作列名，默认为0 ，如果设置为[0,1]，则表示将前两行作为多重索引

names，用自定义的列名作为最终的列名。一般适用于Excel缺少列名，或者需要重新定义列名的情况。注意：names的长度必须和Excel列长度一致，否则会报错。

index_col，用以作为索引的列，可以是工作表列名称（index_col = '排名'），也可以是整型或整型列表（index_col = 0 或 [0, 1]），如果选择多个列，则返回多重索引。

usecols，需要读取哪些列。可以使用整型（从0开始，如[0,2,3]）或者“A”、“B”等字母（Excel常用），如“A：C, E” ="A, B, C, E"，并且两边都包括。

squeeze，如果数据仅包含一列，squeeze为True时，返回Series，反之返回DataFrame。

converters ，强制规定列的数据类型，converters = {'排名': str, '场次': int}，将“排名”列数据类型强制规定为字符串，“场次”为整型，主要用途：保留以文本形式存储的数字。

skiprows = n，表示跳过前n行数据； skiprows = [a, b, c]，表示跳过第a,b,c行数据（索引从0开始）。使用skiprows 后，有可能首行（即列名）也会被跳过。

nrows ，需要读取的行数，如果数据量太过庞大，或者只想了解Excel的列名及概况，nrows会十分有用。

skipfooter = n，跳过末尾n行（索引从0开始）。

相关推荐

取消回复欢迎你发表评论:

抖音上好看的小姐姐，Python给你都下载了

飞牛NAS部署TVGate Docker项目，实现内网一键转发、代理、jx

全网最简单易懂!495页Python漫画教程，高清PDF版免费下载

win7系统还原步骤图解（win7还原电脑系统的步骤）

Python 3.14 的 UUIDv6/v7/v8 上新，别再用 uuid4 () 啦!

网盘在哪里打开（华为网盘在哪里打开）

python入门到脱坑输入与输出—str()函数

苹果手机怎么下载软件并安装

linux软件（linux软件图标）

16949认证费用是多少（16949审核员太难考了）

使用pandas读取excel（使用pandas读取excel文件的代码示例）

io，即Excel工作簿的存储路径，建议使用英文路径以及英文命名方式。

sheet_name，要读取的工作表名，可以是整型数字、列表名或SheetN，也可以是上述三种组成的列表。

header， 哪一行用作列名，默认为0 ，如果设置为[0,1]，则表示将前两行作为多重索引

names， 用自定义的列名作为最终的列名。一般适用于Excel缺少列名，或者需要重新定义列名的情况。注意：names的长度必须和Excel列长度一致，否则会报错。

index_col， 用以作为索引的列，可以是工作表列名称（index_col = '排名'），也可以是整型或整型列表（index_col = 0 或 [0, 1]），如果选择多个列，则返回多重索引。

usecols，需要读取哪些列。可以使用整型（从0开始，如[0,2,3]）或者“A”、“B”等字母（Excel常用），如“A：C, E” ="A, B, C, E"，并且两边都包括。

squeeze，如果数据仅包含一列，squeeze为True时，返回Series，反之返回DataFrame。

converters ，强制规定列的数据类型，converters = {'排名': str, '场次': int}， 将“排名”列数据类型强制规定为字符串，“场次”为整型，主要用途：保留以文本形式存储的数字。

skiprows = n， 表示跳过前n行数据； skiprows = [a, b, c]，表示跳过第a,b,c行数据（索引从0开始）。使用skiprows 后，有可能首行（即列名）也会被跳过。

nrows ，需要读取的行数，如果数据量太过庞大，或者只想了解Excel的列名及概况，nrows会十分有用。

skipfooter = n， 跳过末尾n行（索引从0开始）。

相关推荐

取消回复欢迎 你 发表评论:

抖音上好看的小姐姐，Python给你都下载了

飞牛NAS部署TVGate Docker项目，实现内网一键转发、代理、jx

全网最简单易懂!495页Python漫画教程，高清PDF版免费下载

win7系统还原步骤图解（win7还原电脑系统的步骤）

Python 3.14 的 UUIDv6/v7/v8 上新，别再用 uuid4 () 啦!

网盘在哪里打开（华为网盘在哪里打开）

python入门到脱坑 输入与输出—str()函数

苹果手机怎么下载软件并安装

linux软件（linux软件图标）

16949认证费用是多少（16949审核员太难考了）

header，哪一行用作列名，默认为0 ，如果设置为[0,1]，则表示将前两行作为多重索引

names，用自定义的列名作为最终的列名。一般适用于Excel缺少列名，或者需要重新定义列名的情况。注意：names的长度必须和Excel列长度一致，否则会报错。

index_col，用以作为索引的列，可以是工作表列名称（index_col = '排名'），也可以是整型或整型列表（index_col = 0 或 [0, 1]），如果选择多个列，则返回多重索引。

converters ，强制规定列的数据类型，converters = {'排名': str, '场次': int}，将“排名”列数据类型强制规定为字符串，“场次”为整型，主要用途：保留以文本形式存储的数字。

skiprows = n，表示跳过前n行数据； skiprows = [a, b, c]，表示跳过第a,b,c行数据（索引从0开始）。使用skiprows 后，有可能首行（即列名）也会被跳过。

skipfooter = n，跳过末尾n行（索引从0开始）。

取消回复欢迎你发表评论:

python入门到脱坑输入与输出—str()函数