百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python读取Excel表格模块:xlrd介绍

off999 2024-09-20 22:42 24 浏览 0 评论

处理数据对Python来说,比较容易,操作简单,功能强大,短短几行代码,就可处理大量的数据信息,下面介绍Python处理Excel表格的一个模块:xlrd。

一、xlrd简介及安装

xlrd是Python处理Excel表格数据的一个模块,他可以对Excel数据进行读取,包括:

1、读取Excel的行数、列数、行的值、列的值、

2、读取单元格的值、数据类型

3、增加、删除、修改表格数据

4、导出导入工作表等

xlrd的安装比较简单,只要打开cmd命令框,然后输入:pip install xlrd即可,或者打开编译器jupyter book,然后在代码栏里输入:pip install xlrd也可以安装,然后在代码栏里输入如下代码查看是否安装成功(能看到版本号即表示安装成功):

import xlrd
xlrd.__version__    #  __ 是双下划线

二、xlrd函数介绍

1、open_workbook(path)

顾名思义,此函数就是打开工作表格,即打开一个Excel表,path为Excel文件的路径。其操作如下:

import  xlrd
xls = xlrd.open_workbook("file/编程语言排名.xls")

open_workbook()函数返回的是一个对象,即指向Excel工作表“编程语言排名.xls”的一个指针,有了这个对象,我们就可以对表格进行各种操作了。

2、获取Excel工作表中的sheet

获取打开的工作表格中的sheet表有3种方法:

2.1、xls.sheets()[索引]:索引从 0 开始,对应sheet1、sheet2、sheet3...

2.2、xls.sheet_by_index(索引):索引从 0 开始,对应sheet1、sheet2、sheet3...

2.3、xls.sheet_by_name(sheet名称):此前提是知道表格中的sheet名称

以上返回的也是一个对象,即指向所获取的sheet表格的指针,有了这个对象,就可以对sheet里的内容进行操作了,如获取行数、列数、单元格内容等,另外,可以用xls.sheet_names()获取工作表格中的所有sheet名称,如:

# 获取工作表格的3种方法
sheet1 = xls.sheets()[0]
print(sheet1)
sheet2 = xls.sheet_by_index(0)
print(sheet2)
sheet3 = xls.sheet_by_name("2019年")
print(sheet3)
# 获取工作表格的所有sheet名称
sheet_name = xls.sheet_names()
print(sheet_name)

执行结果:

3、nrows与ncols

我们都知道row和col是行和列,那么nrows和ncols就是行数和列数了,即我们用sheet.nrows和sheet.ncols就可以获取我们所打开的工作表的函数和列数,其操作如下:

sheet_names = xls.sheet_names()   # 获取所有 sheet 表格的名称
for i in range(3):
    sheet = xls.sheets()[i]  # 获取表格 sheetx 对象
    rows = sheet.nrows       # 获取工作表格的行数
    cols = sheet.ncols       # 获取工作表格的列数
    print('表格 "{}" 总共有 {} 行,{} 列'.format(sheet_names[i],rows,cols)) # 打印输出

执行结果:

4、获取行数据的函数

对行进行数据获取有以下函数:

4.1、sheet.row(n):获取第 n 行的数据,其中 n 为行数,从 0 开始,返回该行所有单元格数据组成的列表。

4.2、sheet.row_slice(n):获取第 n 行的数据,其中 n 为行数,从 0 开始,返回该行所有单元格数据组成的列表。

4.3、sheet.row_types(rowx = n, start_colx = x, end_colx = y):获取第 n 行的数据类型,其中 start_colx 和 end_colx(若为None则获取到结束) 为列的范围,即指定行数 n,然后指定列的范围 x 和 y,可以简写为:sheet.row_types(n,x,y),返回获取的数据类型组成的列表。

注:总共有 5 种类型:0 empty,1 string,2 number,3 date,4 boolean,5 error

4.4、sheet.row_values(rowx = n, start_colx = x, end_colx = y):获取第 n 行的数据,其中 start_colx 和 end_colx(若为None则获取到结束) 为列的范围,即指定行数 n,然后指定列的范围 x 和 y,可以简写为:sheet.row_values(n,x,y)返回获取的数据组成的列表。

4.5、sheet.row_len(n):获取第 n 行的有效长度。注:列没有此函数。

data = sheet1.row(0) # 获取第 1 行的数据
print(data)
data = sheet1.row_slice(1) # 获取第 2 行的数据
print(data)
data = sheet.row_types(rowx = 0,start_colx = 0,end_colx = 5) # 获取第 1 行,第 1-5 列的数据
print(data)
data = sheet.row_values(1,0,3) # 获取第 2 行,第 1-3 列的数据
print(data)
num = sheet.row_len(0)# 获取第 1 行的有效长度
print(num)

执行结果:

5、获取行数据的函数

对列进行数据获取有以下函数:

5.1、sheet.cols(n):获取第 n 列的数据,其中 n 为列数,从 0 开始,返回该列所有单元格数据组成的列表。

5.2、sheet.col_slice(n):获取第 n 列的数据,其中 n 为列数,从 0 开始,返回该列所有单元格数据组成的列表。

5.3、sheet.col_types(colx = n, start_rowx = x, end_rowx = y):获取第 n 列的数据类型,其中 start_rowx 和 end_rowx(若为None则获取到结束) 为行的范围,即指定列数 n,然后指定行的范围 x 和 y,可以简写为:sheet.col_types(n,x,y),返回获取的数据类型组成的列表。

注:总共有 5 种类型:0 empty,1 string,2 number,3 date,4 boolean,5 error

5.4、sheet.col_values(rowx = n, start_rowx = x, end_rowx = y):获取第 n 列的数据,其中 start_rowx 和 end_rowx(若为None则获取到结束) 为行的范围,即指定列数 n,然后指定行的范围 x 和 y,可以简写为:sheet.col_values(n,x,y)返回获取的数据组成的列表。

data = sheet1.col(0) # 获取第 1 行的数据
print("第一列的数据为:",data)
data = sheet1.col_slice(1) # 获取第 2 行的数据
print("第二列的数据为:",data)
data = sheet.col_types(colx = 0,start_rowx = 0,end_rowx = 5) # 获取第 1 行,第 1-5 列的数据
print("第一列,第1-5行的数据为:",data)
data = sheet.col_values(1,0,3) # 获取第 2 行,第 1-3 列的数据
print("第二列,第1-3行的数据为:",data)

执行结果:

6、获取单元格数据的函数

对单元格进行数据获取有以下函数:

6.1、sheet.cell(rowx = n, colx = m):获取第 n 行,第 m 列对应的单元格数据(返回的是单元格类型数据,要想获取数据本身,可以使用sheet.cell(n, m).value)。

6.2、sheet.cell_type(rowx = n, colx = m):获取第 n 行,第 m 列对应的单元格数据类型。

6.3、sheet.cell_value(rowx = n, colx = m):获取第 n 行,第 m 列对应的单元格数据。

data = sheet.cell(rowx = 2, colx = 3)  # 获取第 3 行,第 4 列对应的单元格数据
print("第 3 行,第 4 列对应的单元格数据为:",data)
print("第 3 行,第 4 列对应的单元格数据为:",data.value)
data = sheet.cell_type(2,3)  # 获取第 3 行,第 4 列对应的单元格数据类型
print("第 3 行,第 4 列对应的单元格数据类型为:",data)
data = sheet.cell_value(2,1)  # 获取第 3 行,第 2 列对应的单元格数据
print("第 3 行,第 2 列对应的单元格数据为:",data)

执行结果:

7、整体操作

下面的例子为获取工作表格“编程语言排名.xls”所有数据:

import xlrd # 导入模块

table = xlrd.open_workbook("file/编程语言排名.xls") # 打开本地Excel表格:编程语言排名.xls
sheet_names = table.sheet_names() # 获取工作簿的所有表格名称
for i in range(len(sheet_names)): # 依次获取表格数据
    sheet = table.sheets()[i]
    rows = sheet.nrows
    for j in range(rows): # 循环打印表格数据
        data = sheet.row_values(j,0,None)
        print("表格 {} 第 {} 行的数据为:{}".format(sheet_names[i],j+1,data))
    print("-"*100)

执行结果:

以上为Python操作Excel表格的模块xlrd的简单介绍,这个比较简单,当然还有其他的操作模块,如pandas,后续会介绍。

相关推荐

python入门到脱坑经典案例—清空列表

在Python中,清空列表是一个基础但重要的操作。clear()方法是最直接的方式,但还有其他方法也可以实现相同效果。以下是详细说明:1.使用clear()方法(Python3.3+推荐)...

python中元组,列表,字典,集合删除项目方式的归纳

九三,君子终日乾乾,夕惕若,厉无咎。在使用python过程中会经常遇到这四种集合数据类型,今天就对这四种集合数据类型中删除项目的操作做个总结性的归纳。列表(List)是一种有序和可更改的集合。允许重复...

Linux 下海量文件删除方法效率对比,最慢的竟然是 rm

Linux下海量文件删除方法效率对比,本次参赛选手一共6位,分别是:rm、find、findwithdelete、rsync、Python、Perl.首先建立50万个文件$testfor...

数据结构与算法——链式存储(链表)的插入及删除,

持续分享嵌入式技术,操作系统,算法,c语言/python等,欢迎小友关注支持上篇文章我们讲述了链表的基本概念及一些查找遍历的方法,本篇我们主要将一下链表的插入删除操作,以及采用堆栈方式如何创建链表。链...

Python自动化:openpyxl写入数据,插入删除行列等基础操作

importopenpyxlwb=openpyxl.load_workbook("example1.xlsx")sh=wb['Sheet1']写入数据#...

在Linux下软件的安装与卸载(linux里的程序的安装与卸载命令)

通过apt安装/协助软件apt是AdvancedPackagingTool,是Linux下的一款安装包管理工具可以在终端中方便的安装/卸载/更新软件包命令使用格式:安装软件:sudoapt...

Python 批量卸载关联包 pip-autoremove

pip工具在安装扩展包的时候会自动安装依赖的关联包,但是卸载时只删除单个包,无法卸载关联的包。pip-autoremove就是为了解决卸载关联包的问题。安装方法通过下面的命令安装:pipinsta...

用Python在Word文档中插入和删除文本框

在当今自动化办公需求日益增长的背景下,通过编程手段动态管理Word文档中的文本框元素已成为提升工作效率的关键技术路径。文本框作为文档排版中灵活的内容容器,既能承载多模态信息(如文字、图像),又可实现独...

Python 从列表中删除值的多种实用方法详解

#Python从列表中删除值的多种实用方法详解在Python编程中,列表(List)是一种常用的数据结构,具有动态可变的特性。当我们需要从列表中删除元素时,根据不同的场景(如按值删除、按索引删除、...

Python 中的前缀删除操作全指南(python删除前导0)

1.字符串前缀删除1.1使用内置方法Python提供了几种内置方法来处理字符串前缀的删除:#1.使用removeprefix()方法(Python3.9+)text="...

每天学点Python知识:如何删除空白

在Python中,删除空白可以分为几种不同的情况,常见的是针对字符串或列表中空白字符的处理。一、删除字符串中的空白1.删除字符串两端的空白(空格、\t、\n等)使用.strip()方法:s...

Linux系统自带Python2&yum的卸载及重装

写在前面事情的起因是我昨天在测试Linux安装Python3的shell脚本时,需要卸载Python3重新安装一遍。但是通过如下命令卸载python3时,少写了个3,不小心将系统自带的python2也...

如何使用Python将多个excel文件数据快速汇总?

在数据分析和处理的过程中,Excel文件是我们经常会遇到的数据格式之一。本文将通过一个具体的示例,展示如何使用Python和Pandas库来读取、合并和处理多个Excel文件的数据,并最终生成一个包含...

【第三弹】用Python实现Excel的vlookup功能

今天继续用pandas实现Excel的vlookup功能,假设我们的2个表长成这样:我们希望把Sheet2的部门匹在Sheet1的最后一列。话不多说,先上代码:importpandasaspd...

python中pandas读取excel单列及连续多列数据

案例:想获取test.xls中C列、H列以后(当H列后列数未知时)的所有数据。importpandasaspdfile_name=r'D:\test.xls'#表格绝对...

取消回复欢迎 发表评论: