百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python解决读取excel数据慢的问题

off999 2024-09-20 22:43 47 浏览 0 评论

前言:

在做自动化测试的时候,我思考了一个问题,就是如果我们的测试用例随着项目的推进越来越多时,我们做自动化回归的时间也就越来越长,其中影响自动化测试速度的一个原因就是测试用例的读取问题。用例越多,所消耗的读取用例时间也就越长,这样会消耗很多不必要的时间,所以接下来将介绍一下pandas中的pickle存储格式,pickle存储格式配合pandas的数据读取格式,极大程度上提高了数据速度,提高自动化测试的工作效率!

正文:

1、首先我们要准备一个excel,里面存放1048576行数据(这也是excel单个sheet的最大存储容量)。如果觉得准备这个数据很麻烦呢,也可以先准备一个小数据的excel文件,通过一个循环写入来创建这个大数据量的文件,下面提供思路代码:

import pandas as pd

"""利用pandas来读写数据"""
path = r"D:\software\pycharm\PythonApiHeaders\tools\new.xlsx"  
# 读取数据
df = pd.read_excel(path, sheet_name="strategy")  
result = []  
i = 0  
# 循环复制excel中的数据存放在result列表中
while i < 10:  
    i += 1  
    list1 = list(copy.deepcopy(df.values))  # 深拷贝
    result += list1  
    print("result len is :", len(result))  
# print(result[:1])  
# 创建一个新的dataframe对象,取好列名
df = pd.DataFrame(result,  
                  columns=["Case_id", "Checkpoints", "Child_checkpoint", "Priority", "title",  
                           "Is_upload", "Method", "Url", "Headers", "Json",  
                           "Data", "Params", "setup_sql", "Expected_results", "Extract_data",  
                           "Actual_results", "assert_db", "Tester", "Test_result", "Type"  
                           ])  
# 写入到excel中,指定好sheet名称
df.to_excel(path, index=False, sheet_name="strategy")  
# 打印写入到excel的数据长度
print(len(result))  

2、接着,我们来查看一下常规使用openpyxl读取excel数据的消耗时间:

import time  
import pandas as pd  
  
file_path = r"D:\software\pycharm\PythonApiHeaders\tools\new.xlsx"  
print("read excel start!")  
cl = HandleExcel(filename=file_path)  
start = time.time()  
result = cl.get_excel_test_cases(sheet_name="strategy")  
cost = time.time() - start  
print("read excel cost:", cost)
"""打印结果"""
read excel start!
read excel cost: 5.965034008026123

可以看出读取单个sheet,花费了近6s,如果我们还要读取多个模块的话,这个时间可以想象会消耗非常多的时间!

3、然后我们可以看一下读取pickle存储方式的数据消耗的时间。首先我们要准备一个pickle存储方式的文件!这个就很难了!其实也不难,利用pandas就可以一键转换啦,非常方便。

import time  
import pandas as pd 

file_path = r"D:\software\pycharm\PythonApiHeaders\tools\new.xlsx" 
# 设置pandas读取excel对象
df = pd.read_excel(file_path)  
# 输出pickle文件
df.to_pickle("new.pkl")

4、生成pickle文件之后,我们就可以读取pkl文件了,然后看一下读取时间:

import time  
import pandas as pd 

start = time.time()  
df = pd.read_pickle("new.pkl")  
cost2 = time.time() - start  
print("read pkl cost:", cost2)
# 打印结果
read pkl cost: 0.06400060653686523

5、最后我们看一下读取pkl和读取excel消耗时间的对比:

print("excel / pkl:", cost / cost2)

# 打印结果
excel / pkl: 93.20277307981732

我们可以发现读取excel文件所消耗的时间是读取pkl文件的93倍!如果是读取多个sheet页的话,这个性能可能还会更高!

相关推荐

photoshop6序列号(photoshop8.01序列号)
  • photoshop6序列号(photoshop8.01序列号)
  • photoshop6序列号(photoshop8.01序列号)
  • photoshop6序列号(photoshop8.01序列号)
  • photoshop6序列号(photoshop8.01序列号)
win10下载应用商店(win10应用商店打不开)

1、点击Win10系统的开始菜单,然后在点击应用商店;2、打开Win10应用商店后,在搜索框里输入想要搜索的应用软件,然后点击检索;3、点击搜索到的应用,点击安装;4、点击安装后,系统会提示要切换到这...

dell电脑重装系统win10(dell 重装win10系统)

戴尔笔记本重装系统win10的步骤如下:制作好wepe启动盘之后,将win10系统iso镜像直接复制到U盘。在需要重装系统的戴尔电脑上插入pe启动盘,重启后不停按F12启动快捷键,调出启动菜单对话框,...

android升级包下载安装(android 升级包)

打开手机系统更新升级,前提是官方有新系统推送才能更新  哪个大不一定,但一般规律如下:  1、小版本的更新,通常越更新越大。比如3.1更新到3.2,通常是修复bug,代码量通常会增大,体积就会增大。 ...

hdd硬盘和ssd(ssd硬盘和hdd硬盘是什么意思)

HDD硬盘和SSD硬盘是两种不同类型的电脑存储设备,它们有着以下区别:1.工作原理:HDD硬盘使用机械旋转的磁盘和读写磁头来存储和读取数据,而SSD硬盘则使用闪存存储数据,类似于USB闪存盘。2....

电脑免费软件下载大全(电脑上免费的下载软件)

正常情况下,如果我们想要在自己的电脑上面下载一个不要钱的单机游戏,那么我们是可以直接在我们的软件管理中心进行一个下载的,这个时候我们只需要通过一个权限就能够正常的下载,当然我们也是可以在一些小游戏的软...

mpp文件转换excel(mpp转换成pdf)

要将Excel表格转换为MPP格式,您可以按照以下步骤操作:1.打开Excel表格并确保数据按照项目的不同阶段或任务进行组织。2.将Excel表格中的数据复制到一个新的MicrosoftProj...

win7旗舰版开机密码忘记按f2

方法如下:开始-控制面板-用户帐户;在打开的更改用户帐户界面点击要更改的帐户;然后点击帐户左面的更改密码按钮;在打开的页面上,输入一次当前使用的密码,输入2次要更改的新密码然后保存退出就可以了...

笔记本无音频输出设备(笔记本无音频输出设备)

1、没有声卡驱动,解决方法就是找到笔记本的官网,下载电脑声卡的驱动安装即可。2、没有外界的音频播放设备,解决方法就是买一个外界的音频播放设备插到电脑主机的音频接口上即可。笔记本电脑显示未安装任何音频输...

iso文件能用手机打开吗(iso文件能用手机打开吗安全吗)

一般的压缩软件就可以打开的,比如,好压软件,这个打开只是解压形式的,如果你说的是运行iso文件,这个没有,况且安卓系统也不支持iso运行ISO文件一般用于光盘镜像文件的存储,如果想要在手机上运行ISO...

win7系统卡顿怎么优化(win7很慢很卡怎么优化)

1、首先打开安全卫士,进入安全卫士首页,单击软件窗口右下角的“更多”图标,打开扩展应用程序。2、单击选择“我的工具”。3、在我的工具菜单里面找到“人工服务”单击打开人工服务。4、在人工服务对话框有很多...

如何查看c盘微信聊天记录(如何查看c盘微信聊天记录内存大小)

微信群中的消息只要没删除基本都能保存,想要找微信群中几个多月前的消息可以直接根据日期来查找聊天记录。操作如下:1、打开想要查找记录的微信群,点击右上角人形图标;2、点击查找聊天内容;3、选择按日...

office2016家庭版激活密钥(office家庭版激活码2019)

走淘宝吧,因为零售版的密钥只能用一次。大概几块钱就能激活2016。如果你不在乎钱的话可以向我一样,订阅一个office365.实在不行可以和几个人一起买一个家庭版的365.出现这个情况,找微软申诉是没...

移动硬盘驱动器下载安装(移动硬盘驱动器下载安装教程)

1、右键单击您的桌面,选择“新建文件夹”,并命名该文件夹(例如“usb驱动程序”);2、然后到本站下载驱动程序;3、将其解压缩至在您的桌面上刚刚创建的usb驱动程序文件夹;4、单击开始菜单,然后选择设...

电脑硬盘格式化工具(电脑 格式化硬盘)

硬盘格式化工具很多,PQMACGIG8.0(中文就叫硬盘分区魔法师)是比较好的一个,这个是在WINDOWS下比叫好用,(个人感觉)FDISK也是比较好的一个,这个一般用在DOS下分区格式化WIN...

取消回复欢迎 发表评论: