python读取超大excel文件入库(实测有效)
off999 2024-09-20 22:43 35 浏览 0 评论
"""
python读取超大excel文件写入数据库
excel文件:963592行(103个字段),506M
pycharm环境实测结果
读取文件耗时962.133秒钟,数据入库耗时1014.695秒钟(每1000次提交)
读取文件耗时948.566秒钟,数据入库耗时 929.869秒钟(每2000次提交)
读取文件耗时675.909秒钟,数据入库耗时 954.594秒钟(每3000次提交)
cmd环境实测结果
读取文件耗时1028.828秒钟,数据入库耗时1047.366秒钟(每1000次提交)
读取文件耗时 921.494秒钟,数据入库耗时 909.528秒钟(每2000次提交)
读取文件耗时1131.165秒钟,数据入库耗时 965.251秒钟(每3000次提交)
"""
def read_excel_by_xlrd(file):
print("文件名[", os.path.basename(file), "]")
print("开始读取文件", datetime.datetime.now())
t0 = time.time()
wb = xlrd.open_workbook(file)
sheets = wb.sheets()
t1 = time.time()
print("完成文件读取", datetime.datetime.now())
for sheet_index in range(0, len(sheets)): # 对每个sheet分别入库
sheet = sheets[sheet_index]
wb.sheet_loaded(sheet.name) # 检查某个sheet是否导入完毕
tt0 = time.time()
print("开始对sheet[", sheet.name, "]进行入库操作", datetime.datetime.now())
mysqlHelper = mysqlConnHelper.mysqlHelper('地址', '端口号', '数据库账号', '数据库密码', '数据库名')
sql = "INSERT INTO 表名 (字段1,字段2,....) VALUES (%s, %s, ...)"
# 从表中取单元格
rowCount = sheet.nrows
columnCount = sheet.ncols
rowsdata = [] # 存放多行数据的列表
for i in range(3, rowCount): # 跳过前三行(第一、二行为空白行,第三行为标题),从第四行开始读取
rowdata = [] # 存放一行数据的列表
for j in range(0, columnCount):
rowdata.append(sheet.cell_value(i, j))
# 批量入库
rowsdata.append(tuple(rowdata))
# mysqlHelper.insertDatas(sql, rowsdata) # insertDatas入参为包含元组的列表
if i != 0 and i % 2000 == 0:
mysqlHelper.insertDatas(sql, rowsdata) # 每2000笔执行一次入库操作
rowsdata = []
print("\t[", sheet.name, "]数据入库进度[", i, "/", rowCount - 3, "]")
if len(rowsdata) != 0: # 批量入库最后再执行一次批处理提交操作
mysqlHelper.insertDatas(sql, rowsdata) # insertDatas入参为包含元组的列表
print("\t[", sheet.name, "]数据入库进度[", rowCount - 3, "/", rowCount - 3, "]")
tt1 = time.time()
print("\t[", sheet.name, "]入库完成, 耗时%0.3f秒" % (tt1 - tt0), datetime.datetime.now())
t2 = time.time()
print('读取文件耗时%0.3f秒(%0.3f分钟)' % ((t1 - t0), (t1 - t0) / 60))
print('数据入库耗时%0.3f秒(%0.3f分钟)' % ((t2 - t1), (t2 - t1) / 60))
print('共耗时%0.3f秒(%0.3f分钟)' % ((t2 - t0), (t2 - t0) / 60))
if __name__ == '__main__':
file = r'F:\Download\数据.xlsx'
read_excel_by_xlrd(file)
相关推荐
- wps官方下载(wps官方下载官网电脑版网址)
-
具体的步骤如下:1、首先在电脑上打开浏览器,在浏览器中输入“WPS”,找到WPS官方网站。2、接下来进入WPS官方网站中,找到WPS软件,点击“免费下载”。3、点击下载后在弹出来的对话框中修改下载位置...
- win vista与win7有什么区别(win7与vista关系)
-
WindowsVista和Windows7是微软公司推出的两个桌面操作系统,它们之间有以下主要区别:1.界面设计:Windows7的界面设计更加简洁明了,而WindowsVista的界面...
- winxp系统版本(winxp 版本)
-
1、微软官方3个版本:WINDOWSXPHOME(家庭版)、Professional(专业版)、MediaCenter2005(媒体中心版),每个版本的功能不一样。使用最多的是Professional...
- 打印机无法共享怎么回事(打印机无法共享出去)
-
共享打印机无法打印原因一:可能是由于病毒死机解决方法:确定是否由于病毒死机,找一张干净(确信无病毒)的系统盘,从A驱动舒上启动电脑,检查此时打印机和主机能否联机。如果正常联机,估计这种故障是由攻击硬件...
- ipv6无网络访问权限怎么解决
-
ipv6无网络访问权限解决方法如下1、点击电脑左下角的开始,进入到开始的菜单栏,在菜单栏中找到“运行”。或者通过快捷键Windows+R打开运行窗口。 2、打开运行的窗口页面后,在页面上输入“CMD...
- office ltsc版(Office LTSC版本区别)
-
office2021和2021ltsc的区别如下:1.更新策略不同。前者采用每个月月度更新的方法,提供功能更新、安全更新。后者不采用每个月月度更新的方法,且不提供功能更新。2.界面不同。2021采用了...
- 安装win7需要激活吗(现在安装win7旗舰版还需密钥吗)
-
要激活 Windows7如果是预装在计算机中的,买来之后便不用激活,这里预装指的是在厂商那里。正版的Windows7安装到计算机中,有三十天的试用期,若要永久使用,就要使...
- originos 3升级计划公布(originos升级包)
-
2023年2月。1.OriginOS3.0系统第一批升级时间为11月25日。2、包含iQOONeo7,X80系列,S15系列,iQOO9、iQOO10系列,以及折叠屏XFold系列和大屏XNo...
- 鸿蒙系统适配第三方机型(鸿蒙 第三方适配)
-
最新华为官方公布了鸿蒙系统3.0支持的机型名单,具体如下。鸿蒙系统3.0升级名单:1.Mate系列:MateXs2、MateX2、MateXs、Mate40、Mate40Pro、Mate...
- imei怎么下载(imei changer apk)
-
如果您的steam序列号激活了,可以尝试以下方法下载:1.使用steam自带的下载工具,如“下载工具”,在软件的“下载”选项卡中选择“序列号下载”。2.在下载页面中,选择要下载的游戏,然后点击“下...
- 电脑系统优化软件哪个好(系统优化软件排行榜)
-
有必要用,非常好用,WINDOWS优化大师是一个网络上下载率极高的系统维护软件。多年未曾清理过系统和硬盘的电脑,系统内部将产生大量的垃圾文件、临时文件、废旧程序等等win10系统不需要经常更新,关闭...
- 重装系统后硬盘不见了(重装系统后磁盘不见了)
-
硬盘不见可能是因为重装系统时未正确安装驱动程序或未对硬件进行正确设置。你可以按以下步骤排查问题:进入BIOS检查硬盘是否被识别,尝试重新连接数据线和电源线,更新或安装适当的硬件驱动程序,或者使用硬件故...
- 冰封u盘装win7系统教程图解(冰封u盘启动装机教程)
-
1.查找激活工具:通常来说,Win7冰封系统已经包含了必要的驱动,所以如果你的电脑上并没有出现设备错误,那你就可以正常使用。如果你需要添加任何驱动,请尝试从厂商下载相应的驱动并执行自动安装程序。如果...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
慕ke 前端工程师2024「完整」
-
失业程序员复习python笔记——条件与循环
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
