百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

python读取超大excel文件入库(实测有效)

off999 2024-09-20 22:43 43 浏览 0 评论


"""
python读取超大excel文件写入数据库

excel文件:963592行(103个字段),506M

pycharm环境实测结果
读取文件耗时962.133秒钟,数据入库耗时1014.695秒钟(每1000次提交)
读取文件耗时948.566秒钟,数据入库耗时  929.869秒钟(每2000次提交)
读取文件耗时675.909秒钟,数据入库耗时  954.594秒钟(每3000次提交)

cmd环境实测结果
读取文件耗时1028.828秒钟,数据入库耗时1047.366秒钟(每1000次提交)
读取文件耗时  921.494秒钟,数据入库耗时  909.528秒钟(每2000次提交)
读取文件耗时1131.165秒钟,数据入库耗时  965.251秒钟(每3000次提交)
"""


def read_excel_by_xlrd(file):
    print("文件名[", os.path.basename(file), "]")
    print("开始读取文件", datetime.datetime.now())
    t0 = time.time()
    wb = xlrd.open_workbook(file)
    sheets = wb.sheets()
    t1 = time.time()
    print("完成文件读取", datetime.datetime.now())

    for sheet_index in range(0, len(sheets)):  # 对每个sheet分别入库
        sheet = sheets[sheet_index]

        wb.sheet_loaded(sheet.name)  # 检查某个sheet是否导入完毕
        tt0 = time.time()
        print("开始对sheet[", sheet.name, "]进行入库操作", datetime.datetime.now())

        mysqlHelper = mysqlConnHelper.mysqlHelper('地址', '端口号', '数据库账号', '数据库密码', '数据库名')
        sql = "INSERT INTO 表名 (字段1,字段2,....)  VALUES (%s, %s, ...)"

        # 从表中取单元格
        rowCount = sheet.nrows
        columnCount = sheet.ncols
        rowsdata = []  # 存放多行数据的列表
        for i in range(3, rowCount):  # 跳过前三行(第一、二行为空白行,第三行为标题),从第四行开始读取
            rowdata = []  # 存放一行数据的列表
            for j in range(0, columnCount):
                rowdata.append(sheet.cell_value(i, j))

            # 批量入库
            rowsdata.append(tuple(rowdata))
            # mysqlHelper.insertDatas(sql, rowsdata)  # insertDatas入参为包含元组的列表
            if i != 0 and i % 2000 == 0:
                mysqlHelper.insertDatas(sql, rowsdata)  # 每2000笔执行一次入库操作
                rowsdata = []
                print("\t[", sheet.name, "]数据入库进度[", i, "/", rowCount - 3, "]")

        if len(rowsdata) != 0:  # 批量入库最后再执行一次批处理提交操作
            mysqlHelper.insertDatas(sql, rowsdata)  # insertDatas入参为包含元组的列表
            print("\t[", sheet.name, "]数据入库进度[", rowCount - 3, "/", rowCount - 3, "]")

        tt1 = time.time()
        print("\t[", sheet.name, "]入库完成, 耗时%0.3f秒" % (tt1 - tt0), datetime.datetime.now())

    t2 = time.time()
    print('读取文件耗时%0.3f秒(%0.3f分钟)' % ((t1 - t0), (t1 - t0) / 60))
    print('数据入库耗时%0.3f秒(%0.3f分钟)' % ((t2 - t1), (t2 - t1) / 60))
    print('共耗时%0.3f秒(%0.3f分钟)' % ((t2 - t0), (t2 - t0) / 60))


if __name__ == '__main__':
    file = r'F:\Download\数据.xlsx'
    read_excel_by_xlrd(file)

相关推荐

photoshop6序列号(photoshop8.01序列号)
  • photoshop6序列号(photoshop8.01序列号)
  • photoshop6序列号(photoshop8.01序列号)
  • photoshop6序列号(photoshop8.01序列号)
  • photoshop6序列号(photoshop8.01序列号)
win10下载应用商店(win10应用商店打不开)

1、点击Win10系统的开始菜单,然后在点击应用商店;2、打开Win10应用商店后,在搜索框里输入想要搜索的应用软件,然后点击检索;3、点击搜索到的应用,点击安装;4、点击安装后,系统会提示要切换到这...

dell电脑重装系统win10(dell 重装win10系统)

戴尔笔记本重装系统win10的步骤如下:制作好wepe启动盘之后,将win10系统iso镜像直接复制到U盘。在需要重装系统的戴尔电脑上插入pe启动盘,重启后不停按F12启动快捷键,调出启动菜单对话框,...

android升级包下载安装(android 升级包)

打开手机系统更新升级,前提是官方有新系统推送才能更新  哪个大不一定,但一般规律如下:  1、小版本的更新,通常越更新越大。比如3.1更新到3.2,通常是修复bug,代码量通常会增大,体积就会增大。 ...

hdd硬盘和ssd(ssd硬盘和hdd硬盘是什么意思)

HDD硬盘和SSD硬盘是两种不同类型的电脑存储设备,它们有着以下区别:1.工作原理:HDD硬盘使用机械旋转的磁盘和读写磁头来存储和读取数据,而SSD硬盘则使用闪存存储数据,类似于USB闪存盘。2....

电脑免费软件下载大全(电脑上免费的下载软件)

正常情况下,如果我们想要在自己的电脑上面下载一个不要钱的单机游戏,那么我们是可以直接在我们的软件管理中心进行一个下载的,这个时候我们只需要通过一个权限就能够正常的下载,当然我们也是可以在一些小游戏的软...

mpp文件转换excel(mpp转换成pdf)

要将Excel表格转换为MPP格式,您可以按照以下步骤操作:1.打开Excel表格并确保数据按照项目的不同阶段或任务进行组织。2.将Excel表格中的数据复制到一个新的MicrosoftProj...

win7旗舰版开机密码忘记按f2

方法如下:开始-控制面板-用户帐户;在打开的更改用户帐户界面点击要更改的帐户;然后点击帐户左面的更改密码按钮;在打开的页面上,输入一次当前使用的密码,输入2次要更改的新密码然后保存退出就可以了...

笔记本无音频输出设备(笔记本无音频输出设备)

1、没有声卡驱动,解决方法就是找到笔记本的官网,下载电脑声卡的驱动安装即可。2、没有外界的音频播放设备,解决方法就是买一个外界的音频播放设备插到电脑主机的音频接口上即可。笔记本电脑显示未安装任何音频输...

iso文件能用手机打开吗(iso文件能用手机打开吗安全吗)

一般的压缩软件就可以打开的,比如,好压软件,这个打开只是解压形式的,如果你说的是运行iso文件,这个没有,况且安卓系统也不支持iso运行ISO文件一般用于光盘镜像文件的存储,如果想要在手机上运行ISO...

win7系统卡顿怎么优化(win7很慢很卡怎么优化)

1、首先打开安全卫士,进入安全卫士首页,单击软件窗口右下角的“更多”图标,打开扩展应用程序。2、单击选择“我的工具”。3、在我的工具菜单里面找到“人工服务”单击打开人工服务。4、在人工服务对话框有很多...

如何查看c盘微信聊天记录(如何查看c盘微信聊天记录内存大小)

微信群中的消息只要没删除基本都能保存,想要找微信群中几个多月前的消息可以直接根据日期来查找聊天记录。操作如下:1、打开想要查找记录的微信群,点击右上角人形图标;2、点击查找聊天内容;3、选择按日...

office2016家庭版激活密钥(office家庭版激活码2019)

走淘宝吧,因为零售版的密钥只能用一次。大概几块钱就能激活2016。如果你不在乎钱的话可以向我一样,订阅一个office365.实在不行可以和几个人一起买一个家庭版的365.出现这个情况,找微软申诉是没...

移动硬盘驱动器下载安装(移动硬盘驱动器下载安装教程)

1、右键单击您的桌面,选择“新建文件夹”,并命名该文件夹(例如“usb驱动程序”);2、然后到本站下载驱动程序;3、将其解压缩至在您的桌面上刚刚创建的usb驱动程序文件夹;4、单击开始菜单,然后选择设...

电脑硬盘格式化工具(电脑 格式化硬盘)

硬盘格式化工具很多,PQMACGIG8.0(中文就叫硬盘分区魔法师)是比较好的一个,这个是在WINDOWS下比叫好用,(个人感觉)FDISK也是比较好的一个,这个一般用在DOS下分区格式化WIN...

取消回复欢迎 发表评论: