百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Excel合并100个表格要1小时?Python3秒搞定!附代码

off999 2025-06-08 23:24 23 浏览 0 评论

### **Python 3秒合并100个Excel表格(附完整代码)**

**别再手动复制粘贴了!用Python一键批量合并,效率提升1200倍!**


---


#### ** 适用场景**

- 每月汇总100+分公司报表

- 合并多个系统导出的Excel文件

- 快速整合微信/邮箱收到的零散数据表


---


### ** 核心代码(10行搞定)**

```python

import pandas as pd

import os


# 1. 获取所有Excel文件(自动跳过非Excel文件)

all_files = [f for f in os.listdir() if f.endswith(('.xlsx', '.xls'))]


# 2. 读取并合并所有表格(忽略表头差异)

combined_data = pd.concat([pd.read_excel(f) for f in all_files], ignore_index=True)


# 3. 保存为新文件(自动去重)

combined_data.to_excel("合并结果.xlsx", index=False)

print(f"合并完成!共处理 {len(all_files)} 个文件,总数据量:{len(combined_data)} 行")

```


---


### ** 进阶优化版(解决常见痛点)**

#### **痛点1:表格结构不同?自动对齐列名**

```python

# 添加列名一致性处理

combined_data = pd.concat(

[pd.read_excel(f).rename(columns=lambda x: x.strip()) for f in all_files], # 去除列名空格

join='outer', # 自动填充缺失列

ignore_index=True

)

```


#### **痛点2:只要特定Sheet?**

```python

# 只合并每个文件的第2个Sheet(索引从0开始)

combined_data = pd.concat([pd.read_excel(f, sheet_name=1) for f in all_files])

```


#### **痛点3:超大数据量?分块处理**

```python

# 分块读取避免内存爆炸(适合10万+行数据)

chunks = [pd.read_excel(f, chunksize=5000) for f in all_files]

combined_data = pd.concat([chunk for chunk_list in chunks for chunk in chunk_list])

```


---


### ** 效率对比**

| 方法 | 100个文件(各1000行) | 错误率 | 内存占用 |

|---------------|----------------------|--------|----------|

| 手动复制粘贴 | 1小时+ | 高 | - |

| Python处理 | **3秒** | 零 | <500MB |


---


### ** 异常处理增强版**

```python

from tqdm import tqdm # 进度条显示


success, fail = 0, 0

for f in tqdm(all_files):

try:

df = pd.read_excel(f)

combined_data = pd.concat([combined_data, df], ignore_index=True)

success += 1

except Exception as e:

print(f"文件 {f} 读取失败: {str(e)}")

fail += 1


print(f"成功合并 {success} 个文件,失败 {fail} 个")

```


---


### ** 职场实战案例**

**场景**:每月需要合并全国200家门店的销售报表

- **传统方法**:人工打开每个文件 → 复制数据 → 粘贴到总表 → 检查格式(耗时4小时)

- **Python方案**:

1. 把所有Excel扔进同一个文件夹

2. 双击运行脚本(3秒完成)

3. 自动生成带时间戳的合并文件:`合并结果_20240515.xlsx`


**效果**:

- 全年节省 **48小时**(每月4小时×12月)

- 避免手工操作导致的 **漏合并/错位** 问题


---


### ** 注意事项**

1. **文件编码**:遇到中文乱码时,添加`encoding='gbk'`参数

```python

pd.read_excel(f, encoding='gbk')

```

2. **版本兼容**:

- 处理`.xls`老文件需安装`xlrd`库

- 超大文件建议使用`openpyxl`引擎

```python

pd.read_excel(f, engine='openpyxl')

```


---


### ** 完整脚本下载**

访问GitHub获取带GUI界面的增强版:[ExcelMerger工具](
https://github.com/yourname/excel-merger)

(功能:自定义Sheet选择、自动去重、邮件发送结果)


---


**从此告别Excel卡死!** 如果遇到特殊需求(如合并保留原格式),欢迎留言具体场景,我会提供定制方案!

相关推荐

Python Flask 容器化应用链路可观测

简介Flask是一个基于Python的轻量级Web应用框架,因其简洁灵活而被称为“微框架”。它提供了Web开发所需的核心功能,如请求处理、路由管理等,但不会强制开发者使用特定的工具或库。...

Python GUI应用开发快速入门(python开发软件教程)

一、GUI开发基础1.主流GUI框架对比表1PythonGUI框架比较框架特点适用场景学习曲线Tkinter内置库,简单小型应用,快速原型平缓PyQt功能强大,商用许可专业级桌面应用陡峭PySi...

【MCP实战】Python构建MCP应用全攻略:从入门到实战!

实战揭秘:Python Toga 打造跨平台 GUI 应用的神奇之旅

在Python的世界里,GUI(图形用户界面)开发工具众多,但要找到一款真正跨平台、易于使用且功能强大的工具并不容易。今天,我们就来深入探讨一下Toga——一款Python原生、操作系统原...

python应用目录规划(python的目录)

Python大型应用目录结构规划(企业级最佳实践)核心原则模块化:按业务功能拆分,高内聚低耦合可扩展性:支持插件机制和动态加载环境隔离:清晰区分开发/测试/生产环境自动化:内置标准化的构建测试部署流...

Python图形化应用开发框架:PyQt开发简介

PyQt概述定义:PyQt是Python绑定Qt框架的工具集,用于开发跨平台GUI应用程序原理:通过Qt的C++库提供底层功能,PyQt使用SIP工具生成Python绑定特点:支持Windows/ma...

[python] 基于PyOD库实现数据异常检测

PyOD是一个全面且易于使用的Python库,专门用于检测多变量数据中的异常点或离群点。异常点是指那些与大多数数据点显著不同的数据,它们可能表示错误、噪声或潜在的有趣现象。无论是处理小规模项目还是大型...

Python、Selenium 和 Allure 进行 UI 自动化测试的简单示例脚本

环境准备确保你已经安装了以下库:SeleniumAllurepytest你可以使用以下命令安装所需库:pipinstallseleniumallure-pytestpytest示例代码下面的代...

LabVIEW 与 Python 融合:打造强大测试系统的利器

在现代测试系统开发领域,LabVIEW和Python各自凭借独特优势占据重要地位。LabVIEW以图形化编程、仪器控制和实时系统开发能力见长;Python则凭借丰富的库资源、简洁语法和强大数...

软件测试进阶之自动化测试——python+appium实例

扼要:1、了解python+appium进行APP的自动化测试实例;2、能根据实例进行实训操作;本课程主要讲述用python+appium对APP进行UI自动化测试的例子。appium支持Androi...

Python openpyxl:读写样式Excel一条龙,测试报表必备!

无论你是测试工程师、数据分析师,还是想批量导出Excel的自动化工作者,只需一个库openpyxl,即可高效搞定Excel的各种需求!为什么选择openpyxl?支持.xlsx格式...

Python + Pytest 测试框架——数据驱动

引言前面已经和大家介绍过Unittest测试框架的数据驱动框架DDT,以及其实现原理。今天和大家分享的是Pytest测试框架的数据驱动,Pytest测试框架的数据驱动是由pytest自...

这款开源测试神器,圆了我玩游戏不用动手的梦想

作者:HelloGitHub-Anthony一天我在公司用手机看游戏直播,同事问我在玩什么游戏?我和他说在看直播,他恍然大悟:原来如此,我还纳闷你玩游戏,咋不用动手呢。。。。一语惊醒梦中人:玩游戏不用...

Python单元测试框架对比(pycharm 单元测试)

一、核心框架对比特性unittest(标准库)pytest(主流第三方)nose2(unittest扩展)doctest(文档测试)安装Python标准库pipinstallpytestp...

利用机器学习,进行人体33个2D姿态检测与评估

前几期的文章,我们分享了人脸468点检测与人手28点检测的代码实现过程,本期我们进行人体姿态的检测与评估通过视频进行人体姿势估计在各种应用中起着至关重要的作用,例如量化体育锻炼,手语识别和全身手势控制...

取消回复欢迎 发表评论: