从入门到精通:Python处理Excel文件的实用技巧
off999 2025-04-30 18:49 21 浏览 0 评论
在数据分析和处理的过程中,Excel 是一种广泛使用的数据存储和交换格式。Python 提供了多个强大的库来处理 Excel 文件,如 pandas、openpyxl 和 xlrd 等。本文将详细介绍如何使用这些库进行 Excel 文件的常用操作,包括读取、写入、修改和格式化等。
使用 pandas 处理 Excel 文件
pandas 是一个强大的数据处理和分析库,它提供了高效的 Excel 读取和写入功能。
读取 Excel 文件
使用 pandas 读取 Excel 文件非常简单,只需一行代码。
import pandas as pd
# 读取 Excel 文件
df = pd.read_excel('data.xlsx')
# 显示前几行数据
print(df.head())
写入 Excel 文件
将 DataFrame 写入 Excel 文件也同样简单。
# 创建一个 DataFrame
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']
}
df = pd.DataFrame(data)
# 写入 Excel 文件
df.to_excel('output.xlsx', index=False)
追加数据到 Excel 文件
如果需要在现有的 Excel 文件中追加数据,可以使用 ExcelWriter。
# 追加数据到现有 Excel 文件
with pd.ExcelWriter('output.xlsx', mode='a', engine='openpyxl') as writer:
df.to_excel(writer, sheet_name='NewSheet', index=False)
使用 openpyxl 处理 Excel 文件
openpyxl 是一个专门处理 Excel 文件的库,适用于处理 .xlsx 格式的文件。
读取 Excel 文件
使用 openpyxl 读取 Excel 文件并获取数据。
from openpyxl import load_workbook
# 加载 Excel 文件
wb = load_workbook('data.xlsx')
# 选择活动工作表
ws = wb.active
# 读取所有数据
data = []
for row in ws.iter_rows(values_only=True):
data.append(row)
# 打印数据
for row in data:
print(row)
写入 Excel 文件
使用 openpyxl 创建和写入 Excel 文件。
from openpyxl import Workbook
# 创建一个工作簿
wb = Workbook()
ws = wb.active
# 写入数据
ws.append(['Name', 'Age', 'City'])
ws.append(['Alice', 25, 'New York'])
ws.append(['Bob', 30, 'Los Angeles'])
ws.append(['Charlie', 35, 'Chicago'])
# 保存工作簿
wb.save('output.xlsx')
修改 Excel 文件
打开现有的 Excel 文件,修改其中的数据,并保存更改。
# 加载现有 Excel 文件
wb = load_workbook('output.xlsx')
ws = wb.active
# 修改数据
ws['B2'] = 26 # 将 Alice 的年龄改为 26
# 保存工作簿
wb.save('output_modified.xlsx')
单元格格式化
可以使用 openpyxl 设置单元格的格式,如字体、颜色、边框等。
from openpyxl.styles import Font, PatternFill
# 加载 Excel 文件
wb = load_workbook('output.xlsx')
ws = wb.active
# 设置字体
font = Font(name='Arial', size=14, bold=True)
ws['A1'].font = font
# 设置填充颜色
fill = PatternFill(start_color='FFFF00', end_color='FFFF00', fill_type='solid')
ws['A1'].fill = fill
# 保存工作簿
wb.save('output_formatted.xlsx')
使用 xlrd 读取旧版 Excel 文件
xlrd 是一个用于读取 .xls 文件的库。注意,xlrd 从 2.0.0 版本开始只支持读取 .xls 文件,不再支持 .xlsx 文件。
读取 Excel 文件
使用 xlrd 读取 .xls 文件中的数据。
import xlrd
# 打开 Excel 文件
workbook = xlrd.open_workbook('data.xls')
# 选择工作表
sheet = workbook.sheet_by_index(0)
# 读取所有数据
data = []
for row_idx in range(sheet.nrows):
row = sheet.row_values(row_idx)
data.append(row)
# 打印数据
for row in data:
print(row)
综合示例:从 Excel 文件读取、处理并写回
以下示例展示了如何综合使用 pandas 和 openpyxl 从 Excel 文件中读取数据,进行处理,并将结果写回到新的 Excel 文件中。
import pandas as pd
from openpyxl import load_workbook
# 读取 Excel 文件
df = pd.read_excel('data.xlsx')
# 处理数据(例如,计算年龄的平均值)
average_age = df['Age'].mean()
print(f"平均年龄: {average_age}")
# 将处理结果写入新的 Excel 文件
with pd.ExcelWriter('processed_data.xlsx', engine='openpyxl') as writer:
df.to_excel(writer, sheet_name='Data', index=False)
summary_df = pd.DataFrame({'Average Age': [average_age]})
summary_df.to_excel(writer, sheet_name='Summary', index=False)
总结
本文详细介绍了如何使用 Python 处理 Excel 文件的常用操作,包括读取、写入、修改和格式化等。通过 pandas、openpyxl 和 xlrd 库,你可以高效地进行各种 Excel 文件的操作,适用于数据分析和处理等应用场景。掌握这些技能,不仅可以提高工作效率,还能显著提升数据处理能力。希望本文对大家理解和应用 Python 处理 Excel 文件有所帮助。
如果你觉得文章还不错,请大家 点赞、分享、留言 下,因为这将是我持续输出更多优质文章的最强动力!
领取方式:私信回复666,免费领取资料软件~
相关推荐
- pip的使用及配置_pip怎么配置
-
要使用python必须要学会使用pip,pip的全称:packageinstallerforpython,也就是Python包管理工具,主要是对python的第三方库进行安装、更新、卸载等操作,...
- Anaconda下安装pytorch_anaconda下安装tensorflow
-
之前的文章介绍了tensorflow-gpu的安装方法,也介绍了许多基本的工具与使用方法,具体可以看Ubuntu快速安装tensorflow2.4的gpu版本。pytorch也是一个十分流行的机器学...
- Centos 7 64位安装 python3的教程
-
wgethttps://www.python.org/ftp/python/3.10.13/Python-3.10.13.tgz#下载指定版本软件安装包tar-xzfPython-3.10.1...
- 如何安装 pip 管理工具_pip安装详细步骤
-
如何安装pip管理工具方法一:yum方式安装Centos安装python3和python3-devel开发包>#yuminstallgcclibffi-develpy...
- Python入门——从开发环境搭建到hello world
-
一、Python解释器安装1、在windows下步骤1、下载安装包https://www.python.org/downloads/打开后选择【Downloads】->【Windows】小编是一...
- 生产环境中使用的十大 Python 设计模式
-
在软件开发的浩瀚世界中,设计模式如同指引方向的灯塔,为我们构建稳定、高效且易于维护的系统提供了经过验证的解决方案。对于Python开发者而言,理解和掌握这些模式,更是提升代码质量、加速开发进程的关...
- 如何创建和管理Python虚拟环境_python怎么创建虚拟环境
-
在Python开发中,虚拟环境是隔离项目依赖的关键工具。下面介绍创建和管理Python虚拟环境的主流方法。一、内置工具:venv(Python3.3+推荐)venv是Python标准...
- 初学者入门Python的第一步——环境搭建
-
Python如今成为零基础编程爱好者的首选学习语言,这和Python语言自身的强大功能和简单易学是分不开的。今天千锋武汉Python培训小编将带领Python零基础的初学者完成入门的第一步——环境搭建...
- 全网最简我的世界Minecraft搭建Python编程环境
-
这篇文章将给大家介绍一种在我的世界minecraft里搭建Python编程开发环境的操作方法。目前看起来应该是全网最简单的方法。搭建完成后,马上就可以利用python代码在我的世界自动创建很多有意思的...
- Python开发中的虚拟环境管理_python3虚拟环境
-
Python开发中,虚拟环境管理帮助隔离项目依赖,避免不同项目之间的依赖冲突。虚拟环境的作用隔离依赖:不同项目可能需要不同版本的库,虚拟环境可以为每个项目创建独立的环境。避免全局污染:全局安装的库可...
- Python内置zipfile模块:操作 ZIP 归档文件详解
-
一、知识导图二、知识讲解(一)zipfile模块概述zipfile模块是Python内置的用于操作ZIP归档文件的模块。它提供了创建、读取、写入、添加及列出ZIP文件的功能。(二)ZipFile类1....
- Python内置模块pydoc :文档生成器和在线帮助系统详解
-
一、引言在Python开发中,良好的文档是提高代码可读性和可维护性的关键。pydoc是Python自带的一个强大的文档生成器和在线帮助系统,它可以根据Python模块自动生成文档,并支持多种输出格式...
- Python sys模块使用教程_python system模块
-
1.知识导图2.sys模块概述2.1模块定义与作用sys模块是Python标准库中的一个内置模块,提供了与Python解释器及其环境交互的接口。它包含了许多与系统相关的变量和函数,可以用来控制P...
- Python Logging 模块完全解读_python logging详解
-
私信我,回复:学习,获取免费学习资源包。Python中的logging模块可以让你跟踪代码运行时的事件,当程序崩溃时可以查看日志并且发现是什么引发了错误。Log信息有内置的层级——调试(deb...
- 软件测试|Python logging模块怎么使用,你会了吗?
-
Pythonlogging模块使用在开发和维护Python应用程序时,日志记录是一项非常重要的任务。Python提供了内置的logging模块,它可以帮助我们方便地记录应用程序的运行时信息、错误和调...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)