百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

从入门到精通:Python处理Excel文件的实用技巧

off999 2025-04-30 18:49 25 浏览 0 评论

在数据分析和处理的过程中,Excel 是一种广泛使用的数据存储和交换格式。Python 提供了多个强大的库来处理 Excel 文件,如 pandasopenpyxlxlrd 等。本文将详细介绍如何使用这些库进行 Excel 文件的常用操作,包括读取、写入、修改和格式化等。

使用 pandas 处理 Excel 文件

pandas 是一个强大的数据处理和分析库,它提供了高效的 Excel 读取和写入功能。

读取 Excel 文件

使用 pandas 读取 Excel 文件非常简单,只需一行代码。

import pandas as pd

# 读取 Excel 文件
df = pd.read_excel('data.xlsx')

# 显示前几行数据
print(df.head())

写入 Excel 文件

将 DataFrame 写入 Excel 文件也同样简单。

# 创建一个 DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'Los Angeles', 'Chicago']
}
df = pd.DataFrame(data)

# 写入 Excel 文件
df.to_excel('output.xlsx', index=False)

追加数据到 Excel 文件

如果需要在现有的 Excel 文件中追加数据,可以使用 ExcelWriter

# 追加数据到现有 Excel 文件
with pd.ExcelWriter('output.xlsx', mode='a', engine='openpyxl') as writer:
    df.to_excel(writer, sheet_name='NewSheet', index=False)

使用 openpyxl 处理 Excel 文件

openpyxl 是一个专门处理 Excel 文件的库,适用于处理 .xlsx 格式的文件。

读取 Excel 文件

使用 openpyxl 读取 Excel 文件并获取数据。

from openpyxl import load_workbook

# 加载 Excel 文件
wb = load_workbook('data.xlsx')

# 选择活动工作表
ws = wb.active

# 读取所有数据
data = []
for row in ws.iter_rows(values_only=True):
    data.append(row)

# 打印数据
for row in data:
    print(row)

写入 Excel 文件

使用 openpyxl 创建和写入 Excel 文件。

from openpyxl import Workbook

# 创建一个工作簿
wb = Workbook()
ws = wb.active

# 写入数据
ws.append(['Name', 'Age', 'City'])
ws.append(['Alice', 25, 'New York'])
ws.append(['Bob', 30, 'Los Angeles'])
ws.append(['Charlie', 35, 'Chicago'])

# 保存工作簿
wb.save('output.xlsx')

修改 Excel 文件

打开现有的 Excel 文件,修改其中的数据,并保存更改。

# 加载现有 Excel 文件
wb = load_workbook('output.xlsx')
ws = wb.active

# 修改数据
ws['B2'] = 26  # 将 Alice 的年龄改为 26

# 保存工作簿
wb.save('output_modified.xlsx')

单元格格式化

可以使用 openpyxl 设置单元格的格式,如字体、颜色、边框等。

from openpyxl.styles import Font, PatternFill

# 加载 Excel 文件
wb = load_workbook('output.xlsx')
ws = wb.active

# 设置字体
font = Font(name='Arial', size=14, bold=True)
ws['A1'].font = font

# 设置填充颜色
fill = PatternFill(start_color='FFFF00', end_color='FFFF00', fill_type='solid')
ws['A1'].fill = fill

# 保存工作簿
wb.save('output_formatted.xlsx')

使用 xlrd 读取旧版 Excel 文件

xlrd 是一个用于读取 .xls 文件的库。注意,xlrd 从 2.0.0 版本开始只支持读取 .xls 文件,不再支持 .xlsx 文件。

读取 Excel 文件

使用 xlrd 读取 .xls 文件中的数据。

import xlrd

# 打开 Excel 文件
workbook = xlrd.open_workbook('data.xls')

# 选择工作表
sheet = workbook.sheet_by_index(0)

# 读取所有数据
data = []
for row_idx in range(sheet.nrows):
    row = sheet.row_values(row_idx)
    data.append(row)

# 打印数据
for row in data:
    print(row)

综合示例:从 Excel 文件读取、处理并写回

以下示例展示了如何综合使用 pandasopenpyxl 从 Excel 文件中读取数据,进行处理,并将结果写回到新的 Excel 文件中。

import pandas as pd
from openpyxl import load_workbook

# 读取 Excel 文件
df = pd.read_excel('data.xlsx')

# 处理数据(例如,计算年龄的平均值)
average_age = df['Age'].mean()
print(f"平均年龄: {average_age}")

# 将处理结果写入新的 Excel 文件
with pd.ExcelWriter('processed_data.xlsx', engine='openpyxl') as writer:
    df.to_excel(writer, sheet_name='Data', index=False)
    summary_df = pd.DataFrame({'Average Age': [average_age]})
    summary_df.to_excel(writer, sheet_name='Summary', index=False)

总结

本文详细介绍了如何使用 Python 处理 Excel 文件的常用操作,包括读取、写入、修改和格式化等。通过 pandasopenpyxlxlrd 库,你可以高效地进行各种 Excel 文件的操作,适用于数据分析和处理等应用场景。掌握这些技能,不仅可以提高工作效率,还能显著提升数据处理能力。希望本文对大家理解和应用 Python 处理 Excel 文件有所帮助。

如果你觉得文章还不错,请大家 点赞、分享、留言 下,因为这将是我持续输出更多优质文章的最强动力!

领取方式:私信回复666,免费领取资料软件~

相关推荐

阿里云国际站ECS:阿里云ECS如何提高网站的访问速度?

TG:@yunlaoda360引言:速度即体验,速度即业务在当今数字化的世界中,网站的访问速度已成为决定用户体验、用户留存乃至业务转化率的关键因素。页面加载每延迟一秒,都可能导致用户流失和收入损失。对...

高流量大并发Linux TCP性能调优_linux 高并发网络编程

其实主要是手里面的跑openvpn服务器。因为并没有明文禁p2p(哎……想想那么多流量好像不跑点p2p也跑不完),所以造成有的时候如果有比较多人跑BT的话,会造成VPN速度急剧下降。本文所面对的情况为...

性能测试100集(12)性能指标资源使用率

在性能测试中,资源使用率是评估系统硬件效率的关键指标,主要包括以下四类:#性能测试##性能压测策略##软件测试#1.CPU使用率定义:CPU处理任务的时间占比,计算公式为1-空闲时间/总...

Linux 服务器常见的性能调优_linux高性能服务端编程

一、Linux服务器性能调优第一步——先搞懂“看什么”很多人刚接触Linux性能调优时,总想着直接改配置,其实第一步该是“看清楚问题”。就像医生看病要先听诊,调优前得先知道服务器“哪里...

Nginx性能优化实战:手把手教你提升10倍性能!

关注△mikechen△,十余年BAT架构经验倾囊相授!Nginx是大型架构而核心,下面我重点详解Nginx性能@mikechen文章来源:mikechen.cc1.worker_processe...

高并发场景下,Spring Cloud Gateway如何抗住百万QPS?

关注△mikechen△,十余年BAT架构经验倾囊相授!大家好,我是mikechen。高并发场景下网关作为流量的入口非常重要,下面我重点详解SpringCloudGateway如何抗住百万性能@m...

Kubernetes 高并发处理实战(可落地案例 + 源码)

目标场景:对外提供HTTPAPI的微服务在短时间内收到大量请求(例如每秒数千至数万RPS),要求系统可弹性扩容、限流降级、缓存减压、稳定运行并能自动恢复。总体思路(多层防护):边缘层:云LB...

高并发场景下,Nginx如何扛住千万级请求?

Nginx是大型架构的必备中间件,下面我重点详解Nginx如何实现高并发@mikechen文章来源:mikechen.cc事件驱动模型Nginx采用事件驱动模型,这是Nginx高并发性能的基石。传统...

Spring Boot+Vue全栈开发实战,中文版高清PDF资源

SpringBoot+Vue全栈开发实战,中文高清PDF资源,需要的可以私我:)SpringBoot致力于简化开发配置并为企业级开发提供一系列非业务性功能,而Vue则采用数据驱动视图的方式将程序...

Docker-基础操作_docker基础实战教程二

一、镜像1、从仓库获取镜像搜索镜像:dockersearchimage_name搜索结果过滤:是否官方:dockersearch--filter="is-offical=true...

你有空吗?跟我一起搭个服务器好不好?

来人人都是产品经理【起点学院】,BAT实战派产品总监手把手系统带你学产品、学运营。昨天闲的没事的时候,随手翻了翻写过的文章,发现一个很严重的问题。就是大多数时间我都在滔滔不绝的讲理论,却很少有涉及动手...

部署你自己的 SaaS_saas如何部署

部署你自己的VPNOpenVPN——功能齐全的开源VPN解决方案。(DigitalOcean教程)dockovpn.io—无状态OpenVPNdockerized服务器,不需要持久存储。...

Docker Compose_dockercompose安装

DockerCompose概述DockerCompose是一个用来定义和管理多容器应用的工具,通过一个docker-compose.yml文件,用YAML格式描述服务、网络、卷等内容,...

京东T7架构师推出的电子版SpringBoot,从构建小系统到架构大系统

前言:Java的各种开发框架发展了很多年,影响了一代又一代的程序员,现在无论是程序员,还是架构师,使用这些开发框架都面临着两方面的挑战。一方面是要快速开发出系统,这就要求使用的开发框架尽量简单,无论...

Kubernetes (k8s) 入门学习指南_k8s kubeproxy

Kubernetes(k8s)入门学习指南一、什么是Kubernetes?为什么需要它?Kubernetes(k8s)是一个开源的容器编排系统,用于自动化部署、扩展和管理容器化应用程序。它...

取消回复欢迎 发表评论: