「Python数据分析」Pandas数据处理,导入导出Excel数据文件
off999 2025-04-30 18:48 21 浏览 0 评论
数据分析过程,基本上可以通过以下4个步骤来实现。
1、数据获取
2、数据处理
3、数据分析
4、数据结果
我们首先来看数据获取的这个步骤。
现实中,我们面对的大部分数据,基本上大多数都是Excel格式的数据文件。也就是说,我们需要进行分析的数据,都是已经获取好,形成Excel文件格式的数据。
这个获取数据的过程,可能是通过手工录入的方式,也可能是通过各种数据库导出数据的方式,等等。
要通过Python来对这些数据进行分析处理,第一步需要先把获取到的原始数据(通常是用Excel来进行保存),导入到Python当中。通过Python程序分析处理好数据之后,我们还需要把结果数据导出到Excel文件当中,以便我们后续形成结论,或者是数据报告。
要把Excel文件,导入到Python里面,有很多种方法。这里,我们使用的是Pandas库,来对Excel进行导入和导出。
我们先安装Pandas库,这在前面的教程里面已经完成。这里,我们还需要安装openpyxl库,来辅助Pandas库,导入和导出Excel文件。
首先,新建“1、导入导出Excel数据文件”文件夹
其次,右键单击新建好的文件夹,选择“在文件资源管理器中显示”,进入新建好的文件夹。
我们新建“Python源程序.ipynb”的Python笔记本源程序文件,然后通过Excel程序(WPS和MS office都可以),新建两个Excel文件,分别是“input1.xlsx”和“input2.xlsx”,用来作为导入的Excel源数据使用。
input1.xlsx的数据内容如下图所示
input2.xlsx的数据内容如下图所示
sheet1,第1季度
sheet2,第2季度
sheet3,第3季度
sheet4,第4季度
数据准备完成之后,我们先来安装“openpyxl”库。
在终端中,输入“pip install openpyxl”命令,回车等待安装完成即可。
打开“Python源程序.ipynb”
在第一个方框中,输入代码,点击方框左侧中间的三角按钮,运行这段代码。这段代码是加载pandas第三方库,其它的库,也是一样的加载。Python程序,需要先加载库,才可以使用库里面的程序。
把鼠标移动到方框中间下面位置,点击+代码按钮,可以新增编写代码的方框。
依次输入代码,运行(注意运行单元格的顺序),可以看到数据已经导入到,命名为df1的变量当中。read_excel函数,是读取Excel文件的Pandas函数。函数的第一个参数,'input1.xlsx'代表需要导入的Excel的文件名称。第二个参数,sheet_name='分数表',代表Excel文件中的sheet。
进入JUPYTER窗口,可以看到df1变量是DataFrame类型的。什么是DataFrame类型变量,后面我们会详细讲到。
经过以上过程,我们已经成功导入了单个sheet的Excel文件。
下面,我们来导入多个sheet的Excel文件。
编写以上代码,这里我们新建了一个data的变量,运行后,4个sheet的数据,全部导入到data变量当中。注意data变量是dict类型的,也就是字典类型的,后面我们再详细讲解字典类型。
这里注意,多个sheet的名称,是放在中括号里面的,名称不能出错。
通过编写以上代码,可以逐个查看每个sheet中的数据。
最后,假如df1的数据,通过Python程序,处理分析完成之后,我们编写以上代码,就可以把Python中的数据,导出成为我们熟悉的Excel格式文件。这时会创建output.xlsx的Excel文件,把数据写入文件当中,重复导出的话,会覆盖Excel中的数据。
相关推荐
- 16《Python 办公自动化教程》钉钉群机器人配置
-
在互联网企业中,数字化办公早已经不是什么新鲜事了,其中以钉钉为代表的工具更是其中的主力军。目前公司中钉钉的使用已经较为普及,像钉钉打卡、钉钉会议室、钉盘等。本小节将针对钉钉群机器人进行介绍,助力利用钉...
- 15《Python 办公自动化教程》文件压缩与解压缩
-
压缩包也是我们平时工作中经常要接触到的文件格式,压缩文件后缀名通常有.zip、.rar、.7z等等。Python中也有专门用来操作压缩包文件的第三方模块zipfile。听这个名字就知道是用来操...
- 08《Python 办公自动化教程》smtplib 模块与 email 模块
-
日常办公中正式文件的发送都需要用到邮件,以及在互联网工作中,月度总结、销售报表、考评表等等都需要邮件进行发送。在不考虑办公自动化之前,你发送一封邮件的步骤是如何呢?第一步打开浏览器进入到邮箱登录界面,...
- 好用的五个python表格自动化工具,谁都可以复制直接用
-
引言在之前文章中,有一篇《这五个办公室常用自动化工具我用python帮你写好了,复制代码就能用》,没想到受到了广大读者的喜爱。其中进行了一个投票,总结发现很多读者对于excel的自动化需求非常高,...
- 1-Pytest全栈自动化测试指南- 运行
-
通常,使用命令调用pytest(有关调用pytest的其他方法,pytest请参见下文)。这将在名称遵循表单的所有文件中或在当前目录及其子目录中执行所有测试。更一般地说,pytest遵...
- Python40个自动化办公实战案例,终于实现下班自由啦~
-
拿来就能用,这么爽的吗?!今天我想聊聊,如何通过Python自动化工具,解决工作中常见的办公效率低下的问题。你有没有想过,下班晚,加班,可能是因为自己工作比较低效?回想一下,自己是不是也曾遇到过这样的...
- Python自动化 | 解锁高效办公利器,Python助您轻松驾驭Excel!
-
大家不论在日常工作还是生活中,都经常用到Excel这款办公软件,它在数据处理、报表生成等方面起到了重要作用。然而,作为一个Python工程师,你可知道Python也能成为操作Excel的得力助手吗?而...
- Python自动化办公实战:包含Word、Excel、Pdf和Email邮件案例
-
背景想象一下,现在你有一份Word邀请函模板,然后你有一份客户列表,上面有客户的姓名、联系方式、邮箱等基本信息,然后你的老板现在需要替换邀请函模板中的姓名,然后将Word邀请函模板生成Pdf格式,之后...
- Python自动化办公学习笔记11——布尔类型、变量赋值、类型转换
-
1.布尔类型(Boolean)在Python中,布尔类型是整数类型的子类,其中`True`表示"真"或"是",`False`表示"假"或"否&...
- Python自动化办公应用学习笔记9——赋值语句、i...
-
1.赋值语句在程序中产生或计算值的代码称为表达式。Python语言中,等号(=)表示“赋值”操作,即将右侧表达式的计算结果赋给左侧的变量。包含等号(=)的语句称为赋值语句。同步赋值语句可以...
- Python自动化办公应用学习笔记13——表达式
-
1.表达式基础定义:表达式是代码中能计算并返回一个值的代码片段。组成:由操作数(变量、字面量)和操作符(运算符、函数调用)构成。特点:不包含语句(如if、for)、可嵌套(如(a+b)*...
- Python办公自动化之操作Excel(一)
-
处理Excel的库主要有xlrd、xlwt、xlwings和openpyxl。xlrd、xlwt、xlwings可以用于处理Excel2010文档之前的文档,而openpyxl是用于处理Excel...
- Python办公自动化系列篇之五:Web 自动化与数据提取
-
作为高效办公自动化领域的主流编程语言,Python凭借其优雅的语法结构、完善的技术生态及成熟的第三方工具库集合,已成为企业数字化转型过程中提升运营效率的理想选择。该语言在结构化数据处理、自动化文档生成...
- Python自动化办公应用学习笔记18—— while循环
-
1.定义while循环(条件循环/无限循环)是Python中基于条件判断的循环结构。它不需要预先知道循环次数,只要条件满足就会持续执行代码块,直到条件变为False时停止。特别适合处理动态变...
- Python自动化办公应用学习笔记15——算法
-
针对各种类型的问题,拟定出有效的解决方法和步骤,也就是算法。可以说,设计算法是程序设计的核心。简单来说,为解决一个问题而采取的具体方法和操作步骤,就称为“算法”。比如在解决一个数值计算问题时,我们不仅...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- 16《Python 办公自动化教程》钉钉群机器人配置
- 15《Python 办公自动化教程》文件压缩与解压缩
- 08《Python 办公自动化教程》smtplib 模块与 email 模块
- 好用的五个python表格自动化工具,谁都可以复制直接用
- 1-Pytest全栈自动化测试指南- 运行
- Python40个自动化办公实战案例,终于实现下班自由啦~
- Python自动化 | 解锁高效办公利器,Python助您轻松驾驭Excel!
- Python自动化办公实战:包含Word、Excel、Pdf和Email邮件案例
- Python自动化办公学习笔记11——布尔类型、变量赋值、类型转换
- Python自动化办公应用学习笔记9——赋值语句、i...
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python字典遍历 (54)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python读取文件夹下所有文件 (59)
- java调用python脚本 (56)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)