百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

「Python数据分析」Pandas数据处理,导入导出Excel数据文件

off999 2025-04-30 18:48 23 浏览 0 评论

数据分析过程,基本上可以通过以下4个步骤来实现。

1、数据获取

2、数据处理

3、数据分析

4、数据结果

我们首先来看数据获取的这个步骤。

现实中,我们面对的大部分数据,基本上大多数都是Excel格式的数据文件。也就是说,我们需要进行分析的数据,都是已经获取好,形成Excel文件格式的数据。

这个获取数据的过程,可能是通过手工录入的方式,也可能是通过各种数据库导出数据的方式,等等。

要通过Python来对这些数据进行分析处理,第一步需要先把获取到的原始数据(通常是用Excel来进行保存),导入到Python当中。通过Python程序分析处理好数据之后,我们还需要把结果数据导出到Excel文件当中,以便我们后续形成结论,或者是数据报告。

要把Excel文件,导入到Python里面,有很多种方法。这里,我们使用的是Pandas库,来对Excel进行导入和导出。

我们先安装Pandas库,这在前面的教程里面已经完成。这里,我们还需要安装openpyxl库,来辅助Pandas库,导入和导出Excel文件。

首先,新建“1、导入导出Excel数据文件”文件夹

其次,右键单击新建好的文件夹,选择“在文件资源管理器中显示”,进入新建好的文件夹。

我们新建“Python源程序.ipynb”的Python笔记本源程序文件,然后通过Excel程序(WPS和MS office都可以),新建两个Excel文件,分别是“input1.xlsx”和“input2.xlsx”,用来作为导入的Excel源数据使用。

input1.xlsx的数据内容如下图所示

input2.xlsx的数据内容如下图所示

sheet1,第1季度

sheet2,第2季度

sheet3,第3季度

sheet4,第4季度

数据准备完成之后,我们先来安装“openpyxl”库。

在终端中,输入“pip install openpyxl”命令,回车等待安装完成即可。

打开“Python源程序.ipynb”

在第一个方框中,输入代码,点击方框左侧中间的三角按钮,运行这段代码。这段代码是加载pandas第三方库,其它的库,也是一样的加载。Python程序,需要先加载库,才可以使用库里面的程序。

把鼠标移动到方框中间下面位置,点击+代码按钮,可以新增编写代码的方框。

依次输入代码,运行(注意运行单元格的顺序),可以看到数据已经导入到,命名为df1的变量当中。read_excel函数,是读取Excel文件的Pandas函数。函数的第一个参数,'input1.xlsx'代表需要导入的Excel的文件名称。第二个参数,sheet_name='分数表',代表Excel文件中的sheet。

进入JUPYTER窗口,可以看到df1变量是DataFrame类型的。什么是DataFrame类型变量,后面我们会详细讲到。

经过以上过程,我们已经成功导入了单个sheet的Excel文件。

下面,我们来导入多个sheet的Excel文件。

编写以上代码,这里我们新建了一个data的变量,运行后,4个sheet的数据,全部导入到data变量当中。注意data变量是dict类型的,也就是字典类型的,后面我们再详细讲解字典类型。

这里注意,多个sheet的名称,是放在中括号里面的,名称不能出错。

通过编写以上代码,可以逐个查看每个sheet中的数据。

最后,假如df1的数据,通过Python程序,处理分析完成之后,我们编写以上代码,就可以把Python中的数据,导出成为我们熟悉的Excel格式文件。这时会创建output.xlsx的Excel文件,把数据写入文件当中,重复导出的话,会覆盖Excel中的数据。

相关推荐

pip的使用及配置_pip怎么配置

要使用python必须要学会使用pip,pip的全称:packageinstallerforpython,也就是Python包管理工具,主要是对python的第三方库进行安装、更新、卸载等操作,...

Anaconda下安装pytorch_anaconda下安装tensorflow

之前的文章介绍了tensorflow-gpu的安装方法,也介绍了许多基本的工具与使用方法,具体可以看Ubuntu快速安装tensorflow2.4的gpu版本。pytorch也是一个十分流行的机器学...

Centos 7 64位安装 python3的教程

wgethttps://www.python.org/ftp/python/3.10.13/Python-3.10.13.tgz#下载指定版本软件安装包tar-xzfPython-3.10.1...

如何安装 pip 管理工具_pip安装详细步骤

如何安装pip管理工具方法一:yum方式安装Centos安装python3和python3-devel开发包>#yuminstallgcclibffi-develpy...

Python入门——从开发环境搭建到hello world

一、Python解释器安装1、在windows下步骤1、下载安装包https://www.python.org/downloads/打开后选择【Downloads】->【Windows】小编是一...

生产环境中使用的十大 Python 设计模式

在软件开发的浩瀚世界中,设计模式如同指引方向的灯塔,为我们构建稳定、高效且易于维护的系统提供了经过验证的解决方案。对于Python开发者而言,理解和掌握这些模式,更是提升代码质量、加速开发进程的关...

如何创建和管理Python虚拟环境_python怎么创建虚拟环境

在Python开发中,虚拟环境是隔离项目依赖的关键工具。下面介绍创建和管理Python虚拟环境的主流方法。一、内置工具:venv(Python3.3+推荐)venv是Python标准...

初学者入门Python的第一步——环境搭建

Python如今成为零基础编程爱好者的首选学习语言,这和Python语言自身的强大功能和简单易学是分不开的。今天千锋武汉Python培训小编将带领Python零基础的初学者完成入门的第一步——环境搭建...

全网最简我的世界Minecraft搭建Python编程环境

这篇文章将给大家介绍一种在我的世界minecraft里搭建Python编程开发环境的操作方法。目前看起来应该是全网最简单的方法。搭建完成后,马上就可以利用python代码在我的世界自动创建很多有意思的...

Python开发中的虚拟环境管理_python3虚拟环境

Python开发中,虚拟环境管理帮助隔离项目依赖,避免不同项目之间的依赖冲突。虚拟环境的作用隔离依赖:不同项目可能需要不同版本的库,虚拟环境可以为每个项目创建独立的环境。避免全局污染:全局安装的库可...

Python内置zipfile模块:操作 ZIP 归档文件详解

一、知识导图二、知识讲解(一)zipfile模块概述zipfile模块是Python内置的用于操作ZIP归档文件的模块。它提供了创建、读取、写入、添加及列出ZIP文件的功能。(二)ZipFile类1....

Python内置模块pydoc :文档生成器和在线帮助系统详解

一、引言在Python开发中,良好的文档是提高代码可读性和可维护性的关键。pydoc是Python自带的一个强大的文档生成器和在线帮助系统,它可以根据Python模块自动生成文档,并支持多种输出格式...

Python sys模块使用教程_python system模块

1.知识导图2.sys模块概述2.1模块定义与作用sys模块是Python标准库中的一个内置模块,提供了与Python解释器及其环境交互的接口。它包含了许多与系统相关的变量和函数,可以用来控制P...

Python Logging 模块完全解读_python logging详解

私信我,回复:学习,获取免费学习资源包。Python中的logging模块可以让你跟踪代码运行时的事件,当程序崩溃时可以查看日志并且发现是什么引发了错误。Log信息有内置的层级——调试(deb...

软件测试|Python logging模块怎么使用,你会了吗?

Pythonlogging模块使用在开发和维护Python应用程序时,日志记录是一项非常重要的任务。Python提供了内置的logging模块,它可以帮助我们方便地记录应用程序的运行时信息、错误和调...

取消回复欢迎 发表评论: