百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

对比Excel学Python第1练:既有Excel,何用Python?

off999 2025-04-30 18:50 18 浏览 0 评论

背景

之前发的文章开头都是“Python数据分析……”,使得很多伙伴以为我是专门分享Python的,但我的本意并非如此,我的重点还是会放到“数据分析”上,毕竟,Python只是一种工具而已。

现在网上可以搜到很多关于Python数据分析的内容,特别是很多习惯于使用Excel的同学,会有一种不能用Python替代Excel就会落伍被淘汰的焦虑感,其实完全没必要,下面是前段时间偶尔看到的一张图片,供有此焦虑的朋友们开心下。

其实,这个段子有时候真的不是段子,很多企业搞了一堆系统之后,发现最后还是要回归到导入、导出Excel的老路上,我就正在这种悲催的路上前进着。。。

当然了,Excel很普及、很受用,但是在数据处理更高效自动化更易实现搭建模型更便捷的Python面前,多学习一些可以提升个人工作效率的工具总是好的。

但是,前提一定要记住:数据分析的重点在分析,而不在工具

鉴于很多伙伴觉得我之前分享的学习笔记属于进阶版内容,希望能够一起从基础开始,有兴趣的小伙伴们可以一起参与进来。

目标

这篇文章是第1练,目标是对数据分析有一个宏观的认识,知道数据分析到底在分析什么,为什么要做数据分析,以及做了数据分析有什么好处

下面我们基于5W2H的方法论,梳理清楚数据分析的具体内容,从而做到知己知彼,百战不殆!

1 什么是数据分析?

这个问题或许可以在网上搜到各种各样的答案,在我看来,数据分析就是一种工作流程,这种流程的目的是通过选择合适的分析工具,在统计学理论的支撑下,对数据进行一定程度的预处理,然后结合具体业务分析数据,帮助相关业务部门监控、定位、分析、解决问题,从而帮助企业高效决策,提高经营效率,发现业务机会点,让企业获得持续竞争的优势

2 为什么要做数据分析?

因为数据分析可以把隐藏在大量数据背后的信息提炼出来,总结出数据的内在规律。代替了以前那种拍脑袋、靠经验做决策的做法,因此有必要就业务现状、问题原因、业绩预测等进行分析

3 由谁来做数据分析?

现在基本上数据分析使用的场景可以覆盖企事业单位的所有岗位,不管是商业、财务、IT、人力等都会对数据分析有较高的要求,因此人人都可以、都需要就自己职责范围内,甚至是存在关联关系的数据进行分析,得到可以指导自己决策的信息。

4 什么时间做数据分析?

一般地,具体来说,数据分析在企业日常经营分析中有三大作用,即现状分析原因分析预测分析。在不同的时间尺度需求下,需要进行不同时间维度的分析。

现状分析可以告诉你业务过去发生了什么,具体体现在两个方面。

  • 第一,获取现阶段的整体运营情况,通过各个关键指标的表现情况来衡量企业的运营状况,掌握企业目前的发展趋势。
  • 第二,洞察企业各项业务的构成,通过现状分析可以了解企业各项分支业务的发展及变动情况,对企业运营状况有更深入的了解。

现状分析一般通过日常报表来实现,如日报、周报、月报等形式。例如,电商网站日报中的现状分析会包括整体以及各个业务单元的订单数、新增用户数、活跃率、留存率等指标同比、环比上涨/下跌了多少。

原因分析可以告诉你某一现状为什么会存在。经过现状分析,我们对企业的运营情况有了基本了解,知道哪些指标呈上升趋势,哪些指标呈下降趋势,或者是哪些业务做得好,哪些做得不好。但是我们还不知道那些做得好的业务为什么会做得好,做得差的业务的原因又是什么?找原因的过程就是原因分析。
原因分析一般通过专题分析来完成,根据企业运营情况选择针对某一现状进行原因分析。例如,在某一天的电商网站日报中,某件商品销量突然大增,那么就需要针对这件销量突然增加的商品做专题分析,看看是什么原因促成了商品销量大增。

预测分析会告诉你未来可能发生什么。在了解企业经营状况以后,有时还需要对企业未来发展趋势做出预测,为制订企业经营目标及策略提供有效的参考与决策依据,以保证企业的可持续健康发展。
预测分析一般是通过专题分析来完成的,通常在制订企业季度、年度计划时进行。例如,通过上述的原因分析,我们就可以有针对性地实施一些策略。比如通过原因分析,我们得知在台风来临之际面包的销量会大增,那么我们在下次台风来临之前就应该多准备一些面包,同时为了获得更多的销量做一系列准备。

5 在哪里做数据分析?

在上一小结的内容中,其实已经就这个问题进行了回答,简单说就一句话,在需要进行数据分析的场景中做数据分析。

6 怎么做数据分析?

一般的,数据分析的流程如下图所示。

  • 工欲善其事,必先利其器,只有熟练使用工具,才能更好地处理数据、分析数据。
  • 做任何事情都要目的明确,数据分析也一样,首先要明确数据分析的目的,即希望通过数据分析得出什么。
  • 目的明确后我们就要获取数据,在获取数据之前还需要明确需要的指标、维度、存放位置等信息。
  • 拿到数据以后,我们要去熟悉数据,熟悉数据就是看一下有多少数据,这些数据是类别型还是数值型的;每个指标大概有哪些值,这些数据能不能满足我们的需求,如果不够,那么还需要哪些数据。
  • 获取到的数据是原始数据,这些数据中一般会有一些特殊数据,我们需要对这些数据进行提前处理,常见的特殊数据主要有:异常数据、重复数据、缺失数据和测试数据。一般地,对于重复数据、测试数据我们一般都是做删除处理的。对于缺失数据,如果缺失比例高于30%,那么我们会选择放弃这个指标,即做删除处理。而对于缺失比例低于30%的指标,我们一般进行填充处理,即使用0、均值或者众数等进行填充。对于异常数据,需要结合具体业务进行处理,如果你是一个电商平台的数据分析师,你要找出平台上的刷单商户,那么异常值就是你要重点研究的对象了;假如你要分析用户的年龄,那么一些大于100或者是小于0的数据,就要删除。
  • 分析数据主要围绕上节介绍的数据分析指标展开。在分析过程中经常采用的一个方法就是下钻法,例如当我们发现某一天的销量突然上涨/下滑时,我们会去看是哪个地区的销量上涨/下滑,进而再看哪个品类、哪个产品的销量出现上涨/下滑,层层下钻,最后找到问题产生的真正原因。
  • 通过分析数据,我们就可以得出结论。
  • 有的时候即使是通过数据分析出来的结论也不一定成立,所以我们要把数据分析和实际业务相联系,去验证结论是否正确。
  • 我们在分析出结论,并且结论得到验证以后就可以把这个结论分享给相关人员,例如领导或者业务人员。这个时候就需要考虑如何展示结论,以什么样的形式展现,这就要用到数据可视化了。

通常来说,我们分析中使用到的指标主要有下面几类:

7 数据分析到什么程度?

一般地,我们把需要分析的问题给出可管理、可解决的方案这一程度即可,后续的动作由具体的业务执行人去完成,除非你是整个链条的负责人。

总结

通过上面的内容,我们对数据分析的基础知识进行了阐述,希望对有需要的小伙伴提供些许帮助。

相关推荐

python入门到脱坑经典案例—清空列表

在Python中,清空列表是一个基础但重要的操作。clear()方法是最直接的方式,但还有其他方法也可以实现相同效果。以下是详细说明:1.使用clear()方法(Python3.3+推荐)...

python中元组,列表,字典,集合删除项目方式的归纳

九三,君子终日乾乾,夕惕若,厉无咎。在使用python过程中会经常遇到这四种集合数据类型,今天就对这四种集合数据类型中删除项目的操作做个总结性的归纳。列表(List)是一种有序和可更改的集合。允许重复...

Linux 下海量文件删除方法效率对比,最慢的竟然是 rm

Linux下海量文件删除方法效率对比,本次参赛选手一共6位,分别是:rm、find、findwithdelete、rsync、Python、Perl.首先建立50万个文件$testfor...

数据结构与算法——链式存储(链表)的插入及删除,

持续分享嵌入式技术,操作系统,算法,c语言/python等,欢迎小友关注支持上篇文章我们讲述了链表的基本概念及一些查找遍历的方法,本篇我们主要将一下链表的插入删除操作,以及采用堆栈方式如何创建链表。链...

Python自动化:openpyxl写入数据,插入删除行列等基础操作

importopenpyxlwb=openpyxl.load_workbook("example1.xlsx")sh=wb['Sheet1']写入数据#...

在Linux下软件的安装与卸载(linux里的程序的安装与卸载命令)

通过apt安装/协助软件apt是AdvancedPackagingTool,是Linux下的一款安装包管理工具可以在终端中方便的安装/卸载/更新软件包命令使用格式:安装软件:sudoapt...

Python 批量卸载关联包 pip-autoremove

pip工具在安装扩展包的时候会自动安装依赖的关联包,但是卸载时只删除单个包,无法卸载关联的包。pip-autoremove就是为了解决卸载关联包的问题。安装方法通过下面的命令安装:pipinsta...

用Python在Word文档中插入和删除文本框

在当今自动化办公需求日益增长的背景下,通过编程手段动态管理Word文档中的文本框元素已成为提升工作效率的关键技术路径。文本框作为文档排版中灵活的内容容器,既能承载多模态信息(如文字、图像),又可实现独...

Python 从列表中删除值的多种实用方法详解

#Python从列表中删除值的多种实用方法详解在Python编程中,列表(List)是一种常用的数据结构,具有动态可变的特性。当我们需要从列表中删除元素时,根据不同的场景(如按值删除、按索引删除、...

Python 中的前缀删除操作全指南(python删除前导0)

1.字符串前缀删除1.1使用内置方法Python提供了几种内置方法来处理字符串前缀的删除:#1.使用removeprefix()方法(Python3.9+)text="...

每天学点Python知识:如何删除空白

在Python中,删除空白可以分为几种不同的情况,常见的是针对字符串或列表中空白字符的处理。一、删除字符串中的空白1.删除字符串两端的空白(空格、\t、\n等)使用.strip()方法:s...

Linux系统自带Python2&yum的卸载及重装

写在前面事情的起因是我昨天在测试Linux安装Python3的shell脚本时,需要卸载Python3重新安装一遍。但是通过如下命令卸载python3时,少写了个3,不小心将系统自带的python2也...

如何使用Python将多个excel文件数据快速汇总?

在数据分析和处理的过程中,Excel文件是我们经常会遇到的数据格式之一。本文将通过一个具体的示例,展示如何使用Python和Pandas库来读取、合并和处理多个Excel文件的数据,并最终生成一个包含...

【第三弹】用Python实现Excel的vlookup功能

今天继续用pandas实现Excel的vlookup功能,假设我们的2个表长成这样:我们希望把Sheet2的部门匹在Sheet1的最后一列。话不多说,先上代码:importpandasaspd...

python中pandas读取excel单列及连续多列数据

案例:想获取test.xls中C列、H列以后(当H列后列数未知时)的所有数据。importpandasaspdfile_name=r'D:\test.xls'#表格绝对...

取消回复欢迎 发表评论: