对比Excel学Python第1练:既有Excel,何用Python?
off999 2025-04-30 18:50 23 浏览 0 评论
背景
之前发的文章开头都是“Python数据分析……”,使得很多伙伴以为我是专门分享Python的,但我的本意并非如此,我的重点还是会放到“数据分析”上,毕竟,Python只是一种工具而已。
现在网上可以搜到很多关于Python数据分析的内容,特别是很多习惯于使用Excel的同学,会有一种不能用Python替代Excel就会落伍被淘汰的焦虑感,其实完全没必要,下面是前段时间偶尔看到的一张图片,供有此焦虑的朋友们开心下。
其实,这个段子有时候真的不是段子,很多企业搞了一堆系统之后,发现最后还是要回归到导入、导出Excel的老路上,我就正在这种悲催的路上前进着。。。
当然了,Excel很普及、很受用,但是在数据处理更高效、自动化更易实现、搭建模型更便捷的Python面前,多学习一些可以提升个人工作效率的工具总是好的。
但是,前提一定要记住:数据分析的重点在分析,而不在工具。
鉴于很多伙伴觉得我之前分享的学习笔记属于进阶版内容,希望能够一起从基础开始,有兴趣的小伙伴们可以一起参与进来。
目标
这篇文章是第1练,目标是对数据分析有一个宏观的认识,知道数据分析到底在分析什么,为什么要做数据分析,以及做了数据分析有什么好处。
下面我们基于5W2H的方法论,梳理清楚数据分析的具体内容,从而做到知己知彼,百战不殆!
1 什么是数据分析?
这个问题或许可以在网上搜到各种各样的答案,在我看来,数据分析就是一种工作流程,这种流程的目的是通过选择合适的分析工具,在统计学理论的支撑下,对数据进行一定程度的预处理,然后结合具体业务分析数据,帮助相关业务部门监控、定位、分析、解决问题,从而帮助企业高效决策,提高经营效率,发现业务机会点,让企业获得持续竞争的优势。
2 为什么要做数据分析?
因为数据分析可以把隐藏在大量数据背后的信息提炼出来,总结出数据的内在规律。代替了以前那种拍脑袋、靠经验做决策的做法,因此有必要就业务现状、问题原因、业绩预测等进行分析。
3 由谁来做数据分析?
现在基本上数据分析使用的场景可以覆盖企事业单位的所有岗位,不管是商业、财务、IT、人力等都会对数据分析有较高的要求,因此人人都可以、都需要就自己职责范围内,甚至是存在关联关系的数据进行分析,得到可以指导自己决策的信息。
4 什么时间做数据分析?
一般地,具体来说,数据分析在企业日常经营分析中有三大作用,即现状分析、原因分析、预测分析。在不同的时间尺度需求下,需要进行不同时间维度的分析。
现状分析可以告诉你业务过去发生了什么,具体体现在两个方面。
- 第一,获取现阶段的整体运营情况,通过各个关键指标的表现情况来衡量企业的运营状况,掌握企业目前的发展趋势。
- 第二,洞察企业各项业务的构成,通过现状分析可以了解企业各项分支业务的发展及变动情况,对企业运营状况有更深入的了解。
现状分析一般通过日常报表来实现,如日报、周报、月报等形式。例如,电商网站日报中的现状分析会包括整体以及各个业务单元的订单数、新增用户数、活跃率、留存率等指标同比、环比上涨/下跌了多少。
原因分析可以告诉你某一现状为什么会存在。经过现状分析,我们对企业的运营情况有了基本了解,知道哪些指标呈上升趋势,哪些指标呈下降趋势,或者是哪些业务做得好,哪些做得不好。但是我们还不知道那些做得好的业务为什么会做得好,做得差的业务的原因又是什么?找原因的过程就是原因分析。
原因分析一般通过专题分析来完成,根据企业运营情况选择针对某一现状进行原因分析。例如,在某一天的电商网站日报中,某件商品销量突然大增,那么就需要针对这件销量突然增加的商品做专题分析,看看是什么原因促成了商品销量大增。
预测分析会告诉你未来可能发生什么。在了解企业经营状况以后,有时还需要对企业未来发展趋势做出预测,为制订企业经营目标及策略提供有效的参考与决策依据,以保证企业的可持续健康发展。
预测分析一般是通过专题分析来完成的,通常在制订企业季度、年度计划时进行。例如,通过上述的原因分析,我们就可以有针对性地实施一些策略。比如通过原因分析,我们得知在台风来临之际面包的销量会大增,那么我们在下次台风来临之前就应该多准备一些面包,同时为了获得更多的销量做一系列准备。
5 在哪里做数据分析?
在上一小结的内容中,其实已经就这个问题进行了回答,简单说就一句话,在需要进行数据分析的场景中做数据分析。
6 怎么做数据分析?
一般的,数据分析的流程如下图所示。
- 工欲善其事,必先利其器,只有熟练使用工具,才能更好地处理数据、分析数据。
- 做任何事情都要目的明确,数据分析也一样,首先要明确数据分析的目的,即希望通过数据分析得出什么。
- 目的明确后我们就要获取数据,在获取数据之前还需要明确需要的指标、维度、存放位置等信息。
- 拿到数据以后,我们要去熟悉数据,熟悉数据就是看一下有多少数据,这些数据是类别型还是数值型的;每个指标大概有哪些值,这些数据能不能满足我们的需求,如果不够,那么还需要哪些数据。
- 获取到的数据是原始数据,这些数据中一般会有一些特殊数据,我们需要对这些数据进行提前处理,常见的特殊数据主要有:异常数据、重复数据、缺失数据和测试数据。一般地,对于重复数据、测试数据我们一般都是做删除处理的。对于缺失数据,如果缺失比例高于30%,那么我们会选择放弃这个指标,即做删除处理。而对于缺失比例低于30%的指标,我们一般进行填充处理,即使用0、均值或者众数等进行填充。对于异常数据,需要结合具体业务进行处理,如果你是一个电商平台的数据分析师,你要找出平台上的刷单商户,那么异常值就是你要重点研究的对象了;假如你要分析用户的年龄,那么一些大于100或者是小于0的数据,就要删除。
- 分析数据主要围绕上节介绍的数据分析指标展开。在分析过程中经常采用的一个方法就是下钻法,例如当我们发现某一天的销量突然上涨/下滑时,我们会去看是哪个地区的销量上涨/下滑,进而再看哪个品类、哪个产品的销量出现上涨/下滑,层层下钻,最后找到问题产生的真正原因。
- 通过分析数据,我们就可以得出结论。
- 有的时候即使是通过数据分析出来的结论也不一定成立,所以我们要把数据分析和实际业务相联系,去验证结论是否正确。
- 我们在分析出结论,并且结论得到验证以后就可以把这个结论分享给相关人员,例如领导或者业务人员。这个时候就需要考虑如何展示结论,以什么样的形式展现,这就要用到数据可视化了。
通常来说,我们分析中使用到的指标主要有下面几类:
7 数据分析到什么程度?
一般地,我们把需要分析的问题给出可管理、可解决的方案这一程度即可,后续的动作由具体的业务执行人去完成,除非你是整个链条的负责人。
总结
通过上面的内容,我们对数据分析的基础知识进行了阐述,希望对有需要的小伙伴提供些许帮助。
相关推荐
- pip的使用及配置_pip怎么配置
-
要使用python必须要学会使用pip,pip的全称:packageinstallerforpython,也就是Python包管理工具,主要是对python的第三方库进行安装、更新、卸载等操作,...
- Anaconda下安装pytorch_anaconda下安装tensorflow
-
之前的文章介绍了tensorflow-gpu的安装方法,也介绍了许多基本的工具与使用方法,具体可以看Ubuntu快速安装tensorflow2.4的gpu版本。pytorch也是一个十分流行的机器学...
- Centos 7 64位安装 python3的教程
-
wgethttps://www.python.org/ftp/python/3.10.13/Python-3.10.13.tgz#下载指定版本软件安装包tar-xzfPython-3.10.1...
- 如何安装 pip 管理工具_pip安装详细步骤
-
如何安装pip管理工具方法一:yum方式安装Centos安装python3和python3-devel开发包>#yuminstallgcclibffi-develpy...
- Python入门——从开发环境搭建到hello world
-
一、Python解释器安装1、在windows下步骤1、下载安装包https://www.python.org/downloads/打开后选择【Downloads】->【Windows】小编是一...
- 生产环境中使用的十大 Python 设计模式
-
在软件开发的浩瀚世界中,设计模式如同指引方向的灯塔,为我们构建稳定、高效且易于维护的系统提供了经过验证的解决方案。对于Python开发者而言,理解和掌握这些模式,更是提升代码质量、加速开发进程的关...
- 如何创建和管理Python虚拟环境_python怎么创建虚拟环境
-
在Python开发中,虚拟环境是隔离项目依赖的关键工具。下面介绍创建和管理Python虚拟环境的主流方法。一、内置工具:venv(Python3.3+推荐)venv是Python标准...
- 初学者入门Python的第一步——环境搭建
-
Python如今成为零基础编程爱好者的首选学习语言,这和Python语言自身的强大功能和简单易学是分不开的。今天千锋武汉Python培训小编将带领Python零基础的初学者完成入门的第一步——环境搭建...
- 全网最简我的世界Minecraft搭建Python编程环境
-
这篇文章将给大家介绍一种在我的世界minecraft里搭建Python编程开发环境的操作方法。目前看起来应该是全网最简单的方法。搭建完成后,马上就可以利用python代码在我的世界自动创建很多有意思的...
- Python开发中的虚拟环境管理_python3虚拟环境
-
Python开发中,虚拟环境管理帮助隔离项目依赖,避免不同项目之间的依赖冲突。虚拟环境的作用隔离依赖:不同项目可能需要不同版本的库,虚拟环境可以为每个项目创建独立的环境。避免全局污染:全局安装的库可...
- Python内置zipfile模块:操作 ZIP 归档文件详解
-
一、知识导图二、知识讲解(一)zipfile模块概述zipfile模块是Python内置的用于操作ZIP归档文件的模块。它提供了创建、读取、写入、添加及列出ZIP文件的功能。(二)ZipFile类1....
- Python内置模块pydoc :文档生成器和在线帮助系统详解
-
一、引言在Python开发中,良好的文档是提高代码可读性和可维护性的关键。pydoc是Python自带的一个强大的文档生成器和在线帮助系统,它可以根据Python模块自动生成文档,并支持多种输出格式...
- Python sys模块使用教程_python system模块
-
1.知识导图2.sys模块概述2.1模块定义与作用sys模块是Python标准库中的一个内置模块,提供了与Python解释器及其环境交互的接口。它包含了许多与系统相关的变量和函数,可以用来控制P...
- Python Logging 模块完全解读_python logging详解
-
私信我,回复:学习,获取免费学习资源包。Python中的logging模块可以让你跟踪代码运行时的事件,当程序崩溃时可以查看日志并且发现是什么引发了错误。Log信息有内置的层级——调试(deb...
- 软件测试|Python logging模块怎么使用,你会了吗?
-
Pythonlogging模块使用在开发和维护Python应用程序时,日志记录是一项非常重要的任务。Python提供了内置的logging模块,它可以帮助我们方便地记录应用程序的运行时信息、错误和调...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)