百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

对比Excel学Python第1练:既有Excel,何用Python?

off999 2025-04-30 18:50 23 浏览 0 评论

背景

之前发的文章开头都是“Python数据分析……”,使得很多伙伴以为我是专门分享Python的,但我的本意并非如此,我的重点还是会放到“数据分析”上,毕竟,Python只是一种工具而已。

现在网上可以搜到很多关于Python数据分析的内容,特别是很多习惯于使用Excel的同学,会有一种不能用Python替代Excel就会落伍被淘汰的焦虑感,其实完全没必要,下面是前段时间偶尔看到的一张图片,供有此焦虑的朋友们开心下。

其实,这个段子有时候真的不是段子,很多企业搞了一堆系统之后,发现最后还是要回归到导入、导出Excel的老路上,我就正在这种悲催的路上前进着。。。

当然了,Excel很普及、很受用,但是在数据处理更高效自动化更易实现搭建模型更便捷的Python面前,多学习一些可以提升个人工作效率的工具总是好的。

但是,前提一定要记住:数据分析的重点在分析,而不在工具

鉴于很多伙伴觉得我之前分享的学习笔记属于进阶版内容,希望能够一起从基础开始,有兴趣的小伙伴们可以一起参与进来。

目标

这篇文章是第1练,目标是对数据分析有一个宏观的认识,知道数据分析到底在分析什么,为什么要做数据分析,以及做了数据分析有什么好处

下面我们基于5W2H的方法论,梳理清楚数据分析的具体内容,从而做到知己知彼,百战不殆!

1 什么是数据分析?

这个问题或许可以在网上搜到各种各样的答案,在我看来,数据分析就是一种工作流程,这种流程的目的是通过选择合适的分析工具,在统计学理论的支撑下,对数据进行一定程度的预处理,然后结合具体业务分析数据,帮助相关业务部门监控、定位、分析、解决问题,从而帮助企业高效决策,提高经营效率,发现业务机会点,让企业获得持续竞争的优势

2 为什么要做数据分析?

因为数据分析可以把隐藏在大量数据背后的信息提炼出来,总结出数据的内在规律。代替了以前那种拍脑袋、靠经验做决策的做法,因此有必要就业务现状、问题原因、业绩预测等进行分析

3 由谁来做数据分析?

现在基本上数据分析使用的场景可以覆盖企事业单位的所有岗位,不管是商业、财务、IT、人力等都会对数据分析有较高的要求,因此人人都可以、都需要就自己职责范围内,甚至是存在关联关系的数据进行分析,得到可以指导自己决策的信息。

4 什么时间做数据分析?

一般地,具体来说,数据分析在企业日常经营分析中有三大作用,即现状分析原因分析预测分析。在不同的时间尺度需求下,需要进行不同时间维度的分析。

现状分析可以告诉你业务过去发生了什么,具体体现在两个方面。

  • 第一,获取现阶段的整体运营情况,通过各个关键指标的表现情况来衡量企业的运营状况,掌握企业目前的发展趋势。
  • 第二,洞察企业各项业务的构成,通过现状分析可以了解企业各项分支业务的发展及变动情况,对企业运营状况有更深入的了解。

现状分析一般通过日常报表来实现,如日报、周报、月报等形式。例如,电商网站日报中的现状分析会包括整体以及各个业务单元的订单数、新增用户数、活跃率、留存率等指标同比、环比上涨/下跌了多少。

原因分析可以告诉你某一现状为什么会存在。经过现状分析,我们对企业的运营情况有了基本了解,知道哪些指标呈上升趋势,哪些指标呈下降趋势,或者是哪些业务做得好,哪些做得不好。但是我们还不知道那些做得好的业务为什么会做得好,做得差的业务的原因又是什么?找原因的过程就是原因分析。
原因分析一般通过专题分析来完成,根据企业运营情况选择针对某一现状进行原因分析。例如,在某一天的电商网站日报中,某件商品销量突然大增,那么就需要针对这件销量突然增加的商品做专题分析,看看是什么原因促成了商品销量大增。

预测分析会告诉你未来可能发生什么。在了解企业经营状况以后,有时还需要对企业未来发展趋势做出预测,为制订企业经营目标及策略提供有效的参考与决策依据,以保证企业的可持续健康发展。
预测分析一般是通过专题分析来完成的,通常在制订企业季度、年度计划时进行。例如,通过上述的原因分析,我们就可以有针对性地实施一些策略。比如通过原因分析,我们得知在台风来临之际面包的销量会大增,那么我们在下次台风来临之前就应该多准备一些面包,同时为了获得更多的销量做一系列准备。

5 在哪里做数据分析?

在上一小结的内容中,其实已经就这个问题进行了回答,简单说就一句话,在需要进行数据分析的场景中做数据分析。

6 怎么做数据分析?

一般的,数据分析的流程如下图所示。

  • 工欲善其事,必先利其器,只有熟练使用工具,才能更好地处理数据、分析数据。
  • 做任何事情都要目的明确,数据分析也一样,首先要明确数据分析的目的,即希望通过数据分析得出什么。
  • 目的明确后我们就要获取数据,在获取数据之前还需要明确需要的指标、维度、存放位置等信息。
  • 拿到数据以后,我们要去熟悉数据,熟悉数据就是看一下有多少数据,这些数据是类别型还是数值型的;每个指标大概有哪些值,这些数据能不能满足我们的需求,如果不够,那么还需要哪些数据。
  • 获取到的数据是原始数据,这些数据中一般会有一些特殊数据,我们需要对这些数据进行提前处理,常见的特殊数据主要有:异常数据、重复数据、缺失数据和测试数据。一般地,对于重复数据、测试数据我们一般都是做删除处理的。对于缺失数据,如果缺失比例高于30%,那么我们会选择放弃这个指标,即做删除处理。而对于缺失比例低于30%的指标,我们一般进行填充处理,即使用0、均值或者众数等进行填充。对于异常数据,需要结合具体业务进行处理,如果你是一个电商平台的数据分析师,你要找出平台上的刷单商户,那么异常值就是你要重点研究的对象了;假如你要分析用户的年龄,那么一些大于100或者是小于0的数据,就要删除。
  • 分析数据主要围绕上节介绍的数据分析指标展开。在分析过程中经常采用的一个方法就是下钻法,例如当我们发现某一天的销量突然上涨/下滑时,我们会去看是哪个地区的销量上涨/下滑,进而再看哪个品类、哪个产品的销量出现上涨/下滑,层层下钻,最后找到问题产生的真正原因。
  • 通过分析数据,我们就可以得出结论。
  • 有的时候即使是通过数据分析出来的结论也不一定成立,所以我们要把数据分析和实际业务相联系,去验证结论是否正确。
  • 我们在分析出结论,并且结论得到验证以后就可以把这个结论分享给相关人员,例如领导或者业务人员。这个时候就需要考虑如何展示结论,以什么样的形式展现,这就要用到数据可视化了。

通常来说,我们分析中使用到的指标主要有下面几类:

7 数据分析到什么程度?

一般地,我们把需要分析的问题给出可管理、可解决的方案这一程度即可,后续的动作由具体的业务执行人去完成,除非你是整个链条的负责人。

总结

通过上面的内容,我们对数据分析的基础知识进行了阐述,希望对有需要的小伙伴提供些许帮助。

相关推荐

pip的使用及配置_pip怎么配置

要使用python必须要学会使用pip,pip的全称:packageinstallerforpython,也就是Python包管理工具,主要是对python的第三方库进行安装、更新、卸载等操作,...

Anaconda下安装pytorch_anaconda下安装tensorflow

之前的文章介绍了tensorflow-gpu的安装方法,也介绍了许多基本的工具与使用方法,具体可以看Ubuntu快速安装tensorflow2.4的gpu版本。pytorch也是一个十分流行的机器学...

Centos 7 64位安装 python3的教程

wgethttps://www.python.org/ftp/python/3.10.13/Python-3.10.13.tgz#下载指定版本软件安装包tar-xzfPython-3.10.1...

如何安装 pip 管理工具_pip安装详细步骤

如何安装pip管理工具方法一:yum方式安装Centos安装python3和python3-devel开发包>#yuminstallgcclibffi-develpy...

Python入门——从开发环境搭建到hello world

一、Python解释器安装1、在windows下步骤1、下载安装包https://www.python.org/downloads/打开后选择【Downloads】->【Windows】小编是一...

生产环境中使用的十大 Python 设计模式

在软件开发的浩瀚世界中,设计模式如同指引方向的灯塔,为我们构建稳定、高效且易于维护的系统提供了经过验证的解决方案。对于Python开发者而言,理解和掌握这些模式,更是提升代码质量、加速开发进程的关...

如何创建和管理Python虚拟环境_python怎么创建虚拟环境

在Python开发中,虚拟环境是隔离项目依赖的关键工具。下面介绍创建和管理Python虚拟环境的主流方法。一、内置工具:venv(Python3.3+推荐)venv是Python标准...

初学者入门Python的第一步——环境搭建

Python如今成为零基础编程爱好者的首选学习语言,这和Python语言自身的强大功能和简单易学是分不开的。今天千锋武汉Python培训小编将带领Python零基础的初学者完成入门的第一步——环境搭建...

全网最简我的世界Minecraft搭建Python编程环境

这篇文章将给大家介绍一种在我的世界minecraft里搭建Python编程开发环境的操作方法。目前看起来应该是全网最简单的方法。搭建完成后,马上就可以利用python代码在我的世界自动创建很多有意思的...

Python开发中的虚拟环境管理_python3虚拟环境

Python开发中,虚拟环境管理帮助隔离项目依赖,避免不同项目之间的依赖冲突。虚拟环境的作用隔离依赖:不同项目可能需要不同版本的库,虚拟环境可以为每个项目创建独立的环境。避免全局污染:全局安装的库可...

Python内置zipfile模块:操作 ZIP 归档文件详解

一、知识导图二、知识讲解(一)zipfile模块概述zipfile模块是Python内置的用于操作ZIP归档文件的模块。它提供了创建、读取、写入、添加及列出ZIP文件的功能。(二)ZipFile类1....

Python内置模块pydoc :文档生成器和在线帮助系统详解

一、引言在Python开发中,良好的文档是提高代码可读性和可维护性的关键。pydoc是Python自带的一个强大的文档生成器和在线帮助系统,它可以根据Python模块自动生成文档,并支持多种输出格式...

Python sys模块使用教程_python system模块

1.知识导图2.sys模块概述2.1模块定义与作用sys模块是Python标准库中的一个内置模块,提供了与Python解释器及其环境交互的接口。它包含了许多与系统相关的变量和函数,可以用来控制P...

Python Logging 模块完全解读_python logging详解

私信我,回复:学习,获取免费学习资源包。Python中的logging模块可以让你跟踪代码运行时的事件,当程序崩溃时可以查看日志并且发现是什么引发了错误。Log信息有内置的层级——调试(deb...

软件测试|Python logging模块怎么使用,你会了吗?

Pythonlogging模块使用在开发和维护Python应用程序时,日志记录是一项非常重要的任务。Python提供了内置的logging模块,它可以帮助我们方便地记录应用程序的运行时信息、错误和调...

取消回复欢迎 发表评论: