百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

对比Excel学Python第1练:既有Excel,何用Python?

off999 2025-04-30 18:50 26 浏览 0 评论

背景

之前发的文章开头都是“Python数据分析……”,使得很多伙伴以为我是专门分享Python的,但我的本意并非如此,我的重点还是会放到“数据分析”上,毕竟,Python只是一种工具而已。

现在网上可以搜到很多关于Python数据分析的内容,特别是很多习惯于使用Excel的同学,会有一种不能用Python替代Excel就会落伍被淘汰的焦虑感,其实完全没必要,下面是前段时间偶尔看到的一张图片,供有此焦虑的朋友们开心下。

其实,这个段子有时候真的不是段子,很多企业搞了一堆系统之后,发现最后还是要回归到导入、导出Excel的老路上,我就正在这种悲催的路上前进着。。。

当然了,Excel很普及、很受用,但是在数据处理更高效自动化更易实现搭建模型更便捷的Python面前,多学习一些可以提升个人工作效率的工具总是好的。

但是,前提一定要记住:数据分析的重点在分析,而不在工具

鉴于很多伙伴觉得我之前分享的学习笔记属于进阶版内容,希望能够一起从基础开始,有兴趣的小伙伴们可以一起参与进来。

目标

这篇文章是第1练,目标是对数据分析有一个宏观的认识,知道数据分析到底在分析什么,为什么要做数据分析,以及做了数据分析有什么好处

下面我们基于5W2H的方法论,梳理清楚数据分析的具体内容,从而做到知己知彼,百战不殆!

1 什么是数据分析?

这个问题或许可以在网上搜到各种各样的答案,在我看来,数据分析就是一种工作流程,这种流程的目的是通过选择合适的分析工具,在统计学理论的支撑下,对数据进行一定程度的预处理,然后结合具体业务分析数据,帮助相关业务部门监控、定位、分析、解决问题,从而帮助企业高效决策,提高经营效率,发现业务机会点,让企业获得持续竞争的优势

2 为什么要做数据分析?

因为数据分析可以把隐藏在大量数据背后的信息提炼出来,总结出数据的内在规律。代替了以前那种拍脑袋、靠经验做决策的做法,因此有必要就业务现状、问题原因、业绩预测等进行分析

3 由谁来做数据分析?

现在基本上数据分析使用的场景可以覆盖企事业单位的所有岗位,不管是商业、财务、IT、人力等都会对数据分析有较高的要求,因此人人都可以、都需要就自己职责范围内,甚至是存在关联关系的数据进行分析,得到可以指导自己决策的信息。

4 什么时间做数据分析?

一般地,具体来说,数据分析在企业日常经营分析中有三大作用,即现状分析原因分析预测分析。在不同的时间尺度需求下,需要进行不同时间维度的分析。

现状分析可以告诉你业务过去发生了什么,具体体现在两个方面。

  • 第一,获取现阶段的整体运营情况,通过各个关键指标的表现情况来衡量企业的运营状况,掌握企业目前的发展趋势。
  • 第二,洞察企业各项业务的构成,通过现状分析可以了解企业各项分支业务的发展及变动情况,对企业运营状况有更深入的了解。

现状分析一般通过日常报表来实现,如日报、周报、月报等形式。例如,电商网站日报中的现状分析会包括整体以及各个业务单元的订单数、新增用户数、活跃率、留存率等指标同比、环比上涨/下跌了多少。

原因分析可以告诉你某一现状为什么会存在。经过现状分析,我们对企业的运营情况有了基本了解,知道哪些指标呈上升趋势,哪些指标呈下降趋势,或者是哪些业务做得好,哪些做得不好。但是我们还不知道那些做得好的业务为什么会做得好,做得差的业务的原因又是什么?找原因的过程就是原因分析。
原因分析一般通过专题分析来完成,根据企业运营情况选择针对某一现状进行原因分析。例如,在某一天的电商网站日报中,某件商品销量突然大增,那么就需要针对这件销量突然增加的商品做专题分析,看看是什么原因促成了商品销量大增。

预测分析会告诉你未来可能发生什么。在了解企业经营状况以后,有时还需要对企业未来发展趋势做出预测,为制订企业经营目标及策略提供有效的参考与决策依据,以保证企业的可持续健康发展。
预测分析一般是通过专题分析来完成的,通常在制订企业季度、年度计划时进行。例如,通过上述的原因分析,我们就可以有针对性地实施一些策略。比如通过原因分析,我们得知在台风来临之际面包的销量会大增,那么我们在下次台风来临之前就应该多准备一些面包,同时为了获得更多的销量做一系列准备。

5 在哪里做数据分析?

在上一小结的内容中,其实已经就这个问题进行了回答,简单说就一句话,在需要进行数据分析的场景中做数据分析。

6 怎么做数据分析?

一般的,数据分析的流程如下图所示。

  • 工欲善其事,必先利其器,只有熟练使用工具,才能更好地处理数据、分析数据。
  • 做任何事情都要目的明确,数据分析也一样,首先要明确数据分析的目的,即希望通过数据分析得出什么。
  • 目的明确后我们就要获取数据,在获取数据之前还需要明确需要的指标、维度、存放位置等信息。
  • 拿到数据以后,我们要去熟悉数据,熟悉数据就是看一下有多少数据,这些数据是类别型还是数值型的;每个指标大概有哪些值,这些数据能不能满足我们的需求,如果不够,那么还需要哪些数据。
  • 获取到的数据是原始数据,这些数据中一般会有一些特殊数据,我们需要对这些数据进行提前处理,常见的特殊数据主要有:异常数据、重复数据、缺失数据和测试数据。一般地,对于重复数据、测试数据我们一般都是做删除处理的。对于缺失数据,如果缺失比例高于30%,那么我们会选择放弃这个指标,即做删除处理。而对于缺失比例低于30%的指标,我们一般进行填充处理,即使用0、均值或者众数等进行填充。对于异常数据,需要结合具体业务进行处理,如果你是一个电商平台的数据分析师,你要找出平台上的刷单商户,那么异常值就是你要重点研究的对象了;假如你要分析用户的年龄,那么一些大于100或者是小于0的数据,就要删除。
  • 分析数据主要围绕上节介绍的数据分析指标展开。在分析过程中经常采用的一个方法就是下钻法,例如当我们发现某一天的销量突然上涨/下滑时,我们会去看是哪个地区的销量上涨/下滑,进而再看哪个品类、哪个产品的销量出现上涨/下滑,层层下钻,最后找到问题产生的真正原因。
  • 通过分析数据,我们就可以得出结论。
  • 有的时候即使是通过数据分析出来的结论也不一定成立,所以我们要把数据分析和实际业务相联系,去验证结论是否正确。
  • 我们在分析出结论,并且结论得到验证以后就可以把这个结论分享给相关人员,例如领导或者业务人员。这个时候就需要考虑如何展示结论,以什么样的形式展现,这就要用到数据可视化了。

通常来说,我们分析中使用到的指标主要有下面几类:

7 数据分析到什么程度?

一般地,我们把需要分析的问题给出可管理、可解决的方案这一程度即可,后续的动作由具体的业务执行人去完成,除非你是整个链条的负责人。

总结

通过上面的内容,我们对数据分析的基础知识进行了阐述,希望对有需要的小伙伴提供些许帮助。

相关推荐

阿里云国际站ECS:阿里云ECS如何提高网站的访问速度?

TG:@yunlaoda360引言:速度即体验,速度即业务在当今数字化的世界中,网站的访问速度已成为决定用户体验、用户留存乃至业务转化率的关键因素。页面加载每延迟一秒,都可能导致用户流失和收入损失。对...

高流量大并发Linux TCP性能调优_linux 高并发网络编程

其实主要是手里面的跑openvpn服务器。因为并没有明文禁p2p(哎……想想那么多流量好像不跑点p2p也跑不完),所以造成有的时候如果有比较多人跑BT的话,会造成VPN速度急剧下降。本文所面对的情况为...

性能测试100集(12)性能指标资源使用率

在性能测试中,资源使用率是评估系统硬件效率的关键指标,主要包括以下四类:#性能测试##性能压测策略##软件测试#1.CPU使用率定义:CPU处理任务的时间占比,计算公式为1-空闲时间/总...

Linux 服务器常见的性能调优_linux高性能服务端编程

一、Linux服务器性能调优第一步——先搞懂“看什么”很多人刚接触Linux性能调优时,总想着直接改配置,其实第一步该是“看清楚问题”。就像医生看病要先听诊,调优前得先知道服务器“哪里...

Nginx性能优化实战:手把手教你提升10倍性能!

关注△mikechen△,十余年BAT架构经验倾囊相授!Nginx是大型架构而核心,下面我重点详解Nginx性能@mikechen文章来源:mikechen.cc1.worker_processe...

高并发场景下,Spring Cloud Gateway如何抗住百万QPS?

关注△mikechen△,十余年BAT架构经验倾囊相授!大家好,我是mikechen。高并发场景下网关作为流量的入口非常重要,下面我重点详解SpringCloudGateway如何抗住百万性能@m...

Kubernetes 高并发处理实战(可落地案例 + 源码)

目标场景:对外提供HTTPAPI的微服务在短时间内收到大量请求(例如每秒数千至数万RPS),要求系统可弹性扩容、限流降级、缓存减压、稳定运行并能自动恢复。总体思路(多层防护):边缘层:云LB...

高并发场景下,Nginx如何扛住千万级请求?

Nginx是大型架构的必备中间件,下面我重点详解Nginx如何实现高并发@mikechen文章来源:mikechen.cc事件驱动模型Nginx采用事件驱动模型,这是Nginx高并发性能的基石。传统...

Spring Boot+Vue全栈开发实战,中文版高清PDF资源

SpringBoot+Vue全栈开发实战,中文高清PDF资源,需要的可以私我:)SpringBoot致力于简化开发配置并为企业级开发提供一系列非业务性功能,而Vue则采用数据驱动视图的方式将程序...

Docker-基础操作_docker基础实战教程二

一、镜像1、从仓库获取镜像搜索镜像:dockersearchimage_name搜索结果过滤:是否官方:dockersearch--filter="is-offical=true...

你有空吗?跟我一起搭个服务器好不好?

来人人都是产品经理【起点学院】,BAT实战派产品总监手把手系统带你学产品、学运营。昨天闲的没事的时候,随手翻了翻写过的文章,发现一个很严重的问题。就是大多数时间我都在滔滔不绝的讲理论,却很少有涉及动手...

部署你自己的 SaaS_saas如何部署

部署你自己的VPNOpenVPN——功能齐全的开源VPN解决方案。(DigitalOcean教程)dockovpn.io—无状态OpenVPNdockerized服务器,不需要持久存储。...

Docker Compose_dockercompose安装

DockerCompose概述DockerCompose是一个用来定义和管理多容器应用的工具,通过一个docker-compose.yml文件,用YAML格式描述服务、网络、卷等内容,...

京东T7架构师推出的电子版SpringBoot,从构建小系统到架构大系统

前言:Java的各种开发框架发展了很多年,影响了一代又一代的程序员,现在无论是程序员,还是架构师,使用这些开发框架都面临着两方面的挑战。一方面是要快速开发出系统,这就要求使用的开发框架尽量简单,无论...

Kubernetes (k8s) 入门学习指南_k8s kubeproxy

Kubernetes(k8s)入门学习指南一、什么是Kubernetes?为什么需要它?Kubernetes(k8s)是一个开源的容器编排系统,用于自动化部署、扩展和管理容器化应用程序。它...

取消回复欢迎 发表评论: