Python数据分析入门教程(五):数据运算
off999 2024-10-22 13:40 29 浏览 0 评论
作者 | CDA数据分析师
进行到这一步就可以算是开始正式的烹饪了,在这部分之前的数据操作部分我们列举了一些不同维度的分析指标,这一章我们主要看看这些指标都是怎么计算出来的。
一、算术运算
算术运算就是基本的加减乘除,在Excel或者Python中数值类型的任意两列可以直接进行加、减、乘、除运算,Excel中的算术运算比较简单,这里就不展开了,下面主要介绍Python中的算术运算。
两列相加的具体实现如下图所示:
两列相减的具体实现如下图所示:
两列相乘的具体实现如下图所示:
两列相除的具体实现如下图所示:
任意一列加/减一个常数值,这一列中的所有值都加/减这个常数值,具体实现如下图所示:
任意一列乘/除一个常数值,这一列中的所有值都乘/除这个常数值,具体实现如下图所示:
二、比较运算
比较运算和Python基础知识中讲到的比较运算一致,也是常规的大于、等于、小于之类的,只不过这里的比较是在列与列之间进行的。
在Excel中列与列之间的比较运算和Python中的方法一致,例子如下图所示。
下面是一些Python中列与列之间比较的例子。
三、汇总运算
上面讲到的算术运算和比较运算都是在列与列之间进行的,运算结果是有多少行的值就会返回多少个结果,而汇总运算是将数据进行汇总返回一个汇总以后的结果值。
1、count非空值计数
非空值计数就是计算某一个区域中非空(单元格)数值的个数。
在Excel中counta()函数用于计算某个区域中非空单元格的个数。与counta()函数类似的一个函数是count()函数,它用于计算某个区域中含有数字的单元格的个数。
在 Python 中,直接在整个数据表上调用 count()函数,返回的结果为该数据表中每列的非空值的个数,具体实现如下所示。
count()函数默认是求取每一列的非空数值的个数,可以通过修改axis参数让其等于1,来求取每一行的非空数值的个数。
也可以把某一列或者某一行索引出来,单独查看这一列或这一行的非空值个数。
2、sum求和
求和就是对某一区域中的所有数值进行加和操作。
在 Excel 中要求取某一区域的和,直接在 sum()函数后面的括号中指明要求和的区域,即要对哪些值进行求和操作即可。例子如下所示。
在Python中,直接在整个数据表上调用sum()函数,返回的是该数据表每一列的求和结果,例子如下所示。
sum()函数默认对每一列进行求和,可通过修改axis参数,让其等于1,来对每一行的数值进行求和操作。
也可以把某一列或者某一行索引出来,单独对这一列或这一行数据进行求和操作。
3、 mean求均值
求均值是针对某一区域中的所有值进行求算术平均值运算。均值是用来衡量数据一般情况的指标,容易受到极大值、极小值的影响。
在Excel中对某个区域内的值进行求平均值运算,用的是average()函数,只要在average()函数中指明要求均值运算的区域即可,比如:
在Python中的求均值利用的是mean()函数,如果对整个表直接调用mean()函数,返回的是该表中每一列的均值。
mean()函数默认是对数据表中的每一列进行求均值运算,可通过修改 axis 参数,让其等于1,来对每一行进行求均值运算。
也可以把某一列或者某一行通过索引的方式取出来,然后在这一行或这一列上调用mean()函数,单独求取这一行或这一列的均值。
4、 max求最大值
求最大值就是比较一组数据中所有数值的大小,然后返回最大的一个值。
在Excel和Python中,求最大值使用的都是max()函数,在Excel中同样只需要在max()函数中指明要求最大值的区域即可;在Python中,和其他函数一样,如果对整个表直接调用max()函数,则返回该数据表中每一列的最大值。max()函数也可以对每一行求最大值,还可以单独对某一行或某一列求最大值。
5、min求最小值
求最小值与求最大值是相对应的,通过比较一组数据中所有数值的大小,然后返回最小的那个值。
在Excel和Python中都使用min()函数来求最小值,它的使用方法与求最大值的类似,这里不再赘述。示例代码如下。
6、 median求中位数
中位数就是将一组含有n个数据的序列X按从小到大排列,位于中间位置的那个数。
中位数是以中间位置的数来反映数据的一般情况,不容易受到极大值、极小值的影响,因而在反映数据分布情况上要比平均值更有代表性。
现有序列为X:{X1、X2、X3、......、Xn}。
如果n为奇数,则中位数:
如果n为偶数,则中位数:
例如,1、3、5、7、9的中位数为5,而1、3、5、7的中位数为(3+5)/2=4。
在Excel和Python中求一组数据的中位数,都是使用median()函数来实现的。
下面为在Excel中求中位数的示例:
在Python中,median()函数的使用原则和其他函数的一致。
7、mode求众数
顾名思义,众数就是一组数据中出现次数最多的数,求众数就是返回这组数据中出现次数最多的那个数。
在Excel和Python中求众数都使用mode()函数,使用原则与其他函数完全一致。
在Excel中求众数的示例如下:
在Python中求众数的示例如下:
8、var求方差
方差是用来衡量一组数据的离散程度(即数据波动幅度)的。
在Excel和Python中求一组数据中的方差都使用var()函数。
下面为在Excel中求方差的示例:
在Python中,var()函数的使用原则和其他函数的一致。
9、std求标准差
标准差是方差的平方根,二者都是用来表示数据的离散程度的。
在Excel中计算标准差使用的是stdevp()函数,示例如下:
在Python中计算标准差使用的是std()函数,std()函数的使用原则与其他函数的一致,示例如下:
10、quantile求分位数
分位数是比中位数更加详细的基于位置的指标,分位数主要有四分之一分位数、四分之二分位数、四分之三分位数,而四分之二分位数就是中位数。
在Excel中求分位数用的是percentile()函数,示例如下:
在Python中求分位数用的是quantile()函数,要在quantile后的括号中指明要求取的分位数值,quantile()函数与其他函数的使用规则相同。
四、相关性运算
相关性常用来衡量两个事物之间的相关程度,比如我们前面举的例子:啤酒与尿布二者的相关性很强。我们一般用相关系数来衡量两者的相关程度,所以相关性计算其实就是计算相关系数,比较常用的是皮尔逊相关系数。
在Excel中求取相关系数用的是correl()函数,示例如下:
在Python中求取相关系数用的是corr()函数,示例如下:
还可以利用 corr()函数求取整个 DataFrame 表中各字段两两之间的相关性,示例如下:
更多干货内容陆续分享给大家,请持续关注我们吧!
相关推荐
- 无网络单机游戏(好玩的无网络单机游戏)
-
一款能够让我们自由畅快的进行游戏的合集软件。在这个合集之中有着各种各样的单机小游戏。这些小游戏不需要联网就可以玩了,没有防沉迷系统,我们想玩多久就玩多久,合集之中小游戏的类型有很多种,有赛车类、射击类...
- 笔记本电脑推荐理由(推荐笔记本子)
-
配置落后散热出现问题是笔记本报废的主要原因因为旧电脑问题很多。一是现在新电脑价格不算贵,没必要用旧的,电脑可不兴新不如旧的说法;二是二手电脑是否大修过,是否有什么瑕疵,是否运行速度有问题,是否被人监控...
- tplink设置向导(tp link路由器的设置向导)
-
tplink路由器首次设置时才会自动弹出向导,如果希望自动弹出,可先还原出厂设置,然后再登录即可自动弹出,还原出厂设置步骤如下: 1、路由器开启电源; 2、按下路由器表面的reset复位按钮,个别...
- 破解苹果激活锁的万能id(破解iphone id激活锁软件)
-
提前打开我的AppleID界面,点击管理您的账户。点击忘记AppleID,填写与AppleID相关的各项基本信息。通过电子邮件内的链接或回答安全问题,或者进行人工破解。1、登陆苹果官网,点击下面...
- 手机上不了wifi是什么原因(手机上不了网连不了wifi)
-
1.手机wifi已连接不可上网问题出现后首先检测一下是否为手机本身突发性的问题,可以进行关机重启一下再连接看是否还会出现这样的情况。或者使用其他手机或设备连接WiFi试试能否上网。2.如果不是手机的问...
- win10有产品id没有密钥(win10 我没有产品密钥)
-
WIN10,在左下角输入WINDOWSPOWERSHELL,然后点击系统查询结果第一项,在弹出的窗口中输入:(Get-WmiObject-query‘select*fromSoftware...
- win10截屏后找不到了(win10截屏后找不到了怎么办)
-
Win10系统截屏后没有更新通知并不是一个常见的问题。可能是由于系统设置或者安装的软件造成的。如果系统设置为静音或者禁用通知,那么截屏后不会有通知。另外,一些截屏软件可能会阻止系统通知,需要手动设置...
- 运行定时关机命令(运行定时关机命令怎么设置)
-
1、打开电脑,按住【Win+R】组合键,弹出运行命令,在编辑框内输入如下命令:shutdown-s-t3600;电脑定时关机运行2、shutdown-s-t3600命令的含义如下:shut...
- 键盘快捷键(键盘快捷键是哪个)
-
电脑键盘快捷键大全:Ctrl+1,2,3... 功能:切换到从左边数起第1,2,3...个标签Ctrl+A 功能:全部选中当前页面内容Ctrl+C 功能:复制当前选中内容Ctrl+D 功能:打开“添加...
- 宏基acer官网商城(宏基官方商城)
-
宏碁本本底部有个序列号标签,不是粉色的那个,粉色的是系统的序列号,白色的是本本的出厂序列号,上宏碁官网查查你的序列号就知道真假了。在盖子的后面就可以查询到序列号,或者是去网上查询宏碁笔记本在官网下...
- 网盘在哪里打开(华为网盘在哪里打开)
-
给你的是一个网盘地址吧,直接把这个地址放到浏览器地址栏就好了,如果有提取码,他会提示你输入提取码的。一般都是在网上找到百度云链接,然后把文件保存在自己的百度网盘文件夹里面的。打开百度网盘app,...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
慕ke 前端工程师2024「完整」
-
失业程序员复习python笔记——条件与循环
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
