百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python零基础玩转数据分析-缺失值处理#知识点总结

off999 2024-10-22 13:40 31 浏览 0 评论

关注二幺幺统计课堂公众号可以加入学术交流,付费获得各种数据资源。

同学们好我是陈阳,这节课我们来讲解第五章的内容,也就是统计分析能力强化数据的常见处理。

首先来看第一节也就是学生值的处理,数据缺失主要包括记录缺失和字段信息缺失等情况,那么它会对数据分析造成较大的影响,从而导致结果的不准确性更加显著。缺缺失值的处理就有大概有三种方法,今天就讲解这三种,也就是删除记录和数据插补和一个不处理的方法。

我们常见的常用的方法也就是数据的插补,也就是用一些平均值或者中位数或者奇数来填充一些。首先导入三个,就是三个常见的一个包,也就是我们数据分析的三剑客,上节课上一章也讲了当派panas和WEality。

然后来看判断是否有缺失的数据,怎么判断?要用到两个函数,一个是No和not,这两个函数常见的就是 is no,可以用其他的函数代替,主要用的就是 is no,那么它判断的就是缺失值为主,和非缺失值为force,判断就非常简单,我们来看一下具体的例子。

·首先创建两个数据结构,一个是 series和一个 data free,可以直接看了用列表就创建的 Siris对象,然后里面会有缺失值的一个填充填充,里面会元素有缺失值的充充当元素,这张 free就是两个两个两列,里面每一列也有缺失的填充元素。

·后面就是为了来看一下这个,怎么判断是否有缺失数据,所以我构造了这每一列都有缺失的情况。然后对 ser series对象直接调用,就是函数下面series下面这个函数来判断,就是它是否每一个元素是否是缺失值。

·那么它返回就是新的 series,这个 series是由一个布尔注册类型组成的。我们可以看一下,这个就是判断series是否有缺失值的情况。可以简单的来对比一下第五个元素或者缺失的,第五个元素对行就是一个缺失的情况。因为第五个元素就是用缺失指元素填充的,所以它缺失的数据部分会返回去,不缺失就是 Python,这里就可以简单的来判断出哪里是缺失的情况。

·包括如果筛选就是把这个把缺失数据筛选出去就调用,就是下面一个锁引锁引用布尔兹的锁引,就是如返回就是,所以是否为 false的所有的元素的值。

这条语句判断是因为返回的是series对象吗?再等于让它等于false 的选出来,可以直接看出print print zero之后可以看出筛选出来的非缺失的部分。可以看图形图形是不是趋势值的部分,可以直接判断是不是趋势值的部分,筛选出非缺失值的一部分。

·第二列是没有缺失值的,都是筛选过的,它的判断是用能量判断的,所以就会有缺失值对应的,糖就会自动过滤掉。筛选出非缺失值的部分,判断是否为缺失值。

·第三列是没有缺失值的,这个函数可以直接删除,比如再重新新建两个对象,一个是data frame,这里会直接利用对series利用这个对象,叫这调上这个函数,它里面的传入参数就是inplus等于处。这里的意思是为了过滤掉之后的结果是否替换为元素组。这里要注意,如果不把之前在讲plus的时候也讲过,如果不把inplus等于处添上就要重新命名给另一个对象,另一个series对象才能返回一个series,否则是不起作用的。

如果单独调用这个函数然后不插,不传入inplus等于数,不会对原来的series对象产生结果。同样的就是删除确实值,就直接对d w m下面一个serious对象,对应这个函数就会直接删除,这个确实值。而不用先筛选出是否为确实值,然后用布尔索引来筛选,这里就直接用这个函数筛选。

·可以看到这里这里的结果和上面筛选的结果是一模一样的。

·第四行第五行第八个index等于八,然后九都都会删除掉。这个函数可以直接掉,直接用于serious和alt freem。注意刚才也说了,如果是Python就要先把语句复制于另一个Python对象。如果不想复制直接就是 Python plus等于图,也就是直接在原来的Python 或者 Python 中操作。

然后来看一下填充和替补替换趋势是Excel函数,这个函数也是非常强大的,可以用各种方式来填充,比如说函数中位数或者重数来填充。

所接下来就正式来看一下。同样先新建两个结构,一个是 Python,一个是 Python。然后就是最 Python调下面它的平均数一个函数,然后中位数,纵数。这三个函数就要填充的对象,也就是计算Python中的平均数,中数平均数,中位数和重数来填充。可以看一下结果,均数、中位数和重数都表现都表达出来了。这个是中位数下面的一个,直接形成列表,把它计算出计算之后的重数,把它转化列表。

同样如果要用这些数来填充,那就用这个函数,对Python是用这个函数里面传入的第一个参数,要填充的一个Python数值。可以看到这个参数,费用大这个参数,第一个参数就是填充要填充的值,比如说中位数,小数或者或者就是均值都可以。

如果按,还要注意就是Python 函数,如果Python 对象等于图就直接对原来的函数对象操作。刚才上面也讲了一下,也讲了一下,可以直接print 出来把这个用,用季度填充的Excel对象print 出来。可以看到结果,可以看它的数值是四十七点四三。

看一下,第四第五行和第六行都是用四十七点四三来填充的。还有第八行,也是用四十七点四三来填充。也就三个位置是缺失的一个部分。同样的是如果用零填充,可以随意指定数,填充传入的第一个while值,可以随意指定数,零也可以均值也可以中位,中位数也可以都可以,只要是一个具体的数都可以。零填充的结果看一下,零填充。

因为如果用零填充,因为之前这里这条语句直接把确实值已经填充了,可以把直接是先把注视掉,然后再用零填充才能显示出来。看一下,可以看到,就是在第四、第五行、第六行和第九行,分别用零填充的确实值。因为传入的第一个参数是零,所以说很清楚的可以看到像是可以填充确实值的部分。如果我就是还要其他的一些方法,就是函数里的这个函数里面好,还有其他的参数也是非常非常智能的。

比如说master 的。这个方法参数,要传入的用哪一个填充的,如果不传入这个第一个值就要输入这一个值。这个值的参数有几个参数,一个是Python,还有一个是back,这三个是比较重要的。还有一个第一个就是用前面的数据填充,第二个参数就是be fail,一个是 for fail,第一个第二个是 be fail,是用之后的数据填充。什么意思?force you就是用确实值前面的一个数据填充,比如说二十三点零,这个第四位就是二十三点零。

那么第五行怎么办?第五行就是用第四第四行填充的数据来填充。意思就是这两行数据都是二十三点零,这一行第八行的意思是用前面的数据填充,就是五十四,因为前一位数据就是五十四,就填充的也就五十四。可以看具体来看一下。我可以看一下,就是对待df m,第一列的数据来填充,那第二就是攀的,用之前的数据来填充,然后inpised等数,然后就直接对原来的df m进行操作。可以看一下,三,四,五,也就是第四行和第五行,就是用第三行的数据来填充,二十三点,二十三点零都是用二十三点零填充的。而第八行是用第七行的数据来填充,前面的数据,同样的,如果这改成就是bfo的,就会后一个数据来填充。

而后一个数据怎么来看?比如说第五行是趋势值的,后一行就是六十六,以后这个会是六十六,同样的这一个也是六十六,因为是按照后一个来填充的,依次类推的。

这节课就讲到这里,下节课再见。

相关推荐

手机上不了wifi是什么原因(手机上不了网连不了wifi)

1.手机wifi已连接不可上网问题出现后首先检测一下是否为手机本身突发性的问题,可以进行关机重启一下再连接看是否还会出现这样的情况。或者使用其他手机或设备连接WiFi试试能否上网。2.如果不是手机的问...

桌面图标大小设置(怎么修改桌面图标大小设置)
  • 桌面图标大小设置(怎么修改桌面图标大小设置)
  • 桌面图标大小设置(怎么修改桌面图标大小设置)
  • 桌面图标大小设置(怎么修改桌面图标大小设置)
  • 桌面图标大小设置(怎么修改桌面图标大小设置)
win10有产品id没有密钥(win10 我没有产品密钥)

WIN10,在左下角输入WINDOWSPOWERSHELL,然后点击系统查询结果第一项,在弹出的窗口中输入:(Get-WmiObject-query‘select*fromSoftware...

win10截屏后找不到了(win10截屏后找不到了怎么办)

Win10系统截屏后没有更新通知并不是一个常见的问题。可能是由于系统设置或者安装的软件造成的。如果系统设置为静音或者禁用通知,那么截屏后不会有通知。另外,一些截屏软件可能会阻止系统通知,需要手动设置...

微软官网win10家庭版下载(微软官网win10家庭版下载速度慢)
  • 微软官网win10家庭版下载(微软官网win10家庭版下载速度慢)
  • 微软官网win10家庭版下载(微软官网win10家庭版下载速度慢)
  • 微软官网win10家庭版下载(微软官网win10家庭版下载速度慢)
  • 微软官网win10家庭版下载(微软官网win10家庭版下载速度慢)
运行定时关机命令(运行定时关机命令怎么设置)

1、打开电脑,按住【Win+R】组合键,弹出运行命令,在编辑框内输入如下命令:shutdown-s-t3600;电脑定时关机运行2、shutdown-s-t3600命令的含义如下:shut...

win7打印机共享设置(详细图文步骤)
  • win7打印机共享设置(详细图文步骤)
  • win7打印机共享设置(详细图文步骤)
  • win7打印机共享设置(详细图文步骤)
  • win7打印机共享设置(详细图文步骤)
键盘快捷键(键盘快捷键是哪个)

电脑键盘快捷键大全:Ctrl+1,2,3... 功能:切换到从左边数起第1,2,3...个标签Ctrl+A 功能:全部选中当前页面内容Ctrl+C 功能:复制当前选中内容Ctrl+D 功能:打开“添加...

宏基acer官网商城(宏基官方商城)

宏碁本本底部有个序列号标签,不是粉色的那个,粉色的是系统的序列号,白色的是本本的出厂序列号,上宏碁官网查查你的序列号就知道真假了。在盖子的后面就可以查询到序列号,或者是去网上查询宏碁笔记本在官网下...

网盘在哪里打开(华为网盘在哪里打开)

给你的是一个网盘地址吧,直接把这个地址放到浏览器地址栏就好了,如果有提取码,他会提示你输入提取码的。一般都是在网上找到百度云链接,然后把文件保存在自己的百度网盘文件夹里面的。打开百度网盘app,...

win10系统安全模式怎么进入(win10安全模式如何进入)
  • win10系统安全模式怎么进入(win10安全模式如何进入)
  • win10系统安全模式怎么进入(win10安全模式如何进入)
  • win10系统安全模式怎么进入(win10安全模式如何进入)
  • win10系统安全模式怎么进入(win10安全模式如何进入)
win7sp1专业版(win7专业版vl)

Win7系统SP1是系统发布后第一个SP包x64是64位操作系统。Windows7指的是微软公司的Windows7操作系统ultimate指的是旗舰版(with表示伴随,说明这是提供商所提供...

手写输入法手写板怎么设置(手写输入法手写板怎么设置 iphone)

手写输入法设置方法:1、打开手机至桌面主页,保持手机处于工作状态;  2、在手机桌面主页列表找到设置,点击打开并进入设置主界面;  3、在设置主界面找到系统设置选项,点击打开并进入系统设置主界面;  ...

推荐杀毒软件(下载杀毒软件最新版)
推荐杀毒软件(下载杀毒软件最新版)

好的杀毒软件有360杀毒,金山毒霸,AVG杀毒等等。1,360杀毒,品牌介绍:360安全卫士品牌是一款由奇虎360公司推出的功能强、效果好、受用户欢迎的安全杀毒软件。360安全卫士拥有查杀木马、清理插件、修复漏洞、电脑体检、电脑救援、保护隐...

2025-11-12 08:51 off999

百度云盘官网(百度云盘官网下载)

网盘在手机上面仅仅是一个图标,他是不占用手机硬盘的,当然,如果你从网盘上下载了文件到本地,下载的文件就会占用手机的硬盘空间。要找到这个文件,可以通过文件管理器来进行查找,也可以通过路径的方式来查找,但...

取消回复欢迎 发表评论: