Python零基础玩转数据分析-缺失值处理#知识点总结
off999 2024-10-22 13:40 27 浏览 0 评论
关注二幺幺统计课堂公众号可以加入学术交流,付费获得各种数据资源。
同学们好我是陈阳,这节课我们来讲解第五章的内容,也就是统计分析能力强化数据的常见处理。
首先来看第一节也就是学生值的处理,数据缺失主要包括记录缺失和字段信息缺失等情况,那么它会对数据分析造成较大的影响,从而导致结果的不准确性更加显著。缺缺失值的处理就有大概有三种方法,今天就讲解这三种,也就是删除记录和数据插补和一个不处理的方法。
我们常见的常用的方法也就是数据的插补,也就是用一些平均值或者中位数或者奇数来填充一些。首先导入三个,就是三个常见的一个包,也就是我们数据分析的三剑客,上节课上一章也讲了当派panas和WEality。
然后来看判断是否有缺失的数据,怎么判断?要用到两个函数,一个是No和not,这两个函数常见的就是 is no,可以用其他的函数代替,主要用的就是 is no,那么它判断的就是缺失值为主,和非缺失值为force,判断就非常简单,我们来看一下具体的例子。
·首先创建两个数据结构,一个是 series和一个 data free,可以直接看了用列表就创建的 Siris对象,然后里面会有缺失值的一个填充填充,里面会元素有缺失值的充充当元素,这张 free就是两个两个两列,里面每一列也有缺失的填充元素。
·后面就是为了来看一下这个,怎么判断是否有缺失数据,所以我构造了这每一列都有缺失的情况。然后对 ser series对象直接调用,就是函数下面series下面这个函数来判断,就是它是否每一个元素是否是缺失值。
·那么它返回就是新的 series,这个 series是由一个布尔注册类型组成的。我们可以看一下,这个就是判断series是否有缺失值的情况。可以简单的来对比一下第五个元素或者缺失的,第五个元素对行就是一个缺失的情况。因为第五个元素就是用缺失指元素填充的,所以它缺失的数据部分会返回去,不缺失就是 Python,这里就可以简单的来判断出哪里是缺失的情况。
·包括如果筛选就是把这个把缺失数据筛选出去就调用,就是下面一个锁引锁引用布尔兹的锁引,就是如返回就是,所以是否为 false的所有的元素的值。
这条语句判断是因为返回的是series对象吗?再等于让它等于false 的选出来,可以直接看出print print zero之后可以看出筛选出来的非缺失的部分。可以看图形图形是不是趋势值的部分,可以直接判断是不是趋势值的部分,筛选出非缺失值的一部分。
·第二列是没有缺失值的,都是筛选过的,它的判断是用能量判断的,所以就会有缺失值对应的,糖就会自动过滤掉。筛选出非缺失值的部分,判断是否为缺失值。
·第三列是没有缺失值的,这个函数可以直接删除,比如再重新新建两个对象,一个是data frame,这里会直接利用对series利用这个对象,叫这调上这个函数,它里面的传入参数就是inplus等于处。这里的意思是为了过滤掉之后的结果是否替换为元素组。这里要注意,如果不把之前在讲plus的时候也讲过,如果不把inplus等于处添上就要重新命名给另一个对象,另一个series对象才能返回一个series,否则是不起作用的。
如果单独调用这个函数然后不插,不传入inplus等于数,不会对原来的series对象产生结果。同样的就是删除确实值,就直接对d w m下面一个serious对象,对应这个函数就会直接删除,这个确实值。而不用先筛选出是否为确实值,然后用布尔索引来筛选,这里就直接用这个函数筛选。
·可以看到这里这里的结果和上面筛选的结果是一模一样的。
·第四行第五行第八个index等于八,然后九都都会删除掉。这个函数可以直接掉,直接用于serious和alt freem。注意刚才也说了,如果是Python就要先把语句复制于另一个Python对象。如果不想复制直接就是 Python plus等于图,也就是直接在原来的Python 或者 Python 中操作。
然后来看一下填充和替补替换趋势是Excel函数,这个函数也是非常强大的,可以用各种方式来填充,比如说函数中位数或者重数来填充。
所接下来就正式来看一下。同样先新建两个结构,一个是 Python,一个是 Python。然后就是最 Python调下面它的平均数一个函数,然后中位数,纵数。这三个函数就要填充的对象,也就是计算Python中的平均数,中数平均数,中位数和重数来填充。可以看一下结果,均数、中位数和重数都表现都表达出来了。这个是中位数下面的一个,直接形成列表,把它计算出计算之后的重数,把它转化列表。
同样如果要用这些数来填充,那就用这个函数,对Python是用这个函数里面传入的第一个参数,要填充的一个Python数值。可以看到这个参数,费用大这个参数,第一个参数就是填充要填充的值,比如说中位数,小数或者或者就是均值都可以。
如果按,还要注意就是Python 函数,如果Python 对象等于图就直接对原来的函数对象操作。刚才上面也讲了一下,也讲了一下,可以直接print 出来把这个用,用季度填充的Excel对象print 出来。可以看到结果,可以看它的数值是四十七点四三。
看一下,第四第五行和第六行都是用四十七点四三来填充的。还有第八行,也是用四十七点四三来填充。也就三个位置是缺失的一个部分。同样的是如果用零填充,可以随意指定数,填充传入的第一个while值,可以随意指定数,零也可以均值也可以中位,中位数也可以都可以,只要是一个具体的数都可以。零填充的结果看一下,零填充。
因为如果用零填充,因为之前这里这条语句直接把确实值已经填充了,可以把直接是先把注视掉,然后再用零填充才能显示出来。看一下,可以看到,就是在第四、第五行、第六行和第九行,分别用零填充的确实值。因为传入的第一个参数是零,所以说很清楚的可以看到像是可以填充确实值的部分。如果我就是还要其他的一些方法,就是函数里的这个函数里面好,还有其他的参数也是非常非常智能的。
比如说master 的。这个方法参数,要传入的用哪一个填充的,如果不传入这个第一个值就要输入这一个值。这个值的参数有几个参数,一个是Python,还有一个是back,这三个是比较重要的。还有一个第一个就是用前面的数据填充,第二个参数就是be fail,一个是 for fail,第一个第二个是 be fail,是用之后的数据填充。什么意思?force you就是用确实值前面的一个数据填充,比如说二十三点零,这个第四位就是二十三点零。
那么第五行怎么办?第五行就是用第四第四行填充的数据来填充。意思就是这两行数据都是二十三点零,这一行第八行的意思是用前面的数据填充,就是五十四,因为前一位数据就是五十四,就填充的也就五十四。可以看具体来看一下。我可以看一下,就是对待df m,第一列的数据来填充,那第二就是攀的,用之前的数据来填充,然后inpised等数,然后就直接对原来的df m进行操作。可以看一下,三,四,五,也就是第四行和第五行,就是用第三行的数据来填充,二十三点,二十三点零都是用二十三点零填充的。而第八行是用第七行的数据来填充,前面的数据,同样的,如果这改成就是bfo的,就会后一个数据来填充。
而后一个数据怎么来看?比如说第五行是趋势值的,后一行就是六十六,以后这个会是六十六,同样的这一个也是六十六,因为是按照后一个来填充的,依次类推的。
这节课就讲到这里,下节课再见。
相关推荐
- 大文件传不动?WinRAR/7-Zip 入门到高手,这 5 个技巧让你效率翻倍
-
“这200张照片怎么传给女儿?微信发不了,邮箱附件又超限……”62岁的张阿姨对着电脑犯愁时,儿子只用了3分钟就把照片压缩成一个文件,还教她:“以后用压缩软件,比打包行李还方便!”职场人更懂这...
- 电脑解压缩软件推荐——7-Zip:免费、高效、简洁的文件管理神器
-
在日常工作中,我们经常需要处理压缩文件。无论是下载软件包、接收文件,还是存储大量数据,压缩和解压缩文件都成为了我们日常操作的一部分。而说到压缩解压软件,7-Zip绝对是一个不可忽视的名字。今天,我就来...
- 设置了加密密码zip文件要如何打开?这几个方法可以试试~
-
Zip是一种常见的压缩格式文件,文件还可以设置密码保护。那设置了密码的Zip文件要如何打开呢?不清楚的小伙伴一起来看看吧。当我们知道密码想要打开带密码的Zip文件,我们需要用到适用于Zip格式的解压缩...
- 大文件想要传输成功,怎么把ZIP文件分卷压缩
-
不知道各位小伙伴有没有这样的烦恼,发送很大很大的压缩包会受到限制,为此,想要在压缩过程中将文件拆分为几个压缩包并且同时为所有压缩包设置加密应该如何设置?方法一:使用7-Zip免费且强大的文件管理工具7...
- 高效处理 RAR 分卷压缩包:合并解压操作全攻略
-
在文件传输和存储过程中,当遇到大文件时,我们常常会使用分卷压缩的方式将其拆分成多个较小的压缩包,方便存储和传输。RAR作为一种常见的压缩格式,分卷压缩包的使用频率也很高。但很多人在拿到RAR分卷...
- 2个方法教你如何删除ZIP压缩包密码
-
zip压缩包设置了加密密码,每次解压文件都需要输入密码才能够顺利解压出文件,当压缩包文件不再需要加密的时候,大家肯定想删除压缩包密码,或是忘记了压缩包密码,想要通过删除操作将压缩包密码删除,就能够顺利...
- 速转!漏洞预警丨压缩软件Winrar目录穿越漏洞
-
WinRAR是一款功能强大的压缩包管理器,它是档案工具RAR在Windows环境下的图形界面。该软件可用于备份数据,缩减电子邮件附件的大小,解压缩从Internet上下载的RAR、ZIP及其它类...
- 文件解压方法和工具分享_文件解压工具下载
-
压缩文件减少文件大小,降低文件失效的概率,总得来说好处很多。所以很多文件我们下载下来都是压缩软件,很多小伙伴不知道怎么解压,或者不知道什么工具更好,所以今天做了文件解压方法和工具的分享给大家。一、解压...
- [python]《Python编程快速上手:让繁琐工作自动化》学习笔记3
-
1.组织文件笔记(第9章)(代码下载)1.1文件与文件路径通过importshutil调用shutil模块操作目录,shutil模块能够在Python程序中实现文件复制、移动、改名和删除;同时...
- Python内置tarfile模块:读写 tar 归档文件详解
-
一、学习目标1.1学习目标掌握Python内置模块tarfile的核心功能,包括:理解tar归档文件的原理与常见压缩格式(gzip/bz2/lzma)掌握tar文件的读写操作(创建、解压、查看、过滤...
- 使用python展开tar包_python拓展
-
类Unix的系统,打包文件经常使用的就是tar包,结合zip工具,可以方便的打包并解压。在python的标准库里面有tarfile库,可以方便实现生成了展开tar包。使用这个库最大的好处,可能就在于不...
- 银狐钓鱼再升级:白文件脚本化实现GO语言后门持久驻留
-
近期,火绒威胁情报中心监测到一批相对更为活跃的“银狐”系列变种木马。火绒安全工程师第一时间获取样本并进行分析。分析发现,该样本通过阿里云存储桶下发恶意文件,采用AppDomainManager进行白利...
- ZIP文件怎么打开?2个简单方法教你轻松搞定!
-
在日常工作和生活中,我们经常会遇到各种压缩文件,其中最常见的格式之一就是ZIP。ZIP文件通过压缩数据来减少文件大小,方便我们进行存储和传输。然而,对于初学者来说,如何打开ZIP文件可能会成为一个小小...
- Ubuntu—解压多个zip压缩文件.zip .z01 .z02
-
方法将所有zip文件放在同一目录中:zip_file.z01,zip_file.z02,zip_file.z03,...,zip_file.zip。在Zip3.0版本及以上,使用下列命令:将所有zi...
- 如何使用7-Zip对文件进行加密压缩
-
7-Zip是一款开源的文件归档工具,支持多种压缩格式,并提供了对压缩文件进行加密的功能。使用7-Zip可以轻松创建和解压.7z、.zip等格式的压缩文件,并且可以通过设置密码来保护压缩包中的...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)