Python零基础玩转数据分析-缺失值处理#知识点总结
off999 2024-10-22 13:40 39 浏览 0 评论
关注二幺幺统计课堂公众号可以加入学术交流,付费获得各种数据资源。
同学们好我是陈阳,这节课我们来讲解第五章的内容,也就是统计分析能力强化数据的常见处理。
首先来看第一节也就是学生值的处理,数据缺失主要包括记录缺失和字段信息缺失等情况,那么它会对数据分析造成较大的影响,从而导致结果的不准确性更加显著。缺缺失值的处理就有大概有三种方法,今天就讲解这三种,也就是删除记录和数据插补和一个不处理的方法。
我们常见的常用的方法也就是数据的插补,也就是用一些平均值或者中位数或者奇数来填充一些。首先导入三个,就是三个常见的一个包,也就是我们数据分析的三剑客,上节课上一章也讲了当派panas和WEality。
然后来看判断是否有缺失的数据,怎么判断?要用到两个函数,一个是No和not,这两个函数常见的就是 is no,可以用其他的函数代替,主要用的就是 is no,那么它判断的就是缺失值为主,和非缺失值为force,判断就非常简单,我们来看一下具体的例子。
·首先创建两个数据结构,一个是 series和一个 data free,可以直接看了用列表就创建的 Siris对象,然后里面会有缺失值的一个填充填充,里面会元素有缺失值的充充当元素,这张 free就是两个两个两列,里面每一列也有缺失的填充元素。
·后面就是为了来看一下这个,怎么判断是否有缺失数据,所以我构造了这每一列都有缺失的情况。然后对 ser series对象直接调用,就是函数下面series下面这个函数来判断,就是它是否每一个元素是否是缺失值。
·那么它返回就是新的 series,这个 series是由一个布尔注册类型组成的。我们可以看一下,这个就是判断series是否有缺失值的情况。可以简单的来对比一下第五个元素或者缺失的,第五个元素对行就是一个缺失的情况。因为第五个元素就是用缺失指元素填充的,所以它缺失的数据部分会返回去,不缺失就是 Python,这里就可以简单的来判断出哪里是缺失的情况。
·包括如果筛选就是把这个把缺失数据筛选出去就调用,就是下面一个锁引锁引用布尔兹的锁引,就是如返回就是,所以是否为 false的所有的元素的值。
这条语句判断是因为返回的是series对象吗?再等于让它等于false 的选出来,可以直接看出print print zero之后可以看出筛选出来的非缺失的部分。可以看图形图形是不是趋势值的部分,可以直接判断是不是趋势值的部分,筛选出非缺失值的一部分。
·第二列是没有缺失值的,都是筛选过的,它的判断是用能量判断的,所以就会有缺失值对应的,糖就会自动过滤掉。筛选出非缺失值的部分,判断是否为缺失值。
·第三列是没有缺失值的,这个函数可以直接删除,比如再重新新建两个对象,一个是data frame,这里会直接利用对series利用这个对象,叫这调上这个函数,它里面的传入参数就是inplus等于处。这里的意思是为了过滤掉之后的结果是否替换为元素组。这里要注意,如果不把之前在讲plus的时候也讲过,如果不把inplus等于处添上就要重新命名给另一个对象,另一个series对象才能返回一个series,否则是不起作用的。
如果单独调用这个函数然后不插,不传入inplus等于数,不会对原来的series对象产生结果。同样的就是删除确实值,就直接对d w m下面一个serious对象,对应这个函数就会直接删除,这个确实值。而不用先筛选出是否为确实值,然后用布尔索引来筛选,这里就直接用这个函数筛选。
·可以看到这里这里的结果和上面筛选的结果是一模一样的。
·第四行第五行第八个index等于八,然后九都都会删除掉。这个函数可以直接掉,直接用于serious和alt freem。注意刚才也说了,如果是Python就要先把语句复制于另一个Python对象。如果不想复制直接就是 Python plus等于图,也就是直接在原来的Python 或者 Python 中操作。
然后来看一下填充和替补替换趋势是Excel函数,这个函数也是非常强大的,可以用各种方式来填充,比如说函数中位数或者重数来填充。
所接下来就正式来看一下。同样先新建两个结构,一个是 Python,一个是 Python。然后就是最 Python调下面它的平均数一个函数,然后中位数,纵数。这三个函数就要填充的对象,也就是计算Python中的平均数,中数平均数,中位数和重数来填充。可以看一下结果,均数、中位数和重数都表现都表达出来了。这个是中位数下面的一个,直接形成列表,把它计算出计算之后的重数,把它转化列表。
同样如果要用这些数来填充,那就用这个函数,对Python是用这个函数里面传入的第一个参数,要填充的一个Python数值。可以看到这个参数,费用大这个参数,第一个参数就是填充要填充的值,比如说中位数,小数或者或者就是均值都可以。
如果按,还要注意就是Python 函数,如果Python 对象等于图就直接对原来的函数对象操作。刚才上面也讲了一下,也讲了一下,可以直接print 出来把这个用,用季度填充的Excel对象print 出来。可以看到结果,可以看它的数值是四十七点四三。
看一下,第四第五行和第六行都是用四十七点四三来填充的。还有第八行,也是用四十七点四三来填充。也就三个位置是缺失的一个部分。同样的是如果用零填充,可以随意指定数,填充传入的第一个while值,可以随意指定数,零也可以均值也可以中位,中位数也可以都可以,只要是一个具体的数都可以。零填充的结果看一下,零填充。
因为如果用零填充,因为之前这里这条语句直接把确实值已经填充了,可以把直接是先把注视掉,然后再用零填充才能显示出来。看一下,可以看到,就是在第四、第五行、第六行和第九行,分别用零填充的确实值。因为传入的第一个参数是零,所以说很清楚的可以看到像是可以填充确实值的部分。如果我就是还要其他的一些方法,就是函数里的这个函数里面好,还有其他的参数也是非常非常智能的。
比如说master 的。这个方法参数,要传入的用哪一个填充的,如果不传入这个第一个值就要输入这一个值。这个值的参数有几个参数,一个是Python,还有一个是back,这三个是比较重要的。还有一个第一个就是用前面的数据填充,第二个参数就是be fail,一个是 for fail,第一个第二个是 be fail,是用之后的数据填充。什么意思?force you就是用确实值前面的一个数据填充,比如说二十三点零,这个第四位就是二十三点零。
那么第五行怎么办?第五行就是用第四第四行填充的数据来填充。意思就是这两行数据都是二十三点零,这一行第八行的意思是用前面的数据填充,就是五十四,因为前一位数据就是五十四,就填充的也就五十四。可以看具体来看一下。我可以看一下,就是对待df m,第一列的数据来填充,那第二就是攀的,用之前的数据来填充,然后inpised等数,然后就直接对原来的df m进行操作。可以看一下,三,四,五,也就是第四行和第五行,就是用第三行的数据来填充,二十三点,二十三点零都是用二十三点零填充的。而第八行是用第七行的数据来填充,前面的数据,同样的,如果这改成就是bfo的,就会后一个数据来填充。
而后一个数据怎么来看?比如说第五行是趋势值的,后一行就是六十六,以后这个会是六十六,同样的这一个也是六十六,因为是按照后一个来填充的,依次类推的。
这节课就讲到这里,下节课再见。
相关推荐
- 戴尔官网官方网站(戴尔产品官网)
-
查询步骤如下:1.在戴尔电脑的后盖上找到服务编号,并记录下来。2.之后搜索戴尔官网,在打开的官网界面中点击上方的支持选项,并点击产品支持。3.在打开的产品支持界面中,输入电脑后盖上的服务编号。4.如果...
- 黑鲨u盘重装系统教程(黑鲨u盘重装系统步骤8)
-
U盘重装WIn10系统:1、用【u深度u盘启动盘制作工具】制作u盘启动盘,插入电脑usb接口,设置好开机启动项进入u深度主菜单界面,选择“【02】u深度win8pe标准版(新机器)”并回车,2、在u深...
- 电子邮件免费注册入口(电子邮件在线注册)
-
1.在网页上搜索maiI163邮箱登录,如果有邮箱账号密码的话就直接输入并点击“登录”,没有的话就点击“立即注册”。2.点击“立即注册”后进入页面,输入信息点击“注册”。3.注册成功后就直接搜索登录。...
-
- win7如何快速启动(windows7如何快速启动)
-
打开操作系统运行:输入"cmd"并点击回车:系统命令提示符自动打开:使用方法直接运行start打开一个新的命令提示符窗口:运行start+文件的绝对存储路径打开对应的文件:运行start+文件夹路径打开对应...
-
2025-12-29 13:03 off999
- 怎么升级到win11(怎么升级到win11专业版)
-
Windows11可以在「开始菜单-设置-Windows更新」中进行手动更新。如果您想主动更新,需先确保您的电脑符合Windows11的最低系统要求。接着,打开「Windows更...
- 微信好友误删了怎么加回来(微信好友误删了怎么加回来免费)
-
看到他的评论的话,你可以去你发过的内容里去看看。<br/><br/>好友验证的消息、语音)或者朋友圈内容:<br/>如果你这个朋友喜欢和你在朋友圈聊天的话,你他的手机号也有的话方法添加里输入就可...
-
- access安装包(access安装包怎么安装)
-
要下载并安装MicrosoftAccess,可以按照以下步骤进行操作:1.打开您的电脑的浏览器(如谷歌浏览器、火狐浏览器等)。2.在浏览器的搜索栏中输入"下载MicrosoftAccess"。3.从搜索结果中选择适...
-
2025-12-29 11:51 off999
- 云骑士装机大师官方网站(云骑士装机大师软件下载)
-
就是感觉正规吧,还有就是小白那种的比较多,专业店一忽悠就掏钱做系统了。懂装机的哪有花钱去装系统的不靠谱,因为会造成个人信息的泄露。云骑士装机大师是网络装机系统,在网络上能够实现一键装机,非常的简洁方便...
- 万能钥匙下载免费(安心上网万能钥匙下载免费)
-
行1.使用手机功能表中自带的浏览器上网,直接搜索需要的软件进行下载安装(下载安卓版本格式为apk)。2.使用电脑下载APK格式的安装包,连接数据线传输至手机,操作手机在应用程序-我的文件中找到安装包,...
- 500兆宽带用什么路由器(家用路由器什么牌子好 信号强)
-
1、飞鱼星千兆无线路由器家用2600M双频企业级高速穿墙500M光纤游戏加速VW1900/千兆双频/1900M/大型企业路由器无线500m推荐理由:可以提供企业级别的性能,空旷环境覆盖更广大,...
- xp系统怎么卸载软件(xp怎么卸载程序)
-
1、选中此电脑,点击鼠标右键。2、选择属性点击一下。3、在打开的界面选择控制面板。4、点击程序选项下方的卸载。5、选择要卸载的程序软件,点击鼠标右键。6、点击弹出的选项卸载/更改。7、也可以使用电脑管...
- 笔记本电脑系统修复软件(笔记本电脑程序修复)
-
1、超级兔子2013系统修复软件超级兔子是一款完整的系统维护工具。拥有电脑系统评测、垃圾清理和注册表清理、可疑文件和插件检测、网页防护等功能,同时自带一些实用的系统工具,可清理你大多数的文件、注册表里...
- 联想保修服务包括哪些(联想保修都保修什么)
-
1、保修36个月的硬件包括:CPU、内存。2、保修24个月的硬件包括:主板、显卡、LCD屏、硬盘、电源适配器、键盘、鼠标模块。3、保修12个月的硬件包括:LCD之附件、光驱、DVD、CDR/W、软驱...
- 系统科学大会(中国系统科学学会)
-
2021年各种科学大会的召开时间取决于疫情的发展和国家政策的调整。一些大型的国际科学会议可能会推迟或者采用线上形式进行,以保障参会人员的安全和健康。同时,一些国内的学术会议也会受到疫情的影响,需要推迟...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
python入门到脱坑 输入与输出—str()函数
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
失业程序员复习python笔记——条件与循环
-
系统u盘安装(win11系统u盘安装)
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
