Seaborn常见绘图总结-Categorical plots(分类图)
off999 2024-11-24 20:07 22 浏览 0 评论
上篇说到使用seaborn来绘制Relational plots(关系图),本篇来重点介绍Categorical plots(分类图)。
这里使用的数据还是seaborn的默认数据,理解数据的含义,对分析问题往往起着事半功倍的效果。
https://github.com/mwaskom/seaborn-data
Categorical plots(分类图)
- Categorical plots(分类图)可以具体分为下面三种类型,8个小图:
stripplot(分布散点图)
swarmplot(分布密度散点图) - Categorical distribution plots(分类分布图)
boxplot(箱线图)
violinplot(小提琴图)
boxenplot(字母价值图) - Categorical estimate plots(分类估计图)
pointplot(点图)
barplot(条形图)
countplot(计数统计图)
1 Categorical scatterplots(分类散点图)
1.1 stripplot(分布散点图)
stripplot(分布散点图)的意思就是按照不同类别对样本数据进行分布散点图绘制。stripplot(分布散点图)一般并不单独绘制,它常常与boxplot和violinplot联合起来绘制,作为这两种图的补充。
seaborn.stripplot(x=None, y=None, hue=None, data=None, order=None,hue_order=None, jitter=True, dodge=False, orient=None, color=None,palette=None, size=5, edgecolor='gray', linewidth=0, ax=None, **kwargs)- x,y,data:输入数据可以多种格式传递,在大多数情况下,使用Numpy或Python对象是可能的,但是更可取的是pandas对象,因为相关的名称将用于对轴进行注释。此外,还可以对分组变量使用分类类型来控制情节元素的顺序。
- order:用order参数进行筛选分类类别,例如:order=[‘sun’,‘sat’];
- jitter:抖动项,表示抖动程度,可以使float,或者True;
- dodge:重叠区域是否分开,当使用hue时,将其设置为True,将沿着分类轴将不同色调级别的条带分开。
- orient:“v” | “h”,vertical(垂直) 和 horizontal(水平)的意思;
基本的图
tips = sns.load_dataset("tips")
ax = sns.stripplot(x="day", y="total_bill", data=tips)多增加几个参数的修改:
ax = sns.stripplot(x="day", y="total_bill", hue="smoker",data=tips,
jitter=True,palette="Set2", dodge=True)1.2 swarmplot(分布密度散点图)
这个函数类似于stripplot(),但是对点进行了调整(只沿着分类轴),这样它们就不会重叠。这更好地表示了值的分布,但它不能很好地扩展到大量的观测。
seaborn.swarmplot(x=None, y=None, hue=None, data=None, order=None,hue_order=None, dodge=False, orient=None, color=None, palette=None, size=5,edgecolor='gray', linewidth=0, ax=None, **kwargs)可以看出,swarmplot和stripplot参数上基本一致,少了jitter,因为它显示的是分布密度,不需要添加抖动项。
ax = sns.swarmplot(x="day", y="total_bill", data=tips)多增加几个参数的修改:
ax = sns.swarmplot(x="day", y="total_bill", hue="smoker",data=tips,palette="Set2", dodge=True)2 Categorical distribution plots(分类分布图)
2.1 boxplot(箱线图)
boxplot(箱线图,又称为盒须图、盒式图)便于在变量之间或跨类别变量级别比较的方式,显示定量数据的分布情况。框显示数据集的四分位数,线显示分布的其余部分,它能显示出一组数据的最大值、最小值、中位数及上下四分位数,使用四分位数范围函数的方法可以确定“离群值”的点。具体用法如下:
seaborn.boxplot(x=None, y=None, hue=None, data=None, order=None,hue_order=None, orient=None, color=None, palette=None, saturation=0.75,width=0.8, dodge=True, fliersize=5, linewidth=None, whis=1.5, notch=False, ax=None, **kwargs)- saturation:饱和度,可设置为1;
- width:float,控制箱型图的宽度大小;
- fliersize:float,用于指示离群值观察的标记大小;
- whis:可理解为异常值的上限IQR比例;
ax = sns.boxplot(x="day", y="total_bill", data=tips)#这些参数不一定要加,简单最好,这里只是为了展示参数的含义
ax = sns.boxplot(x="day", y="total_bill", hue="time",data=tips,linewidth=0.5,saturation=1,width=1,fliersize=3)2.2 violinplot(小提琴图)
violinplot与boxplot扮演类似的角色,箱线图展示了分位数的位置,它显示了定量数据在一个(或多个)分类变量的多个层次上的分布,这些分布可以进行比较。不像箱形图中所有绘图组件都对应于实际数据点,小提琴绘图以基础分布的核密度估计为特征,通过小提琴图可以知道哪些位置的密度较高。在图中,白点是中位数,黑色盒型的范围是下四分位点到上四分位点,细黑线表示须。外部形状即为核密度估计。
这是一种可以同时显示多个数据分布的有效和有吸引力的方法,但请记住,估计过程受样本大小的影响,相对较小的样本的小提琴手看起来可能会显得非常平滑。具体用法如下:
seaborn.violinplot(x=None, y=None, hue=None, data=None, order=None,hue_order=None, bw='scott', cut=2, scale='area', scale_hue=True, gridsize=100,width=0.8, inner='box', split=False, dodge=True, orient=None, linewidth=None,color=None, palette=None, saturation=0.75, ax=None, **kwargs)- bw:‘scott’, ‘silverman’, float,控制拟合程度。在计算内核带宽时,可以引用规则的名称(‘scott’, ‘silverman’)或者使用比例(float)。实际内核大小将通过将比例乘以每个bin内数据的标准差来确定;
- cut:空值外壳的延伸超过极值点的密度,float;
- scale:“area”, “count”, “width”,用来缩放每把小提琴的宽度的方法;
- scale_hue:当使用hue分类后,设置为True时,此参数确定是否在主分组变量进行缩放;
- gridsize:设置小提琴图的平滑度,越高越平滑;
- inner:“box”, “quartile”, “point”, “stick”, None,小提琴内部数据点的表示。分别表示:箱子,四分位,点,数据线和不表示;
- split:是否拆分,当设置为True时,绘制经hue分类的每个级别画出一半的小提琴;
ax = sns.violinplot(x="day", y="total_bill", data=tips)设置按性别分类,调色为“Set2”,分割,以计数的方式,不表示内部。
ax = sns.violinplot(x="day", y="total_bill", hue="sex",data=tips,palette="Set2", split=True,scale="count", inner=None)
2.3 violinplot+stripplot(小提琴图+分布散点图)
ax = sns.violinplot(x="tip", y="day", data=tips, inner=None,whis=np.inf)
ax = sns.stripplot(x="tip", y="day", data=tips,jitter=True, color="c")2.4 violinplot+swarmplot(小提琴图+分布密度散点图)
ax = sns.violinplot(x="tip", y="day", data=tips,inner=None, whis=np.inf)
ax = sns.swarmplot(x="tip", y="day", data=tips, color="c")2.5 boxplot+stripplot(箱线图+分布散点图)
ax = sns.boxplot(x="tip", y="day", data=tips, whis=np.inf)
ax = sns.stripplot(x="tip", y="day", data=tips,jitter=True, color="c")2.6 boxplot+swarmplot(箱线图+分布密度散点图)
ax = sns.boxplot(x="tip", y="day", data=tips, whis=np.inf)
ax = sns.swarmplot(x="tip", y="day", data=tips, color="c")3 Categorical estimate plots(分类估计图)
3.1 barplot(条形图)
条形图表示数值变量与每个矩形高度的中心趋势的估计值,用矩形条表示点估计和置信区间,并使用误差线提供关于该估计值附近的不确定性的一些指示。具体用法如下:
seaborn.barplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None,estimator=<function mean>, ci=95, n_boot=1000, units=None, orient=None,color=None, palette=None, saturation=0.75, errcolor='.26', errwidth=None,capsize=None, dodge=True, ax=None, **kwargs)- estimator:用于估计每个分类箱内的统计函数,默认为mean。当然你也可以设置estimator=np.median/np.std/np.var……
- order:选择和空值顺序,例如:order=[‘Sat’,‘Sun’];
- ci:允许的误差的范围(控制误差棒的百分比,在0-100之间),若填写"sd",则用标准误差(默认为95),也可设置ci=None;
- capsize:设置误差棒帽条(上下两根横线)的宽度,float;
- saturation:饱和度;
- errcolor:表示置信区间的线条的颜色;
- errwidth:float,设置误差条线(和帽)的厚度。
根据性别分组:
ax = sns.barplot(x="day", y="total_bill", hue="sex", data=tips)设置estimator为中位数(numpy的统计函数都可以,只要你觉得有意义),设置误差棒的宽度,误差棒的颜色为“c”。
ax = sns.barplot(x="day", y="total_bill",hue='sex', data=tips,estimator=np.median,capsize=0.2,errcolor='c')3.2 countplot(计数图)
一个计数图可以被认为是一个分类直方图,而不是定量的变量。基本的api和选项与barplot()相同,因此您可以比较嵌套变量中的计数。(工作原理就是对输入的数据分类,条形图显示各个分类的数量)。具体参数如下:
seaborn.countplot(x=None, y=None, hue=None, data=None, order=None,hue_order=None, orient=None, color=None, palette=None, saturation=0.75,dodge=True, ax=None, **kwargs)这里参数并没有太多改变,orient就是改变方向。但是,值得注意的是缺少了一些参数,而且countplot中不能同时输入x和y,却可以使用hue(这我就很纳闷了???还望大佬解释解释)。
titanic = sns.load_dataset("titanic")
ax = sns.countplot(x="class", hue="who", data=titanic)3.3 piontplot(点图)
用散点图符号表示点估计和置信区间,点图代表散点图位置的数值变量的中心趋势估计,并使用误差线提供关于该估计的不确定性的一些指示。点图可能比条形图(barplot)更有用于聚焦一个或多个分类变量的不同级别之间的比较。他们尤其善于表现交互作用:一个分类变量的层次之间的关系如何在第二个分类变量的层次之间变化。连接来自相同色调等级的每个点的线允许交互作用通过斜率的差异进行判断,这比对几组点或条的高度比较容易。具体用法如下:
seaborn.pointplot(x=None, y=None, hue=None, data=None, order=None,hue_order=None, estimator=<function mean>, ci=95, n_boot=1000,units=None, markers='o', linestyles='-', dodge=False, join=True,scale=1, orient=None, color=None, palette=None, errwidth=None,capsize=None, ax=None, **kwargs)- join:默认两个均值点会相连接,若不想显示,可以通过join=False参数实现;
- scale:float,均值点(默认)和连线的大小和粗细。
tips = sns.load_dataset("tips")
ax = sns.pointplot(x="time", y="total_bill", data=tips)尝试更多参数,按性别分组,用中位数进行比较,分开显示,使用调色板,修改标记类型和线条类型(很多参数都不是必要的,这里只是尽量充分介绍其用法)。
ax = sns.pointplot(x="time", y="total_bill", hue="smoker",data=tips,estimator=np.median,dodge=True, palette="Set2",markers=["o", "x"],linestyles=["-", "--"])3.4 catplot()
该函数提供了对几个轴级函数的访问,这些函数使用几种可视化表示形式之一显示一个数字变量和一个或多个分类变量之间的关系。其实说白了就是利用kind参数来画前面Categorical plots(分类图)中的任意8个图形。具体如下:
seaborn.catplot(x=None, y=None, hue=None, data=None, row=None, col=None,col_wrap=None, estimator=<function mean>, ci=95, n_boot=1000, units=None,order=None, hue_order=None, row_order=None, col_order=None, kind='strip',height=5, aspect=1, orient=None, color=None, palette=None, legend=True,legend_out=True, sharex=True, sharey=True, margin_titles=False,facet_kws=None, **kwargs)有没有发现,它和regplot(关系图)的使用方法差不多?
- kind:默认strip(分布散点图),也可以选择“point”, “bar”, “count”,
- col、row:将决定网格的面数的分类变量,可具体制定;
- col_wrap:指定每行展示的子图个数,但是与row不兼容;
- row_order, col_order : 字符串列表,安排行和列,以及推断数据中的对象;
- height,aspect:与图像的大小有关;
- sharex,sharey:bool, ‘col’or ‘row’,是否共享想,x,y坐标;
注:单个图形里面的参数也是可以传入里面的
绘制一个小提琴图,按数据中的kind类别分组(数据中的),不要中心框线。
exercise = sns.load_dataset("exercise")
g = sns.catplot(x="time", y="pulse", hue="kind",data=exercise, kind="violin",inner=None)使用diet来分成几个图形,并用height、aspect来设置图片比例:
g = sns.catplot(x="time", y="pulse", hue="kind",kind='bar',col="diet",data=exercise,height=4, aspect=0.8)相关推荐
- xpsp2系统下载地址(windows xp sp2 iso)
-
WindowsXPProfessionalSP2产品密钥是微软公司的一个软件密钥,用于授权用户使用该软件的完整功能。它通常与产品许可证一起使用,用于确保软件的合法性和安全性。使用Windows...
- 开机microsoft登录不上
-
1、系统问题:如果系统版本比较低,可能会由于旧系统存在某些BUG未修复或业务功能未优化,使手机在使用APP等应用过程中出现卡的情况,建议更新到最新的ios系统使用。2、内存问题:如果内存比较小,在运行...
- 如何取消win10开机密码(如何取消win10开机密码账户登录)
-
取消Windows10的开机密码可以通过以下方法进行操作:方法一:使用用户账户设置1.打开“开始”菜单,点击“设置”图标。2.在设置窗口中,点击“帐户”选项。3.在左侧菜单中,选择“登录选项”。4....
- 免费解压文件的软件(免费解压文件的软件电脑)
-
1、快压快压(kuaizip)是一款非常流氓的压缩和解压缩软件,一款免费、方便、快速的压缩和解压缩利器,拥有一流的压缩技术,是国内第一款具备自主压缩格式的软件。快压自身的压缩格式KZ具有超大的压缩比和...
- 无线usb网卡插上去没有反应(为什么usb无线网卡插上去没反应)
-
当出现电脑无法识别无线网卡的情况时,是简单的方法就是将无线USB网卡插到电脑后置USB接口上,以保证供电的充足。当然如果是偶然出现无法识别的情况,建议重启一下电脑试试。启用USB无线网卡驱动:右击“计...
- 怎么登录自己家的路由器(怎么登录自己家的路由器账号)
-
登陆家里的路由器方法:1、先查看ip,方法:win+r---输入:cmd---在再黑白界面输入:ipconfig,按回车。2、根据网关查看路由器地址。若网关是:192.168.2.1,那么路由器的ip...
- linux操作系统安装步骤(linux系统详细安装步骤)
-
1.选择“中文(简体)”,然后点击“安装Ubuntu”。2.点击“继续”。3.然后点击“现在安装”。4.选择地址的时区,然后点击“继续”。5.选择“汉语”,然后点击“继续”。6.输入用户的名字。7.设...
- 苹果手机怎么设置定时关机(苹果手机怎么设置定时关机重启)
-
苹果手机可以设置定时关机,但无法设置定时开机。具体操作步骤如下:进入苹果手机自带的时钟。点击屏幕有下角的计时器。点击画面中间的计时结束启用选项。选择画面最下方的“停止播放”。之后再点击画面右上角的设定...
- 无线网wifi密码忘记了怎么办
-
忘记wifi密码后,可以在路由器后台查看。1.在浏览器的地址栏中,输入路由器上的管理地址,进入后台界面;2.在后台界面里,找到“无线设置”选项,点击它;3.在新界面里,点击wifi密码右侧的小眼睛图标...
-
- win7系统无法正常开机怎么办
-
解决方法如下1,出现无法启动的原因,要注意是开机启动不了,还是在进度条那里缓冲,过不去.如果是开机启动不了,那就要看一下内存条、电源等有没有问题?如果是在进度条那里,那就看下方的三种方法。2,第一种方法:1,开机按F8键.2,选择最近一次的...
-
2025-11-16 07:51 off999
- 现在装win7还需要激活吗(现在安装win7旗舰版还需密钥吗)
-
要激活 Windows7如果是预装在计算机中的,买来之后便不用激活,这里预装指的是在厂商那里。正版的Windows7安装到计算机中,有三十天的试用期,若要永久使用,就要使...
- 2025显卡性能排行榜天梯图(2020年显卡性能天梯图)
-
MacBookPro的显卡水平处于笔记本独立显卡Nvidia920M和940M之间。属于低端显卡级,玩玩LOL啥的还可以,其他的大型游戏就算了,MAC不适合打游戏。MacBookPro搭载的8代...
- 网络对时服务器(对时服务器端口)
-
对等网是指在网络中所有计算机的地位都是平等的,既是服务器也是客户机,所有计算机中安装的都是相同的单机操作系统如Windows98/XP/Vista/7等,它可以设置共享资源,但受连接数限制,一般是只允...
- 如何强制删除u盘文件(强制删除u盘内容)
-
1、电脑上下载安装安全杀毒类软件。2、使用强力卸载。3、找到U盘上需要卸载的文件,右击强力卸载可以卸载顽固型文件。4、被暂用的文件也删除不了可以退出U盘重启电脑重新开机插入U盘进行删除。5、不能删除的...
- directx官方下载win7(directx download)
-
点开始-----运行,输入dxdiag,回车后打开“DirectX诊断工具”窗口,进入“显示”选项卡,看一下是否启用了加速,没有的话,单击下面的“DirectX功能”项中的“启用”按钮,这样便打开了D...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
慕ke 前端工程师2024「完整」
-
失业程序员复习python笔记——条件与循环
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
