Seaborn常见绘图总结-Categorical plots(分类图)
off999 2024-11-24 20:07 28 浏览 0 评论
上篇说到使用seaborn来绘制Relational plots(关系图),本篇来重点介绍Categorical plots(分类图)。
这里使用的数据还是seaborn的默认数据,理解数据的含义,对分析问题往往起着事半功倍的效果。
https://github.com/mwaskom/seaborn-data
Categorical plots(分类图)
- Categorical plots(分类图)可以具体分为下面三种类型,8个小图:
stripplot(分布散点图)
swarmplot(分布密度散点图) - Categorical distribution plots(分类分布图)
boxplot(箱线图)
violinplot(小提琴图)
boxenplot(字母价值图) - Categorical estimate plots(分类估计图)
pointplot(点图)
barplot(条形图)
countplot(计数统计图)
1 Categorical scatterplots(分类散点图)
1.1 stripplot(分布散点图)
stripplot(分布散点图)的意思就是按照不同类别对样本数据进行分布散点图绘制。stripplot(分布散点图)一般并不单独绘制,它常常与boxplot和violinplot联合起来绘制,作为这两种图的补充。
seaborn.stripplot(x=None, y=None, hue=None, data=None, order=None,hue_order=None, jitter=True, dodge=False, orient=None, color=None,palette=None, size=5, edgecolor='gray', linewidth=0, ax=None, **kwargs)- x,y,data:输入数据可以多种格式传递,在大多数情况下,使用Numpy或Python对象是可能的,但是更可取的是pandas对象,因为相关的名称将用于对轴进行注释。此外,还可以对分组变量使用分类类型来控制情节元素的顺序。
- order:用order参数进行筛选分类类别,例如:order=[‘sun’,‘sat’];
- jitter:抖动项,表示抖动程度,可以使float,或者True;
- dodge:重叠区域是否分开,当使用hue时,将其设置为True,将沿着分类轴将不同色调级别的条带分开。
- orient:“v” | “h”,vertical(垂直) 和 horizontal(水平)的意思;
基本的图
tips = sns.load_dataset("tips")
ax = sns.stripplot(x="day", y="total_bill", data=tips)多增加几个参数的修改:
ax = sns.stripplot(x="day", y="total_bill", hue="smoker",data=tips,
jitter=True,palette="Set2", dodge=True)1.2 swarmplot(分布密度散点图)
这个函数类似于stripplot(),但是对点进行了调整(只沿着分类轴),这样它们就不会重叠。这更好地表示了值的分布,但它不能很好地扩展到大量的观测。
seaborn.swarmplot(x=None, y=None, hue=None, data=None, order=None,hue_order=None, dodge=False, orient=None, color=None, palette=None, size=5,edgecolor='gray', linewidth=0, ax=None, **kwargs)可以看出,swarmplot和stripplot参数上基本一致,少了jitter,因为它显示的是分布密度,不需要添加抖动项。
ax = sns.swarmplot(x="day", y="total_bill", data=tips)多增加几个参数的修改:
ax = sns.swarmplot(x="day", y="total_bill", hue="smoker",data=tips,palette="Set2", dodge=True)2 Categorical distribution plots(分类分布图)
2.1 boxplot(箱线图)
boxplot(箱线图,又称为盒须图、盒式图)便于在变量之间或跨类别变量级别比较的方式,显示定量数据的分布情况。框显示数据集的四分位数,线显示分布的其余部分,它能显示出一组数据的最大值、最小值、中位数及上下四分位数,使用四分位数范围函数的方法可以确定“离群值”的点。具体用法如下:
seaborn.boxplot(x=None, y=None, hue=None, data=None, order=None,hue_order=None, orient=None, color=None, palette=None, saturation=0.75,width=0.8, dodge=True, fliersize=5, linewidth=None, whis=1.5, notch=False, ax=None, **kwargs)- saturation:饱和度,可设置为1;
- width:float,控制箱型图的宽度大小;
- fliersize:float,用于指示离群值观察的标记大小;
- whis:可理解为异常值的上限IQR比例;
ax = sns.boxplot(x="day", y="total_bill", data=tips)#这些参数不一定要加,简单最好,这里只是为了展示参数的含义
ax = sns.boxplot(x="day", y="total_bill", hue="time",data=tips,linewidth=0.5,saturation=1,width=1,fliersize=3)2.2 violinplot(小提琴图)
violinplot与boxplot扮演类似的角色,箱线图展示了分位数的位置,它显示了定量数据在一个(或多个)分类变量的多个层次上的分布,这些分布可以进行比较。不像箱形图中所有绘图组件都对应于实际数据点,小提琴绘图以基础分布的核密度估计为特征,通过小提琴图可以知道哪些位置的密度较高。在图中,白点是中位数,黑色盒型的范围是下四分位点到上四分位点,细黑线表示须。外部形状即为核密度估计。
这是一种可以同时显示多个数据分布的有效和有吸引力的方法,但请记住,估计过程受样本大小的影响,相对较小的样本的小提琴手看起来可能会显得非常平滑。具体用法如下:
seaborn.violinplot(x=None, y=None, hue=None, data=None, order=None,hue_order=None, bw='scott', cut=2, scale='area', scale_hue=True, gridsize=100,width=0.8, inner='box', split=False, dodge=True, orient=None, linewidth=None,color=None, palette=None, saturation=0.75, ax=None, **kwargs)- bw:‘scott’, ‘silverman’, float,控制拟合程度。在计算内核带宽时,可以引用规则的名称(‘scott’, ‘silverman’)或者使用比例(float)。实际内核大小将通过将比例乘以每个bin内数据的标准差来确定;
- cut:空值外壳的延伸超过极值点的密度,float;
- scale:“area”, “count”, “width”,用来缩放每把小提琴的宽度的方法;
- scale_hue:当使用hue分类后,设置为True时,此参数确定是否在主分组变量进行缩放;
- gridsize:设置小提琴图的平滑度,越高越平滑;
- inner:“box”, “quartile”, “point”, “stick”, None,小提琴内部数据点的表示。分别表示:箱子,四分位,点,数据线和不表示;
- split:是否拆分,当设置为True时,绘制经hue分类的每个级别画出一半的小提琴;
ax = sns.violinplot(x="day", y="total_bill", data=tips)设置按性别分类,调色为“Set2”,分割,以计数的方式,不表示内部。
ax = sns.violinplot(x="day", y="total_bill", hue="sex",data=tips,palette="Set2", split=True,scale="count", inner=None)
2.3 violinplot+stripplot(小提琴图+分布散点图)
ax = sns.violinplot(x="tip", y="day", data=tips, inner=None,whis=np.inf)
ax = sns.stripplot(x="tip", y="day", data=tips,jitter=True, color="c")2.4 violinplot+swarmplot(小提琴图+分布密度散点图)
ax = sns.violinplot(x="tip", y="day", data=tips,inner=None, whis=np.inf)
ax = sns.swarmplot(x="tip", y="day", data=tips, color="c")2.5 boxplot+stripplot(箱线图+分布散点图)
ax = sns.boxplot(x="tip", y="day", data=tips, whis=np.inf)
ax = sns.stripplot(x="tip", y="day", data=tips,jitter=True, color="c")2.6 boxplot+swarmplot(箱线图+分布密度散点图)
ax = sns.boxplot(x="tip", y="day", data=tips, whis=np.inf)
ax = sns.swarmplot(x="tip", y="day", data=tips, color="c")3 Categorical estimate plots(分类估计图)
3.1 barplot(条形图)
条形图表示数值变量与每个矩形高度的中心趋势的估计值,用矩形条表示点估计和置信区间,并使用误差线提供关于该估计值附近的不确定性的一些指示。具体用法如下:
seaborn.barplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None,estimator=<function mean>, ci=95, n_boot=1000, units=None, orient=None,color=None, palette=None, saturation=0.75, errcolor='.26', errwidth=None,capsize=None, dodge=True, ax=None, **kwargs)- estimator:用于估计每个分类箱内的统计函数,默认为mean。当然你也可以设置estimator=np.median/np.std/np.var……
- order:选择和空值顺序,例如:order=[‘Sat’,‘Sun’];
- ci:允许的误差的范围(控制误差棒的百分比,在0-100之间),若填写"sd",则用标准误差(默认为95),也可设置ci=None;
- capsize:设置误差棒帽条(上下两根横线)的宽度,float;
- saturation:饱和度;
- errcolor:表示置信区间的线条的颜色;
- errwidth:float,设置误差条线(和帽)的厚度。
根据性别分组:
ax = sns.barplot(x="day", y="total_bill", hue="sex", data=tips)设置estimator为中位数(numpy的统计函数都可以,只要你觉得有意义),设置误差棒的宽度,误差棒的颜色为“c”。
ax = sns.barplot(x="day", y="total_bill",hue='sex', data=tips,estimator=np.median,capsize=0.2,errcolor='c')3.2 countplot(计数图)
一个计数图可以被认为是一个分类直方图,而不是定量的变量。基本的api和选项与barplot()相同,因此您可以比较嵌套变量中的计数。(工作原理就是对输入的数据分类,条形图显示各个分类的数量)。具体参数如下:
seaborn.countplot(x=None, y=None, hue=None, data=None, order=None,hue_order=None, orient=None, color=None, palette=None, saturation=0.75,dodge=True, ax=None, **kwargs)这里参数并没有太多改变,orient就是改变方向。但是,值得注意的是缺少了一些参数,而且countplot中不能同时输入x和y,却可以使用hue(这我就很纳闷了???还望大佬解释解释)。
titanic = sns.load_dataset("titanic")
ax = sns.countplot(x="class", hue="who", data=titanic)3.3 piontplot(点图)
用散点图符号表示点估计和置信区间,点图代表散点图位置的数值变量的中心趋势估计,并使用误差线提供关于该估计的不确定性的一些指示。点图可能比条形图(barplot)更有用于聚焦一个或多个分类变量的不同级别之间的比较。他们尤其善于表现交互作用:一个分类变量的层次之间的关系如何在第二个分类变量的层次之间变化。连接来自相同色调等级的每个点的线允许交互作用通过斜率的差异进行判断,这比对几组点或条的高度比较容易。具体用法如下:
seaborn.pointplot(x=None, y=None, hue=None, data=None, order=None,hue_order=None, estimator=<function mean>, ci=95, n_boot=1000,units=None, markers='o', linestyles='-', dodge=False, join=True,scale=1, orient=None, color=None, palette=None, errwidth=None,capsize=None, ax=None, **kwargs)- join:默认两个均值点会相连接,若不想显示,可以通过join=False参数实现;
- scale:float,均值点(默认)和连线的大小和粗细。
tips = sns.load_dataset("tips")
ax = sns.pointplot(x="time", y="total_bill", data=tips)尝试更多参数,按性别分组,用中位数进行比较,分开显示,使用调色板,修改标记类型和线条类型(很多参数都不是必要的,这里只是尽量充分介绍其用法)。
ax = sns.pointplot(x="time", y="total_bill", hue="smoker",data=tips,estimator=np.median,dodge=True, palette="Set2",markers=["o", "x"],linestyles=["-", "--"])3.4 catplot()
该函数提供了对几个轴级函数的访问,这些函数使用几种可视化表示形式之一显示一个数字变量和一个或多个分类变量之间的关系。其实说白了就是利用kind参数来画前面Categorical plots(分类图)中的任意8个图形。具体如下:
seaborn.catplot(x=None, y=None, hue=None, data=None, row=None, col=None,col_wrap=None, estimator=<function mean>, ci=95, n_boot=1000, units=None,order=None, hue_order=None, row_order=None, col_order=None, kind='strip',height=5, aspect=1, orient=None, color=None, palette=None, legend=True,legend_out=True, sharex=True, sharey=True, margin_titles=False,facet_kws=None, **kwargs)有没有发现,它和regplot(关系图)的使用方法差不多?
- kind:默认strip(分布散点图),也可以选择“point”, “bar”, “count”,
- col、row:将决定网格的面数的分类变量,可具体制定;
- col_wrap:指定每行展示的子图个数,但是与row不兼容;
- row_order, col_order : 字符串列表,安排行和列,以及推断数据中的对象;
- height,aspect:与图像的大小有关;
- sharex,sharey:bool, ‘col’or ‘row’,是否共享想,x,y坐标;
注:单个图形里面的参数也是可以传入里面的
绘制一个小提琴图,按数据中的kind类别分组(数据中的),不要中心框线。
exercise = sns.load_dataset("exercise")
g = sns.catplot(x="time", y="pulse", hue="kind",data=exercise, kind="violin",inner=None)使用diet来分成几个图形,并用height、aspect来设置图片比例:
g = sns.catplot(x="time", y="pulse", hue="kind",kind='bar',col="diet",data=exercise,height=4, aspect=0.8)相关推荐
- 笔记本电脑选哪个品牌比较好
-
1、苹果APPLE/美国2、戴尔DELL/美国3、华为HUAWEI/中国4、小米MI/中国5、微软Microsoft/美国6、联想LENOVO/中国7、惠普HP/美国8、华硕ASUS/...
- 10系列显卡排名(10系显卡性能排行)
-
十系显卡指NVIDIAGeForce10系列,是英伟达研发并推出的图形处理器系列,被用以取代NVIDIAGeForce900系列图形处理器。新系列采用帕斯卡微架构来代替之前的麦克斯韦微架构,并...
-
- 最新win7系统下载(windows7最新版本下载)
-
最简单的方法就是,下载完镜像文件后,直接把镜像文件解压,解压到非C盘,然后在解压文件里面找到setup.exe,点击运行即可。安装系统完成后,在C盘找到一个Windows.old(好几个GB,是旧系统打包在这里,垃圾文件了)删除即可。扩展资...
-
2026-01-15 06:43 off999
- 哪个电脑管家软件好用(哪个电脑管家好用些)
-
腾讯电脑管家吧,因为这个是杀毒和管理合一的,占用内存小,因此显得更为简洁,使电脑运行更加流畅此外电脑诊所,工具箱以及4+1的杀毒模式让腾讯电脑管家也收到了广泛的关注4+1杀毒引擎,管家反病毒引擎、金山...
- 怎么进入win7安全模式(怎么进入win7安全模式界面)
-
方法如下:1、首先进入Win7系统,然后使用Win键+R组合键打开运行框,输入“Msconfig”回车进入系统配置。2、在打开的系统配置中,找到“引导”选项,然后单击,选择Win7的引导项,然后在“安...
- 怎么分区固态硬盘(怎样分区固态硬盘)
-
固态硬盘的分区方法与传统机械硬盘基本相同,以下是一个简单的步骤:1.打开磁盘管理工具:在Windows操作系统中,按下Win+X键,选择"磁盘管理"。或者打开控制面板,在"...
-
- 笔记本声卡驱动怎么下载(笔记本如何下载声卡)
-
1、在浏览器中输入并搜索,然后下载并安装。2、安装完成后打开360驱动大师,它就会自动检测你的电脑需要安装或升级的驱动。3、检测完毕后,我们可以看到我们的声卡驱动需要安装或升级,点击安装或升级,就会开始自动安装或升级声卡了。4、升级过程中会...
-
2026-01-15 05:43 off999
- win10加快开机启动速度(加快开机速度 win10)
-
一、启用快速启动功能1.按win+r键调出“运行”在输入框输入“gpedit.msc”按回车调出“组策略编辑器”?2.在“本地组策略编辑器”依次打开“计算机配置——管理模块——系统——关机”在右侧...
-
- excel的快捷键一览表(excel的快捷键一览表超全)
-
Excel快捷键大全的一些操作如下我在工作中经常使用诸如word或Excel之类的办公软件。我相信每个人都不太熟悉这些办公软件的快捷键。使用快捷键将提高办公效率,并使您的工作更加轻松快捷。。例如,在复制时,请使用CtrI+C进行复制,...
-
2026-01-15 05:03 off999
- 华硕u盘启动按f几(华硕u盘装系统按f几进入)
-
F8。1、开机的同时按F8进入BIOS。2、在Boot菜单中,置secure为disabled。3、BootListOption置为UEFI。4、在1stBootPriority中usb—HD...
- 手机云电脑怎么用(手机云端电脑)
-
使用手机云电脑,您首先需要安装相应的云电脑应用。例如,华为云电脑APP。在安装并打开应用后,您将看到一个显示器的图标,这就是您的云电脑。点击这个图标,您将被连接到一个预装有Windows操作系统和必要...
- ie11浏览器怎么安装(ie11浏览器安装步骤)
-
如果IE浏览器11版本你发现无法正常安装,那么很可能是这样几个原因,一个就是电脑的存储空间不够到时无法安装,再有就是网络的问题,如果没有办法安装的话就不要再安装了,本身这个IE浏览器并不是多好用,你最...
- 台式机重装系统win7(台式机怎么重装win7)
-
下面主要介绍两种方法以重装系统:一、U盘重装系统准备:一台正常开机的电脑和一个U盘1、百度下载“U大师”(老毛桃、大白菜也可以),把这个软件下载并安装在电脑上。2、插上U盘,选择一键制作U盘启动(制作...
- 字母下划线怎么打出来(字母下的下划线怎么去不掉)
-
第一步,在电脑上找到文字处理软件WPS,双击即自动新建一个新文档。第二步,在文档录入需要处理的字母和数字,双击鼠标或拖动鼠标选择要处理的内容。第三步,在页面的左上方的横向菜单栏,找到字母U的按纽,点击...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
失业程序员复习python笔记——条件与循环
-
系统u盘安装(win11系统u盘安装)
-
Python 批量卸载关联包 pip-autoremove
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
