百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

【Python可视化系列】一文教你绘制不同类型散点图(理论+源码)

off999 2024-10-27 11:48 13 浏览 0 评论

这是Python可视化系列原创文章。

一、引言

前文相关回顾:

【Python可视化系列】一文教会你绘制美观的热力图(理论+源码)

【Python可视化系列】一文教会你绘制美观的直方图(理论+源码)

【Python可视化系列】一文教会你绘制美观的柱状图(理论+源码)

【Python可视化系列】一文彻底教会你绘制美观的折线图(理论+源码)

本文将总结一下散点图的绘制方法。散点图也叫 X-Y 图,它将所有的数据以点的形式展现在直角坐标系上,以显示变量之间的相互影响程度,点的位置由变量的数值决定

通过观察散点图上数据点的分布情况,我们可以推断出变量间的相关性。如果变量之间不存在相互关系,那么在散点图上就会表现为随机分布的离散的点,如果存在某种相关性,那么大部分的数据点就会相对密集并以某种趋势呈现。数据的相关关系主要分为:正相关(两个变量值同时增长)、负相关(一个变量值增加另一个变量值下降)、不相关、线性相关、指数相关等。

二、参数详解

函数:
matplotlib.pyplot.scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None, vmax=None, alpha=None, linewidths=None, verts=None, edgecolors=None, , data=None, *kwargs)
参数说明
x, y : 相同长度的数组,数组大小(n,),也就是绘制散点图的数据;
s:绘制点的大小,可以是实数或大小为(n,)的数组, 可选的参数 ;
c:绘制点颜色, 默认是蓝色'b' , 可选的参数 ;
marker:表示的是标记的样式,默认的是'o' , 可选的参数 ;
cmap:当c是一个浮点数数组的时候才使用, 可选的参数 ;
norm:将数据亮度转化到0-1之间,只有c是一个浮点数的数组的时候才使用, 可选的参数 ;
vmin , vmax:实数,当norm存在的时候忽略。用来进行亮度数据的归一化 , 可选的参数 ;
alpha:实数,0-1之间, 可选的参数 ;
linewidths:标记点的长度, 可选的参数 ;

三、实现过程

3.1 基本散点图

data = pd.read_csv(r'Dataset.csv')
df = pd.DataFrame(data)

sns.set(font_scale=1.2)
plt.rc('font',family=['Times New Roman', 'SimSun'], size=12)
plt.scatter(df['age'], df['chol'])
plt.title('age与chol的关系')
plt.xlabel('age')
plt.ylabel('chol')
plt.show()

基本散点图也叫 X-Y 图,它将所有的数据以点的形式展现在直角坐标系上,以显示变量之间的相互影响程度,点的位置由变量的数值决定。

3.2 分组散点图

data = pd.read_csv(r'Dataset.csv')
df = pd.DataFrame(data)
colors = ['red','blue']
target = df['target'].unique()

sns.set(font_scale=1.2)
plt.rc('font',family=['Times New Roman', 'SimSun'], size=12)
for i in range(len(target)):
    plt.scatter(df.loc[df.target == i, 'age'], df.loc[df.target==i,'chol'], s = 35, c = colors[i], label = i)
plt.title('age与chol的关系')
plt.xlabel('age')
plt.ylabel('chol')
plt.legend(loc='upper left')# 默认是左上方,
plt.show()

分组分类散点图是在两个主特征的基础上,叠加一个分类特征。

3.3 气泡图

data = pd.read_csv(r'Dataset.csv')
df = pd.DataFrame(data)
# 假设thalach的第三个特征展示为为气泡大小
fea = df['thalach']
plt.scatter(df['age'], df['chol'], s=fea/2, c='purple', alpha=0.4, edgecolors="grey",
            linewidth=2)
plt.xlabel('age')  # 横坐标轴标题
plt.ylabel('chol')  # 纵坐标轴标题
plt.title('s=thalach/2, c=purple', verticalalignment='bottom')
plt.show()
# 参数说明
# s:表征气泡大小的变量
# c:颜色,若想要彩色气泡,可以给c赋值,如c=fea
# alpha:不透明度
# edgecolors:气泡描边的颜色
# linewidth:气泡描边大小

气泡图的其中一条变量的表现形式是体现在气泡的大小或颜色深浅上,如果一个数据集中包含非常多的点,那么散点图可以将这些数据对比的结果一目了然,是比较适用的。分组分类散点图是在两个主特征的基础上,叠加一个分类特征,若在两个主特征的基础上,还要展示另外一个连续特征,可以使用气泡图。

3.4 三维散点图

data = pd.read_csv(r'Dataset.csv')
df = pd.DataFrame(data)

sns.set(font_scale=1.2)
plt.rc('font',family=['Times New Roman', 'SimSun'], size=12)
ax = plt.subplot(projection = '3d')  # 创建一个三维的绘图工程
ax.scatter(df['age'], df['chol'], df['thalach'])
plt.show()

三维散点图可以反映三个数值之间的关系,他是一个立体的图形,我们可以理解为将气泡图的三维数据绘制到三维坐标系,就形成了三维散点图。

3.5 散点密度图

# 生成模拟数据
N=1000
x = np.random.normal(size=N)
y = x * 3 + np.random.normal(size=N)

# 计算样本点密度
xy = np.vstack([x,y])  #  将两个维度的数据叠加
z = gaussian_kde(xy)(xy)  # 建立概率密度分布,并计算每个样本点的概率密度

# 按密度排序,将密度最大的点排在最后
idx = z.argsort()
x, y, z = x[idx], y[idx], z[idx]
sns.set(font_scale=1.2)
plt.rc('font',family=['Times New Roman', 'SimSun'], size=12)
fig, ax = plt.subplots()
plt.scatter(x, y,c=z, s=20,cmap='Spectral') # c表示标记的颜色
plt.colorbar()
plt.show()

散点密度主要是计算样本点的出现次数,即密度。

本期内容就到这里,我们下期再见!需要数据集和源码的小伙伴可以关注私信作者!

作者简介:

读研期间发表6篇SCI数据算法相关论文,目前在某研究院从事数据算法相关研究工作,结合自身科研实践经历不定期持续分享关于Python、数据分析、特征工程、机器学习、深度学习、人工智能系列基础知识与案例。

原文链接:

【Python可视化系列】一文教你绘制不同类型的散点图(理论+源码)

相关推荐

每天一个 Python 库:datetime 模块全攻略,时间操作太丝滑!

在日常开发中,时间处理是绕不开的一块,比如:生成时间戳比较两个时间差转换为可读格式接口传参/前端展示/日志记录今天我们就用一个案例+代码+思维导图,带你完全搞定datetime模块的用法!...

字节跳动!2023全套Python入门笔记合集

学完python出来,已经工作3年啦,最近有很多小伙伴问我,学习python有什么用其实能做的有很多可以提高工作效率增强逻辑思维还能做爬虫网站数据分析等等!!最近也是整理了很多适合零基...

为什么你觉得Matplotlib用起来困难?因为你还没看过这个思维导图

前言Matplotlib是一个流行的Python库,可以很容易地用于创建数据可视化。然而,设置数据、参数、图形和绘图在每次执行新项目时都可能变得非常混乱和繁琐。而且由于应用不同,我们不知道选择哪一个图...

Python新手必看!30分钟搞懂break/continue(附5个实战案例)

一、跳转语句的使命当程序需要提前结束循环或跳过特定迭代时,break和continue就是你的代码急刹按钮和跳步指令。就像在迷宫探险中:break=发现出口立即离开continue=跳过陷阱继续前进二...

刘心向学(24)Python中的数据类(python中5种简单的数据类型)

分享兴趣,传播快乐,增长见闻,留下美好!亲爱的您,这里是LearningYard新学苑。今天小编为大家带来文章“刘心向学(24)Python中的数据类”欢迎您的访问。Shareinterest,...

刘心向学(25)Python中的虚拟环境(python虚拟环境安装和配置)

分享兴趣,传播快乐,增长见闻,留下美好!亲爱的您,这里是LearningYard新学苑。今天小编为大家带来文章“刘心向学(25)Python中的虚拟环境”欢迎您的访问。Shareinte...

栋察宇宙(八):Python 中的 wordcloud 库学习介绍

分享乐趣,传播快乐,增长见识,留下美好。亲爱的您,这里是LearingYard学苑!今天小编为大家带来“Python中的wordcloud库学习介绍”欢迎您的访问!Sharethefun,...

AI在用|ChatGPT、Claude 3助攻,1分钟GET高颜值思维导图

机器之能报道编辑:Cardinal以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人...

使用DeepSeek + Python开发AI思维导图应用,非常强!

最近基于Deepseek+PythonWeb技术开发了一个AI对话自动生成思维导图的应用,用来展示下如何基于低门槛的Python相关技术栈,高效结合deepseek实现从应用场景到实际应用的快速落地...

10幅思维导图告诉你 - Python 核心知识体系

首先,按顺序依次展示了以下内容的一系列思维导图:基础知识,数据类型(数字,字符串,列表,元组,字典,集合),条件&循环,文件对象,错误&异常,函数,模块,面向对象编程;接着,结合这些思维导图主要参考的...

Python基础核心思维导图,让你轻松入门

Python基础核心思维导图【高清图文末获取】学习路线图就给大家看到这里了,需要的小伙伴下方获取获取方式看下方图片...

Python基础核心思维导图,学会事半功倍

Python基础核心思维导图【高清图文末获取】学习路线图就给大家看到这里了,需要的小伙伴下方获取获取方式看下方图片...

硬核!288页Python核心知识笔记(附思维导图,建议收藏)

今天就给大家分享一份288页Python核心知识笔记,相较于部分朋友乱糟糟的笔记,这份笔记更够系统地总结相关知识,巩固Python知识体系。文末获取完整版PDF该笔记学习思维导图:目录内容展示【领取方...

Python学习知识思维导图(高效学习)

Python学习知识思维导图python基础知识python数据类型条件循环列表元组字典集合字符串序列函数面向对象编程模块错误异常文件对象#python##python自学##编程#...

别找了!288页Python核心知识笔记(附思维导图,建议收藏)

今天就给大家分享一份288页Python核心知识笔记,相较于部分朋友乱糟糟的笔记,这份笔记更够系统地总结相关知识,巩固Python知识体系。文末获取完整版PDF该笔记学习思维导图:目录内容展示【领取方...

取消回复欢迎 发表评论: