百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

python matplotplib 和 scipy 实现绘制散点密度图、边缘箱形图

off999 2024-11-24 20:06 19 浏览 0 评论

简单散点密度图

使用hist2d绘制2维直方图

from matplotlib.colors import LogNorm
import matplotlib.pyplot as plt
import numpy as np

# normal distribution center at x=0 and y=5
x = np.random.randn(100000)
y = np.random.randn(100000) + 5

plt.hist2d(x, y, bins=40, norm=LogNorm())
plt.colorbar()
plt.show()

边缘箱形图 (Marginal Boxplot)

散点图加右侧和底部直方图。功能实现是先形成4X4的网络底图,使用左上3X3画散点图,右侧3X1和底部1X3画直方图。

# !pip install brewer2mpl
import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns
import warnings; warnings.filterwarnings(action='once')
import os

os.environ['NLS_LANG'] = 'AMERICAN_AMERICA.ZHS16GBK'

config = {'font.family': 'serif',
            'font.serif': 'FangSong',
            'font.style': 'italic',
            #'font.weight': 'blod',#'normal',  # or 'blod'
            'font.size': 10,  # 此处貌似不能用类似large、small、medium字符串
            'axes.unicode_minus': False
            }
plt.rcParams.update(config)
#plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']= False
plt.style.use('seaborn-whitegrid')
sns.set_style("white")
# Import Data
df = pd.read_csv("./mpg_ggplot2.csv")
import matplotlib as mpl
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['font.serif'] = ['SimHei']
# Create Fig and gridspec
fig = plt.figure(figsize=(16, 10), dpi= 200)
grid = plt.GridSpec(4, 4, hspace=0.5, wspace=0.2)

# Define the axes
ax_main = fig.add_subplot(grid[:-1, :-1])
ax_right = fig.add_subplot(grid[:-1, -1], xticklabels=[], yticklabels=[])
ax_bottom = fig.add_subplot(grid[-1, 0:-1], xticklabels=[], yticklabels=[])

# Scatterplot on main ax
ax_main.scatter('displ', 'hwy', s=df.cty*4, c=df.manufacturer.astype('category').cat.codes, alpha=.9, data=df, cmap="tab10", edgecolors='gray', linewidths=.5)

# histogram on the right
ax_bottom.hist(df.displ, 40, histtype='stepfilled', orientation='vertical', color='deeppink')
ax_bottom.invert_yaxis()

# histogram in the bottom
ax_right.hist(df.hwy, 40, histtype='stepfilled', orientation='horizontal', color='deeppink')

# Decorations
ax_main.set(title='边缘箱形图 \n displ vs hwy', xlabel='displ', ylabel='hwy')
ax_main.title.set_fontsize(20)
for item in ([ax_main.xaxis.label, ax_main.yaxis.label] + ax_main.get_xticklabels() + ax_main.get_yticklabels()):
    item.set_fontsize(14)

#xlabels = ax_main.get_xticks().tolist()
#ax_main.set_xticklabels(xlabels)
plt.savefig('Scatterplot_with_Histograms.png',dpi=200)

散点密度图加直方图

使用scipy.stats.gaussian_kde进行核密度进行计算,这是使用Kernel density estimation的方法,估计出每个位置的密度值。 这代码参考森气笔记的代码,原代码有点问题,出图时显示不正确(下面图1),右侧和底部直方统计图位置不正确,根据上面4X4网络底图方法,稍做修改,得到正确的图。

# -*- encoding: utf-8 -*-
import pandas as pd
import os
import matplotlib.pyplot as plt
from scipy.stats import gaussian_kde
from mpl_toolkits.axes_grid1 import make_axes_locatable
import numpy as np
from matplotlib import ticker, cm
import seaborn as sns

df = pd.read_csv('./Fig1a_XY_obs.csv',index_col=0)
x,y = df.CxP.values,df.FR.values
xy = np.vstack([x,y])#将两个维度的数据进行叠加
kenal = gaussian_kde(xy)#这一步根据xy这个样本数据,在全定义域上建立了概率密度分布,所以kenal其实就是一个概率密度函数,输入对应的(x,y)坐标,就给出相应的概率密度
#kenal.set_bandwidth(bw_method=kenal1.factor)#这一步可以直接设置bandwith,通常情况下默认即可
z = kenal.evaluate(xy)#得到我们每个样本点的概率密度
z = gaussian_kde(xy)(xy)#这行代码和上面两行是相同的意思,这行是一行的写法
idx = z.argsort() #对z值进行从小到大排序并返回索引
x, y, z = x[idx], y[idx], z[idx]#对x,y按照z的升序进行排列
#上面两行代码是为了使得z值越高的点,画在上面,不被那些z值低的点挡住,从美观的角度来说还是十分必要的
#fig, ax = plt.subplots(figsize=(6,6),dpi=100)
fig = plt.figure(figsize=(8, 8), dpi= 200)
grid = plt.GridSpec(4, 4, hspace=0.5, wspace=0.2)
ax = fig.add_subplot(grid[:-1, :-1])
ax_histy = fig.add_subplot(grid[:-1, -1], xticklabels=[], yticklabels=[])
ax_histx = fig.add_subplot(grid[-1, 0:-1], xticklabels=[], yticklabels=[])
xcord=x
ycord=y
m = ((xcord*ycord).mean() - xcord.mean()* ycord.mean())/(pow(xcord,2).mean()-pow(xcord.mean(),2))
c = ycord.mean() - m*xcord.mean()
scatter=ax.scatter(x,y,c=z,s = 2)
divider=make_axes_locatable(ax)
ax.set_xlim(0,0.01)
ax.set_ylim(0,1.5)
ax.set_yticks(np.arange(0,1.51,0.5))
#ax_histx = divider.append_axes("bottom", 1.2, pad=0.15)
#ax_histy = divider.append_axes("right", 1.2, pad=0.15)
ax.set_xticklabels([])
# line 
ds = pd.read_csv('./Fig1a_XY_mod.csv',index_col=0)

ys = ['Y_pl', 'Y_pl_op', 'Y_sc', 'Y_li1', 'Y_np', 'Y_mean']
linestyles = ['-.','-.','-.','-.','-.','-']
colors = ['#723BA0','#8575D7','#8DCAD0','#E0C671','#9F795D','k']
labels = ['Power law','Power law (linear opt.)','Scale','Linear','Non-parametric','Mean']
for i in range(len(ys)):
    y = ds[ys[i]].values
    ax.plot(ds.X,y,linestyle=linestyles[i],c = colors[i],label = labels[i])
    ax.legend(frameon=False)
ax.set_ylabel('Lightning flash rate (number per km$^{2}$ per month)')
ax.set_xticks([0,0.005,0.010])

# part b
df2 = pd.read_csv('./Fig1b_CxP.csv',index_col=0)
sns.histplot(df2['rcp'].values, kde=True,ax = ax_histx,edgecolor = 'w',bins=51)
sns.histplot(df2['hist'].values, kde=True,ax = ax_histx,edgecolor = 'w',bins=30,color = 'red')

ax_histx.plot(1,1,label = 'Present day',c = '#D4A663')
ax_histx.plot(1,1,label = 'Future',c = '#0202FF')
ax_histx.legend(frameon=False)
ax_histx.set_ylabel('Norm. dist.')
ax_histx.set_xlabel('CAPE × Precip (W m$^{2}$)')

ax_histx.set_xticks([0,0.005,0.010])
ax_histx.set_xticklabels([0,0.005,'0.010'])
ax_histx.set_xlim(0,0.01)
ax_histx.set_ylim(0,400)
ax_histx.set_yticks([0,200,400])
# part c
df3 = pd.read_csv('./Fig1c_FR.csv',index_col=0)
ax_histy.set_xlabel('Norm. dist.')
ax_histy.set_yticks([])
ax_histy = ax_histy.twinx()
ax_histy.set_ylabel('Lightning flash rate (number per km$^{2}$ per month)',rotation = 270,labelpad = 15)
sns.histplot(y = df3['rcp'].values, kde=True,ax = ax_histy,edgecolor = 'w',bins=30)
sns.histplot(y = df3['hist'].values, kde=True,ax = ax_histy,color = 'red',edgecolor = 'w',bins=30)
ax_histy.set_xlim(350,0)
ax_histy.set_xticklabels([0,2.5])
ax_histy.set_ylim(0,1.5)
ax_histy.set_yticks(np.arange(0,1.51,0.5))
ax_histy.set_xlabel('Norm. dist.')
plt.rcParams['xtick.bottom'] = plt.rcParams['xtick.labelbottom'] = True
plt.rcParams['xtick.top'] = plt.rcParams['xtick.labeltop'] = False
plt.savefig('png2.png',dpi = 600)
#plt.show()

相关推荐

windows7屏幕亮度怎么调整(windows7屏幕亮度调节)

windows7屏幕亮度调节方法如下1.鼠标右键桌面空白处,在弹出的菜单中选择【个性化】。2.进入属性界面,选择左下角的【显示】选项。3.在弹出的显示页面右侧点击【调整亮度】。4.进入调整亮度页面,下...

永久删除的视频怎么找回(怎么恢复永久删除的视频)
  • 永久删除的视频怎么找回(怎么恢复永久删除的视频)
  • 永久删除的视频怎么找回(怎么恢复永久删除的视频)
  • 永久删除的视频怎么找回(怎么恢复永久删除的视频)
  • 永久删除的视频怎么找回(怎么恢复永久删除的视频)
xpsp2系统下载地址(windows xp sp2 iso)

WindowsXPProfessionalSP2产品密钥是微软公司的一个软件密钥,用于授权用户使用该软件的完整功能。它通常与产品许可证一起使用,用于确保软件的合法性和安全性。使用Windows...

开机microsoft登录不上

1、系统问题:如果系统版本比较低,可能会由于旧系统存在某些BUG未修复或业务功能未优化,使手机在使用APP等应用过程中出现卡的情况,建议更新到最新的ios系统使用。2、内存问题:如果内存比较小,在运行...

如何取消win10开机密码(如何取消win10开机密码账户登录)

取消Windows10的开机密码可以通过以下方法进行操作:方法一:使用用户账户设置1.打开“开始”菜单,点击“设置”图标。2.在设置窗口中,点击“帐户”选项。3.在左侧菜单中,选择“登录选项”。4....

免费解压文件的软件(免费解压文件的软件电脑)

1、快压快压(kuaizip)是一款非常流氓的压缩和解压缩软件,一款免费、方便、快速的压缩和解压缩利器,拥有一流的压缩技术,是国内第一款具备自主压缩格式的软件。快压自身的压缩格式KZ具有超大的压缩比和...

无线usb网卡插上去没有反应(为什么usb无线网卡插上去没反应)

当出现电脑无法识别无线网卡的情况时,是简单的方法就是将无线USB网卡插到电脑后置USB接口上,以保证供电的充足。当然如果是偶然出现无法识别的情况,建议重启一下电脑试试。启用USB无线网卡驱动:右击“计...

怎么登录自己家的路由器(怎么登录自己家的路由器账号)

登陆家里的路由器方法:1、先查看ip,方法:win+r---输入:cmd---在再黑白界面输入:ipconfig,按回车。2、根据网关查看路由器地址。若网关是:192.168.2.1,那么路由器的ip...

linux操作系统安装步骤(linux系统详细安装步骤)

1.选择“中文(简体)”,然后点击“安装Ubuntu”。2.点击“继续”。3.然后点击“现在安装”。4.选择地址的时区,然后点击“继续”。5.选择“汉语”,然后点击“继续”。6.输入用户的名字。7.设...

苹果手机怎么设置定时关机(苹果手机怎么设置定时关机重启)

苹果手机可以设置定时关机,但无法设置定时开机。具体操作步骤如下:进入苹果手机自带的时钟。点击屏幕有下角的计时器。点击画面中间的计时结束启用选项。选择画面最下方的“停止播放”。之后再点击画面右上角的设定...

无线网wifi密码忘记了怎么办

忘记wifi密码后,可以在路由器后台查看。1.在浏览器的地址栏中,输入路由器上的管理地址,进入后台界面;2.在后台界面里,找到“无线设置”选项,点击它;3.在新界面里,点击wifi密码右侧的小眼睛图标...

win7系统无法正常开机怎么办
win7系统无法正常开机怎么办

解决方法如下1,出现无法启动的原因,要注意是开机启动不了,还是在进度条那里缓冲,过不去.如果是开机启动不了,那就要看一下内存条、电源等有没有问题?如果是在进度条那里,那就看下方的三种方法。2,第一种方法:1,开机按F8键.2,选择最近一次的...

2025-11-16 07:51 off999

现在装win7还需要激活吗(现在安装win7旗舰版还需密钥吗)

要激活  Windows7如果是预装在计算机中的,买来之后便不用激活,这里预装指的是在厂商那里。正版的Windows7安装到计算机中,有三十天的试用期,若要永久使用,就要使...

2025显卡性能排行榜天梯图(2020年显卡性能天梯图)

MacBookPro的显卡水平处于笔记本独立显卡Nvidia920M和940M之间。属于低端显卡级,玩玩LOL啥的还可以,其他的大型游戏就算了,MAC不适合打游戏。MacBookPro搭载的8代...

网络对时服务器(对时服务器端口)

对等网是指在网络中所有计算机的地位都是平等的,既是服务器也是客户机,所有计算机中安装的都是相同的单机操作系统如Windows98/XP/Vista/7等,它可以设置共享资源,但受连接数限制,一般是只允...

取消回复欢迎 发表评论: