百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

python matplotplib 和 scipy 实现绘制散点密度图、边缘箱形图

off999 2024-11-24 20:06 13 浏览 0 评论

简单散点密度图

使用hist2d绘制2维直方图

from matplotlib.colors import LogNorm
import matplotlib.pyplot as plt
import numpy as np

# normal distribution center at x=0 and y=5
x = np.random.randn(100000)
y = np.random.randn(100000) + 5

plt.hist2d(x, y, bins=40, norm=LogNorm())
plt.colorbar()
plt.show()

边缘箱形图 (Marginal Boxplot)

散点图加右侧和底部直方图。功能实现是先形成4X4的网络底图,使用左上3X3画散点图,右侧3X1和底部1X3画直方图。

# !pip install brewer2mpl
import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns
import warnings; warnings.filterwarnings(action='once')
import os

os.environ['NLS_LANG'] = 'AMERICAN_AMERICA.ZHS16GBK'

config = {'font.family': 'serif',
            'font.serif': 'FangSong',
            'font.style': 'italic',
            #'font.weight': 'blod',#'normal',  # or 'blod'
            'font.size': 10,  # 此处貌似不能用类似large、small、medium字符串
            'axes.unicode_minus': False
            }
plt.rcParams.update(config)
#plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']= False
plt.style.use('seaborn-whitegrid')
sns.set_style("white")
# Import Data
df = pd.read_csv("./mpg_ggplot2.csv")
import matplotlib as mpl
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['font.serif'] = ['SimHei']
# Create Fig and gridspec
fig = plt.figure(figsize=(16, 10), dpi= 200)
grid = plt.GridSpec(4, 4, hspace=0.5, wspace=0.2)

# Define the axes
ax_main = fig.add_subplot(grid[:-1, :-1])
ax_right = fig.add_subplot(grid[:-1, -1], xticklabels=[], yticklabels=[])
ax_bottom = fig.add_subplot(grid[-1, 0:-1], xticklabels=[], yticklabels=[])

# Scatterplot on main ax
ax_main.scatter('displ', 'hwy', s=df.cty*4, c=df.manufacturer.astype('category').cat.codes, alpha=.9, data=df, cmap="tab10", edgecolors='gray', linewidths=.5)

# histogram on the right
ax_bottom.hist(df.displ, 40, histtype='stepfilled', orientation='vertical', color='deeppink')
ax_bottom.invert_yaxis()

# histogram in the bottom
ax_right.hist(df.hwy, 40, histtype='stepfilled', orientation='horizontal', color='deeppink')

# Decorations
ax_main.set(title='边缘箱形图 \n displ vs hwy', xlabel='displ', ylabel='hwy')
ax_main.title.set_fontsize(20)
for item in ([ax_main.xaxis.label, ax_main.yaxis.label] + ax_main.get_xticklabels() + ax_main.get_yticklabels()):
    item.set_fontsize(14)

#xlabels = ax_main.get_xticks().tolist()
#ax_main.set_xticklabels(xlabels)
plt.savefig('Scatterplot_with_Histograms.png',dpi=200)

散点密度图加直方图

使用scipy.stats.gaussian_kde进行核密度进行计算,这是使用Kernel density estimation的方法,估计出每个位置的密度值。 这代码参考森气笔记的代码,原代码有点问题,出图时显示不正确(下面图1),右侧和底部直方统计图位置不正确,根据上面4X4网络底图方法,稍做修改,得到正确的图。

# -*- encoding: utf-8 -*-
import pandas as pd
import os
import matplotlib.pyplot as plt
from scipy.stats import gaussian_kde
from mpl_toolkits.axes_grid1 import make_axes_locatable
import numpy as np
from matplotlib import ticker, cm
import seaborn as sns

df = pd.read_csv('./Fig1a_XY_obs.csv',index_col=0)
x,y = df.CxP.values,df.FR.values
xy = np.vstack([x,y])#将两个维度的数据进行叠加
kenal = gaussian_kde(xy)#这一步根据xy这个样本数据,在全定义域上建立了概率密度分布,所以kenal其实就是一个概率密度函数,输入对应的(x,y)坐标,就给出相应的概率密度
#kenal.set_bandwidth(bw_method=kenal1.factor)#这一步可以直接设置bandwith,通常情况下默认即可
z = kenal.evaluate(xy)#得到我们每个样本点的概率密度
z = gaussian_kde(xy)(xy)#这行代码和上面两行是相同的意思,这行是一行的写法
idx = z.argsort() #对z值进行从小到大排序并返回索引
x, y, z = x[idx], y[idx], z[idx]#对x,y按照z的升序进行排列
#上面两行代码是为了使得z值越高的点,画在上面,不被那些z值低的点挡住,从美观的角度来说还是十分必要的
#fig, ax = plt.subplots(figsize=(6,6),dpi=100)
fig = plt.figure(figsize=(8, 8), dpi= 200)
grid = plt.GridSpec(4, 4, hspace=0.5, wspace=0.2)
ax = fig.add_subplot(grid[:-1, :-1])
ax_histy = fig.add_subplot(grid[:-1, -1], xticklabels=[], yticklabels=[])
ax_histx = fig.add_subplot(grid[-1, 0:-1], xticklabels=[], yticklabels=[])
xcord=x
ycord=y
m = ((xcord*ycord).mean() - xcord.mean()* ycord.mean())/(pow(xcord,2).mean()-pow(xcord.mean(),2))
c = ycord.mean() - m*xcord.mean()
scatter=ax.scatter(x,y,c=z,s = 2)
divider=make_axes_locatable(ax)
ax.set_xlim(0,0.01)
ax.set_ylim(0,1.5)
ax.set_yticks(np.arange(0,1.51,0.5))
#ax_histx = divider.append_axes("bottom", 1.2, pad=0.15)
#ax_histy = divider.append_axes("right", 1.2, pad=0.15)
ax.set_xticklabels([])
# line 
ds = pd.read_csv('./Fig1a_XY_mod.csv',index_col=0)

ys = ['Y_pl', 'Y_pl_op', 'Y_sc', 'Y_li1', 'Y_np', 'Y_mean']
linestyles = ['-.','-.','-.','-.','-.','-']
colors = ['#723BA0','#8575D7','#8DCAD0','#E0C671','#9F795D','k']
labels = ['Power law','Power law (linear opt.)','Scale','Linear','Non-parametric','Mean']
for i in range(len(ys)):
    y = ds[ys[i]].values
    ax.plot(ds.X,y,linestyle=linestyles[i],c = colors[i],label = labels[i])
    ax.legend(frameon=False)
ax.set_ylabel('Lightning flash rate (number per km$^{2}$ per month)')
ax.set_xticks([0,0.005,0.010])

# part b
df2 = pd.read_csv('./Fig1b_CxP.csv',index_col=0)
sns.histplot(df2['rcp'].values, kde=True,ax = ax_histx,edgecolor = 'w',bins=51)
sns.histplot(df2['hist'].values, kde=True,ax = ax_histx,edgecolor = 'w',bins=30,color = 'red')

ax_histx.plot(1,1,label = 'Present day',c = '#D4A663')
ax_histx.plot(1,1,label = 'Future',c = '#0202FF')
ax_histx.legend(frameon=False)
ax_histx.set_ylabel('Norm. dist.')
ax_histx.set_xlabel('CAPE × Precip (W m$^{2}$)')

ax_histx.set_xticks([0,0.005,0.010])
ax_histx.set_xticklabels([0,0.005,'0.010'])
ax_histx.set_xlim(0,0.01)
ax_histx.set_ylim(0,400)
ax_histx.set_yticks([0,200,400])
# part c
df3 = pd.read_csv('./Fig1c_FR.csv',index_col=0)
ax_histy.set_xlabel('Norm. dist.')
ax_histy.set_yticks([])
ax_histy = ax_histy.twinx()
ax_histy.set_ylabel('Lightning flash rate (number per km$^{2}$ per month)',rotation = 270,labelpad = 15)
sns.histplot(y = df3['rcp'].values, kde=True,ax = ax_histy,edgecolor = 'w',bins=30)
sns.histplot(y = df3['hist'].values, kde=True,ax = ax_histy,color = 'red',edgecolor = 'w',bins=30)
ax_histy.set_xlim(350,0)
ax_histy.set_xticklabels([0,2.5])
ax_histy.set_ylim(0,1.5)
ax_histy.set_yticks(np.arange(0,1.51,0.5))
ax_histy.set_xlabel('Norm. dist.')
plt.rcParams['xtick.bottom'] = plt.rcParams['xtick.labelbottom'] = True
plt.rcParams['xtick.top'] = plt.rcParams['xtick.labeltop'] = False
plt.savefig('png2.png',dpi = 600)
#plt.show()

相关推荐

Modbus RTU 指令基本功能介绍(modbus-rtu)

ModbusRTU协议概述:入门级知识点ModbusRTU协议,是工业自动化领域应用广泛的串行通信协议。它简单、可靠,在各种工业设备之间建立通信桥梁,实现数据的采集和控制。ModbusRTU...

AIOT开发选型:行空板 K10 与 M10 适用场景与选型深度解析

前言随着人工智能和物联网技术的飞速发展,越来越多的开发者、学生和爱好者投身于创意项目的构建。在众多的开发板中,行空板K10和M10以其独特的优势脱颖而出。本文旨在为读者提供一份详尽的行空板K...

程序员花了1个月时间,手搓低成本机械臂:跟着他你也能复刻一台

在开源硬件的广阔天地中,SO-ARM100作为一款备受瞩目的开源机械臂项目脱颖而出。它以标准化的四轴机械臂设计为核心,构建起一个开放共享的技术平台,为机械臂爱好者与开发者提供了绝佳的远程操作实践场域...

RPC接口测试技术-Tcp 协议的接口测试

首先明确Tcp的概念,针对Tcp协议进行接口测试,是指基于Tcp协议的上层协议比如Http,串口,网口,Socket等。这些协议与Http测试方法类似(具体查看接口自动化测试章...

同事开玩笑说:你这个python程序要是外流出去了,可能会有危险

引言公司因为业务原因,购入了一些高灵敏高精度的振动传感器。老板说:“拿去进行测试,看看数据如何?”吭哧吭哧接入数据,一看,确实精度和灵敏度非常高。具体多高呢?将传感器固定在相关的结构物上,在办公室中人...

STM32搭建简易环境监测站并通过网络实时上报

一、系统总体架构本系统以STM32F407为核心,搭建一个环境监测节点,能够采集温湿度、光照、空气质量等数据,并通过OLED屏显示,同时通过ESP8266模块实现局域网数据上报。适合室内空气监测、智慧...

STM32通过NB-IoT模块实现远程告警推送

一、项目概述本系统以STM32F103C8T6作为主控核心,通过串口控制NB-IoT通信模块(移远BC26),实现对外设状态的远程监测和异常自动告警推送(如温度超限、设备震动异常等)。支持通过UDP或...

MicroPython 玩转硬件系列3:上电执行程序

1.引言上一篇:MicroPython玩转硬件系列2:点灯实验我们在ESP32上实现了LED灯的闪烁,但是有一个问题,该功能的实现需要我们在串口终端里去手动执行代码,可不可以让ESP32上电后自动...

打标机与上位机通讯异常如何快速定位?串口工具验证流程拆解

打标机与上位机通信过程中出现的错误问题需要通过串口通信助手验证,主要原因在于串口通信的底层特性以及问题隔离的工程需求。以下是原理说明和验证方法:一、验证原理底层数据透明化串口通信本质上是基于二进制数据...

4G短信猫发送中文短信(Python)(4g短信)

4G短信猫发送中文短信(Python)4G短信猫发送中文短信的方式可以使用TEXT模式或者PDU模式。1.TEXT模式在TEXT模式下发送中文短信的指令序列:AT+CSCS="UCS2...

ESP32如何刷microPython固件(esp32 固件升级)

目录为什么要刷microPython固件固件和工具的获取刷固件的步骤检验是否成功1.为什么要刷固件microPython是由计算机工程师DamienGeorge设计出来的,他的初衷是——用Pyth...

CH9329双头线使用说明(双头线是干什么用的)

目录1.介绍说明2.测试说明3.修改为ASCII模式(CH9328字符模式)常见问题解答:1.介绍说明CH9329双头线是集成了CH9329+CH340芯片的成品线,主要作用是使用主控电脑发送串口指令...

Windows下最简单的ESP8266_ROTS_ESP-IDF环境搭建与腾讯云SDK编译

前言其实也没啥可说的,只是我感觉ESP-IDF对新手来说很不友好,很容易踩坑,尤其是对业余DIY爱好者搭建环境非常困难,即使有官方文档,或者网上的其他文档,但是还是很容易踩坑,多研究,记住两点就行了,...

CPU眼里的:Python 和 C(cpp和python)

“Python跟C语言有什么联系?它们在计算机系统中分别扮演着什么角色?”01提出问题Python可能是当今最热门的编程语言,凭借简洁易读的语法和强大的生态,成为许多新手程序员的首选。然而,作为一门解...

Python在工控领域的应用与优势(python工业控制系统)

前言之前利用Python编写了一些S7系列的PLC调试工具和组态开发,今天就具体讲讲Python在工控领域还有哪些应用与优势。Python在工业控制工控领域的应用逐渐增多,得益于其简洁的语法、丰富的生...

取消回复欢迎 发表评论: