【数据可视化】Python日历热力图calplot
off999 2024-12-10 19:20 18 浏览 0 评论
很久没有更新了,本来不打算更新内容了,但是这一段时间持续会用到一些以前的知识内容,PowerBI、Python和R都会涉及,有些特定的问题查资料、问ChatGPT都不能很有效的解决,最方便的还是看自己的历史文章,因为是自己写的,很容易就能够拿来使用。
所以基于此还是打算后面会继续更新内容,尽量让每一个板块最后都能形成体系,方便查阅和使用。打算更新的内容是PowerBI、数据可视化、分析思维模型、机器学习四个方向,没有固定的顺序,但最后会查漏补缺形成一个整体。
今天从一个可视化的内容开始回归。因为有使用需求,但是网上查了很多资料都很简单,没有达到使用的需求,于是结合官方文档,把自己能够想到的需求都使用案例完整展示一遍。是关于日历可视化的一个需求,目标很简单,按照每天一个单元格,每周一个维度,把一年的数据连城整体,可以直观的从日期的维度看到数据的趋势。
官方的链接和案例效果如下,有更细致的需求可以去看文档↓
https://calplot.readthedocs.io/en/latest/
可使用的参数也挺多,这里只列出来做参考↓
calplot.calplot(data,
how='sum',
yearlabels=True,
yearascending=True,
yearlabel_kws=None,
subplot_kws=None,
gridspec_kws=None,
figsize=None,
fig_kws=None,
colorbar=None,
suptitle=None,
suptitle_kws=None,
tight_layout=True,
**kwargs)
数据格式很简单,一个日期列+一个数值列,日期列需要设置成Index,作用是可以提取日期和时间,精准的放在每个方块里面。值只需要一个字段,根据值的大小来显示颜色。这里有一个模拟的数据,下载地址和字段如下↓
https://linss.oss-cn-beijing.aliyuncs.com/Python/File/calplot_data.xlsx
【准备工作】
先导入相应的数据和包,除了calplot的主题包可能需要格外安装,其他都是常用的包↓
import os
os.chdir(r"C:\Users\wangf\Desktop")
import calplot
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties
font_path = 'C:/WINDOWS/Fonts/MSYH.TTC'
my_font = FontProperties(fname=font_path)
plt.rcParams['font.sans-serif'] = ['SimHei'] # 设置中文字体为黑体
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
这里因为后续需要用中文字符,就先把字体进行了设置,后续就不会报错了。然后接下来加载数据就行了。需要注意的是,要通过要把数据转化成series格式↓
df = pd.read_excel("calplot_data.xlsx")
df.set_index(df['date'],inplace = True)
df = df[['value']]
#将DataFrame的单列转换为Series,保留索引
series_data = df.squeeze()
【内置画图】
先简单画一个,大部分是内置参数,只需要传输数据即可↓
calplot.calplot(series_data)
通过edgecolor参数把边框去掉,然后使用cmap来映射系统的颜色,可以根据需求选择色系,代码和效果如下↓
calplot.calplot(series_data,
edgecolor=None,
cmap='RdGy_r')
使用figsize参数可以设置画布的大小↓
calplot.calplot(series_data,
edgecolor=None,
cmap='RdGy_r',
figsize=(16,9))
现在横坐标和纵坐标显示的是英文的星期和月份的缩写,可以通过daylabels和monthlabels两个参数设置自定义的显示名称,但需要主义的是,星期里面必须有7个值,月份里面必须12个值,代码和如下↓
calplot.calplot(series_data,
edgecolor=None,
figsize=(16,6),
daylabels = ("周一","周二","周三","周四","周五","周六","周日"),
monthlabels = ("1月","2月","3月","4月","5月","6月","7月","8月","9月","10月","11月","12月"),
cmap='RdGy_r')
系统自带的颜色选项有166种,如下,可以根据需求自己选择,可以通过循环语句,展示所有的颜色,下面用部分颜色进行演示↓
color_list = ['Accent', 'Accent_r', 'Blues', 'Blues_r', 'BrBG', 'BrBG_r', 'BuGn', 'BuGn_r', 'BuPu', 'BuPu_r', 'CMRmap', 'CMRmap_r', 'Dark2', 'Dark2_r', 'GnBu', 'GnBu_r', 'Greens', 'Greens_r', 'Greys', 'Greys_r', 'OrRd', 'OrRd_r', 'Oranges', 'Oranges_r', 'PRGn', 'PRGn_r', 'Paired', 'Paired_r', 'Pastel1', 'Pastel1_r', 'Pastel2', 'Pastel2_r', 'PiYG', 'PiYG_r', 'PuBu', 'PuBuGn', 'PuBuGn_r', 'PuBu_r', 'PuOr', 'PuOr_r', 'PuRd', 'PuRd_r', 'Purples', 'Purples_r', 'RdBu', 'RdBu_r', 'RdGy', 'RdGy_r', 'RdPu', 'RdPu_r', 'RdYlBu', 'RdYlBu_r', 'RdYlGn', 'RdYlGn_r', 'Reds', 'Reds_r', 'Set1', 'Set1_r', 'Set2', 'Set2_r', 'Set3', 'Set3_r', 'Spectral', 'Spectral_r', 'Wistia', 'Wistia_r', 'YlGn', 'YlGnBu', 'YlGnBu_r', 'YlGn_r', 'YlOrBr', 'YlOrBr_r', 'YlOrRd', 'YlOrRd_r', 'afmhot', 'afmhot_r', 'autumn', 'autumn_r', 'binary', 'binary_r', 'bone', 'bone_r', 'brg', 'brg_r', 'bwr', 'bwr_r', 'cividis', 'cividis_r', 'cool', 'cool_r', 'coolwarm', 'coolwarm_r', 'copper', 'copper_r', 'cubehelix', 'cubehelix_r', 'flag', 'flag_r', 'gist_earth', 'gist_earth_r', 'gist_gray', 'gist_gray_r', 'gist_heat', 'gist_heat_r', 'gist_ncar', 'gist_ncar_r', 'gist_rainbow', 'gist_rainbow_r', 'gist_stern', 'gist_stern_r', 'gist_yarg', 'gist_yarg_r', 'gnuplot', 'gnuplot2', 'gnuplot2_r', 'gnuplot_r', 'gray', 'gray_r', 'hot', 'hot_r', 'hsv', 'hsv_r', 'inferno', 'inferno_r', 'jet', 'jet_r', 'magma', 'magma_r', 'nipy_spectral', 'nipy_spectral_r', 'ocean', 'ocean_r', 'pink', 'pink_r', 'plasma', 'plasma_r', 'prism', 'prism_r', 'rainbow', 'rainbow_r', 'seismic', 'seismic_r', 'spring', 'spring_r', 'summer', 'summer_r', 'tab10', 'tab10_r', 'tab20', 'tab20_r', 'tab20b', 'tab20b_r', 'tab20c', 'tab20c_r', 'terrain', 'terrain_r', 'turbo', 'turbo_r', 'twilight', 'twilight_r', 'twilight_shifted', 'twilight_shifted_r', 'viridis', 'viridis_r', 'winter', 'winter_r']
fig, axs = plt.subplots(10, 1, figsize=(6, 20))
for i, cor in enumerate(color_list[:10]):
ax = axs[i]
calplot.yearplot(series_data,
edgecolor=None,
ax=ax,
daylabels=("周一", "周二", "周三", "周四", "周五", "周六", "周日"),
monthlabels=("1月", "2月", "3月", "4月", "5月", "6月", "7月", "8月", "9月", "10月", "11月", "12月"),
cmap=cor)
ax.set_title(cor, fontsize=16, pad=10)
plt.tight_layout()
plt.show()
【自定义颜色】
当然如果对系统的配色不满意,可以自己来自定义颜色,需要加载matplotlib里面颜色的包↓
import matplotlib.colors as mcolors
from matplotlib.colors import LinearSegmentedColormap
# 创建自定义颜色映射
custom_colors = ['#b52410', '#bfb43b', '#30ad1a']
num_colors = len(custom_colors)
colors = [mcolors.to_rgba(color) for color in custom_colors]
cmap = LinearSegmentedColormap.from_list('custom_cmap', colors, N=num_colors)
# 重新绘制颜色修改后的日历图
calplot.calplot(series_data,
edgecolor=None,
figsize=(16,6),
daylabels = ("周一","周二","周三","周四","周五","周六","周日"),
monthlabels = ("1月","2月","3月","4月","5月","6月","7月","8月","9月","10月","11月","12月"),
cmap=cmap)
上面自定义了红黄蓝三个颜色,效果如下↓
可以看到,效果还可以,但是有一个不足是三种颜色是固定的,而不是上面系统中的渐变色,这就需要继续操作一下。
# 创建自定义渐变色映射
colors = [(0, '#b52410'), (0.5, '#ffffff'), (1, '#30ad1a')]
cmap = LinearSegmentedColormap.from_list('custom_cmap', colors)
# 绘制日历图,并使用自定义的渐变色映射
calplot.calplot(series_data,
edgecolor=None,
figsize=(16,6),
daylabels = ("周一","周二","周三","周四","周五","周六","周日"),
monthlabels = ("1月","2月","3月","4月","5月","6月","7月","8月","9月","10月","11月","12月"),
cmap=cmap)
最终得到了我们想要的效果。
链接是我使用PowerBI整合的历史文章,按类型分类,可以根据需求查询:Microsoft Power BI
End
相关推荐
- 全网第一个讲清楚CPK如何计算的Step by stepExcel和Python同时实现
-
在网上搜索CPK的计算方法,几乎全是照搬教材的公式,在实际工作做作用不大,甚至误导人。比如这个又比如这个:CPK=min((X-LSL/3s),(USL-X/3s))还有这个,很规范的公式,也很清晰很...
- [R语言] R语言快速入门教程(r语言基础操作)
-
本文主要是为了从零开始学习和理解R语言,简要介绍了该语言的最重要部分,以快速入门。主要参考文章:R-TutorialR语言程序的编写需要安装R或RStudio,通常是在RStudio中键入代码。但是R...
- Python第123题:计算直角三角形底边斜边【PythonTip题库300题】
-
1、编程试题:编写一个程序,找出已知面积和高的直角三角形的另外两边(底边及斜边)。定义函数find_missing_sides(),有两个参数:area(面积)和height(高)。在函数内,计算另外...
- Tensor:Pytorch神经网络界的Numpy
-
TensorTensor,它可以是0维、一维以及多维的数组,你可以将它看作为神经网络界的Numpy,它与Numpy相似,二者可以共享内存,且之间的转换非常方便。但它们也不相同,最大的区别就是Numpy...
- python多进程编程(python多进程进程池)
-
forkwindows中是没有fork函数的,一开始直接在Windows中测试,直接报错importosimporttimeret=os.fork()ifret==0:...
- 原来Python的协程有2种实现方式(python协程模型)
-
什么是协程在Python中,协程(Coroutine)是一种轻量级的并发编程方式,可以通过协作式多任务来实现高效的并发执行。协程是一种特殊的生成器函数,通过使用yield关键字来挂起函数的执行...
- ob混淆加密解密,新版大众点评加密解密
-
1目标:新版大众点评接口参数_token加密解密数据获取:所有教育培训机构联系方式获取难点:objs混淆2打开大众点评网站,点击教育全部,打开页面,切换到mobile模式,才能找到接口。打开开发者工具...
- python并发编程-同步锁(python并发和并行)
-
需要注意的点:1.线程抢的是GIL锁,GIL锁相当于执行权限,拿到执行权限后才能拿到互斥锁Lock,其他线程也可以抢到GIL,但如果发现Lock仍然没有被释放则阻塞,即便是拿到执行权限GIL也要立刻...
- 10分钟学会Python基础知识(python基础讲解)
-
看完本文大概需要8分钟,看完后,仔细看下代码,认真回一下,函数基本知识就OK了。最好还是把代码敲一下。一、函数基础简单地说,一个函数就是一组Python语句的组合,它们可以在程序中运行一次或多次运行。...
- Python最常见的170道面试题全解析答案(二)
-
60.请写一个Python逻辑,计算一个文件中的大写字母数量答:withopen(‘A.txt’)asfs:count=0foriinfs.read():ifi.isupper...
- Python 如何通过 threading 模块实现多线程。
-
先熟悉下相关概念多线程是并发编程的一种方式,多线程在CPU密集型任务中无法充分利用多核性能,但在I/O操作(如文件读写、网络请求)等待期间,线程会释放GIL,此时其他线程可以运行。GIL是P...
- Python的设计模式单例模式(python 单例)
-
单例模式,简单的说就是确保只有一个实例,我们知道,通常情况下类其实可以有很多实例,我们这么来保证唯一呢,全局访问。如配置管理、数据库连接池、日志处理器等。classSingleton: ...
- 更安全的加密工具:bcrypt(bcrypt加密在线)
-
作为程序员在开发工作中经常会使用加密算法,比如,密码、敏感数据等。初学者经常使用md5等方式对数据进行加密,但是作为严谨开发的程序员,需要掌握一些相对安全的加密方式,今天给大家介绍下我我在工作中使用到...
- 一篇文章搞懂Python协程(python协程用法)
-
前引之前我们学习了线程、进程的概念,了解了在操作系统中进程是资源分配的最小单位,线程是CPU调度的最小单位。按道理来说我们已经算是把cpu的利用率提高很多了。但是我们知道无论是创建多进程还是创建多线...
- Python开发必会的5个线程安全技巧
-
点赞、收藏、加关注,下次找我不迷路一、啥是线程安全?假设你开了一家包子铺,店里有个公共的蒸笼,里面放着刚蒸好的包子。现在有三个顾客同时来拿包子,要是每个人都随便伸手去拿,会不会出现混乱?比如第一个顾...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python字典遍历 (54)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (60)
- python读取文件夹下所有文件 (59)
- java调用python脚本 (56)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)