百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

【数据可视化】Python日历热力图calplot

off999 2024-12-10 19:20 18 浏览 0 评论

很久没有更新了,本来不打算更新内容了,但是这一段时间持续会用到一些以前的知识内容,PowerBI、Python和R都会涉及,有些特定的问题查资料、问ChatGPT都不能很有效的解决,最方便的还是看自己的历史文章,因为是自己写的,很容易就能够拿来使用。

所以基于此还是打算后面会继续更新内容,尽量让每一个板块最后都能形成体系,方便查阅和使用。打算更新的内容是PowerBI、数据可视化、分析思维模型、机器学习四个方向,没有固定的顺序,但最后会查漏补缺形成一个整体。

今天从一个可视化的内容开始回归。因为有使用需求,但是网上查了很多资料都很简单,没有达到使用的需求,于是结合官方文档,把自己能够想到的需求都使用案例完整展示一遍。是关于日历可视化的一个需求,目标很简单,按照每天一个单元格,每周一个维度,把一年的数据连城整体,可以直观的从日期的维度看到数据的趋势。

官方的链接和案例效果如下,有更细致的需求可以去看文档↓

https://calplot.readthedocs.io/en/latest/

可使用的参数也挺多,这里只列出来做参考↓

calplot.calplot(data, 
                how='sum', 
                yearlabels=True, 
                yearascending=True, 
                yearlabel_kws=None, 
                subplot_kws=None, 
                gridspec_kws=None, 
                figsize=None, 
                fig_kws=None, 
                colorbar=None, 
                suptitle=None, 
                suptitle_kws=None, 
                tight_layout=True, 
                **kwargs)

数据格式很简单,一个日期列+一个数值列,日期列需要设置成Index,作用是可以提取日期和时间,精准的放在每个方块里面。值只需要一个字段,根据值的大小来显示颜色。这里有一个模拟的数据,下载地址和字段如下↓

https://linss.oss-cn-beijing.aliyuncs.com/Python/File/calplot_data.xlsx

【准备工作】

先导入相应的数据和包,除了calplot的主题包可能需要格外安装,其他都是常用的包↓

import os
os.chdir(r"C:\Users\wangf\Desktop")
import calplot
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties
font_path = 'C:/WINDOWS/Fonts/MSYH.TTC'
my_font = FontProperties(fname=font_path)
plt.rcParams['font.sans-serif'] = ['SimHei']  # 设置中文字体为黑体
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号

这里因为后续需要用中文字符,就先把字体进行了设置,后续就不会报错了。然后接下来加载数据就行了。需要注意的是,要通过要把数据转化成series格式↓

df = pd.read_excel("calplot_data.xlsx")
df.set_index(df['date'],inplace = True)
df = df[['value']]
#将DataFrame的单列转换为Series,保留索引
series_data = df.squeeze()

【内置画图】

先简单画一个,大部分是内置参数,只需要传输数据即可↓

calplot.calplot(series_data)

通过edgecolor参数把边框去掉,然后使用cmap来映射系统的颜色,可以根据需求选择色系,代码和效果如下↓

calplot.calplot(series_data, 
                edgecolor=None, 
                cmap='RdGy_r')

使用figsize参数可以设置画布的大小↓

calplot.calplot(series_data, 
                edgecolor=None, 
                cmap='RdGy_r', 
                figsize=(16,9))

现在横坐标和纵坐标显示的是英文的星期和月份的缩写,可以通过daylabels和monthlabels两个参数设置自定义的显示名称,但需要主义的是,星期里面必须有7个值,月份里面必须12个值,代码和如下↓

calplot.calplot(series_data,
                edgecolor=None,
                figsize=(16,6),
                daylabels = ("周一","周二","周三","周四","周五","周六","周日"),
                monthlabels = ("1月","2月","3月","4月","5月","6月","7月","8月","9月","10月","11月","12月"),
                cmap='RdGy_r')

系统自带的颜色选项有166种,如下,可以根据需求自己选择,可以通过循环语句,展示所有的颜色,下面用部分颜色进行演示↓

color_list = ['Accent', 'Accent_r', 'Blues', 'Blues_r', 'BrBG', 'BrBG_r', 'BuGn', 'BuGn_r', 'BuPu', 'BuPu_r', 'CMRmap', 'CMRmap_r', 'Dark2', 'Dark2_r', 'GnBu', 'GnBu_r', 'Greens', 'Greens_r', 'Greys', 'Greys_r', 'OrRd', 'OrRd_r', 'Oranges', 'Oranges_r', 'PRGn', 'PRGn_r', 'Paired', 'Paired_r', 'Pastel1', 'Pastel1_r', 'Pastel2', 'Pastel2_r', 'PiYG', 'PiYG_r', 'PuBu', 'PuBuGn', 'PuBuGn_r', 'PuBu_r', 'PuOr', 'PuOr_r', 'PuRd', 'PuRd_r', 'Purples', 'Purples_r', 'RdBu', 'RdBu_r', 'RdGy', 'RdGy_r', 'RdPu', 'RdPu_r', 'RdYlBu', 'RdYlBu_r', 'RdYlGn', 'RdYlGn_r', 'Reds', 'Reds_r', 'Set1', 'Set1_r', 'Set2', 'Set2_r', 'Set3', 'Set3_r', 'Spectral', 'Spectral_r', 'Wistia', 'Wistia_r', 'YlGn', 'YlGnBu', 'YlGnBu_r', 'YlGn_r', 'YlOrBr', 'YlOrBr_r', 'YlOrRd', 'YlOrRd_r', 'afmhot', 'afmhot_r', 'autumn', 'autumn_r', 'binary', 'binary_r', 'bone', 'bone_r', 'brg', 'brg_r', 'bwr', 'bwr_r', 'cividis', 'cividis_r', 'cool', 'cool_r', 'coolwarm', 'coolwarm_r', 'copper', 'copper_r', 'cubehelix', 'cubehelix_r', 'flag', 'flag_r', 'gist_earth', 'gist_earth_r', 'gist_gray', 'gist_gray_r', 'gist_heat', 'gist_heat_r', 'gist_ncar', 'gist_ncar_r', 'gist_rainbow', 'gist_rainbow_r', 'gist_stern', 'gist_stern_r', 'gist_yarg', 'gist_yarg_r', 'gnuplot', 'gnuplot2', 'gnuplot2_r', 'gnuplot_r', 'gray', 'gray_r', 'hot', 'hot_r', 'hsv', 'hsv_r', 'inferno', 'inferno_r', 'jet', 'jet_r', 'magma', 'magma_r', 'nipy_spectral', 'nipy_spectral_r', 'ocean', 'ocean_r', 'pink', 'pink_r', 'plasma', 'plasma_r', 'prism', 'prism_r', 'rainbow', 'rainbow_r', 'seismic', 'seismic_r', 'spring', 'spring_r', 'summer', 'summer_r', 'tab10', 'tab10_r', 'tab20', 'tab20_r', 'tab20b', 'tab20b_r', 'tab20c', 'tab20c_r', 'terrain', 'terrain_r', 'turbo', 'turbo_r', 'twilight', 'twilight_r', 'twilight_shifted', 'twilight_shifted_r', 'viridis', 'viridis_r', 'winter', 'winter_r']
fig, axs = plt.subplots(10, 1, figsize=(6, 20))
for i, cor in enumerate(color_list[:10]):
    ax = axs[i]
    calplot.yearplot(series_data,
                    edgecolor=None,
                    ax=ax,
                    daylabels=("周一", "周二", "周三", "周四", "周五", "周六", "周日"),
                    monthlabels=("1月", "2月", "3月", "4月", "5月", "6月", "7月", "8月", "9月", "10月", "11月", "12月"),
                    cmap=cor)
    ax.set_title(cor, fontsize=16, pad=10)
plt.tight_layout()
plt.show()

【自定义颜色】

当然如果对系统的配色不满意,可以自己来自定义颜色,需要加载matplotlib里面颜色的包↓

import matplotlib.colors as mcolors
from matplotlib.colors import LinearSegmentedColormap
# 创建自定义颜色映射
custom_colors = ['#b52410', '#bfb43b', '#30ad1a']
num_colors = len(custom_colors)
colors = [mcolors.to_rgba(color) for color in custom_colors]
cmap = LinearSegmentedColormap.from_list('custom_cmap', colors, N=num_colors)
# 重新绘制颜色修改后的日历图
calplot.calplot(series_data,
                edgecolor=None,
                figsize=(16,6),
                daylabels = ("周一","周二","周三","周四","周五","周六","周日"),
                monthlabels = ("1月","2月","3月","4月","5月","6月","7月","8月","9月","10月","11月","12月"),
                cmap=cmap)

上面自定义了红黄蓝三个颜色,效果如下↓

可以看到,效果还可以,但是有一个不足是三种颜色是固定的,而不是上面系统中的渐变色,这就需要继续操作一下。

# 创建自定义渐变色映射
colors = [(0, '#b52410'), (0.5, '#ffffff'), (1, '#30ad1a')]
cmap = LinearSegmentedColormap.from_list('custom_cmap', colors)


# 绘制日历图,并使用自定义的渐变色映射
calplot.calplot(series_data,
                edgecolor=None,
                figsize=(16,6),
                daylabels = ("周一","周二","周三","周四","周五","周六","周日"),
                monthlabels = ("1月","2月","3月","4月","5月","6月","7月","8月","9月","10月","11月","12月"),
                cmap=cmap)

最终得到了我们想要的效果。

链接是我使用PowerBI整合的历史文章,按类型分类,可以根据需求查询:Microsoft Power BI

End

相关推荐

全网第一个讲清楚CPK如何计算的Step by stepExcel和Python同时实现

在网上搜索CPK的计算方法,几乎全是照搬教材的公式,在实际工作做作用不大,甚至误导人。比如这个又比如这个:CPK=min((X-LSL/3s),(USL-X/3s))还有这个,很规范的公式,也很清晰很...

[R语言] R语言快速入门教程(r语言基础操作)

本文主要是为了从零开始学习和理解R语言,简要介绍了该语言的最重要部分,以快速入门。主要参考文章:R-TutorialR语言程序的编写需要安装R或RStudio,通常是在RStudio中键入代码。但是R...

Python第123题:计算直角三角形底边斜边【PythonTip题库300题】

1、编程试题:编写一个程序,找出已知面积和高的直角三角形的另外两边(底边及斜边)。定义函数find_missing_sides(),有两个参数:area(面积)和height(高)。在函数内,计算另外...

Tensor:Pytorch神经网络界的Numpy

TensorTensor,它可以是0维、一维以及多维的数组,你可以将它看作为神经网络界的Numpy,它与Numpy相似,二者可以共享内存,且之间的转换非常方便。但它们也不相同,最大的区别就是Numpy...

python多进程编程(python多进程进程池)

forkwindows中是没有fork函数的,一开始直接在Windows中测试,直接报错importosimporttimeret=os.fork()ifret==0:...

原来Python的协程有2种实现方式(python协程模型)

什么是协程在Python中,协程(Coroutine)是一种轻量级的并发编程方式,可以通过协作式多任务来实现高效的并发执行。协程是一种特殊的生成器函数,通过使用yield关键字来挂起函数的执行...

ob混淆加密解密,新版大众点评加密解密

1目标:新版大众点评接口参数_token加密解密数据获取:所有教育培训机构联系方式获取难点:objs混淆2打开大众点评网站,点击教育全部,打开页面,切换到mobile模式,才能找到接口。打开开发者工具...

python并发编程-同步锁(python并发和并行)

需要注意的点:1.线程抢的是GIL锁,GIL锁相当于执行权限,拿到执行权限后才能拿到互斥锁Lock,其他线程也可以抢到GIL,但如果发现Lock仍然没有被释放则阻塞,即便是拿到执行权限GIL也要立刻...

10分钟学会Python基础知识(python基础讲解)

看完本文大概需要8分钟,看完后,仔细看下代码,认真回一下,函数基本知识就OK了。最好还是把代码敲一下。一、函数基础简单地说,一个函数就是一组Python语句的组合,它们可以在程序中运行一次或多次运行。...

Python最常见的170道面试题全解析答案(二)

60.请写一个Python逻辑,计算一个文件中的大写字母数量答:withopen(‘A.txt’)asfs:count=0foriinfs.read():ifi.isupper...

Python 如何通过 threading 模块实现多线程。

先熟悉下相关概念多线程是并发编程的一种方式,多线程在CPU密集型任务中无法充分利用多核性能,但在I/O操作(如文件读写、网络请求)等待期间,线程会释放GIL,此时其他线程可以运行。GIL是P...

Python的设计模式单例模式(python 单例)

单例模式,简单的说就是确保只有一个实例,我们知道,通常情况下类其实可以有很多实例,我们这么来保证唯一呢,全局访问。如配置管理、数据库连接池、日志处理器等。classSingleton: ...

更安全的加密工具:bcrypt(bcrypt加密在线)

作为程序员在开发工作中经常会使用加密算法,比如,密码、敏感数据等。初学者经常使用md5等方式对数据进行加密,但是作为严谨开发的程序员,需要掌握一些相对安全的加密方式,今天给大家介绍下我我在工作中使用到...

一篇文章搞懂Python协程(python协程用法)

前引之前我们学习了线程、进程的概念,了解了在操作系统中进程是资源分配的最小单位,线程是CPU调度的最小单位。按道理来说我们已经算是把cpu的利用率提高很多了。但是我们知道无论是创建多进程还是创建多线...

Python开发必会的5个线程安全技巧

点赞、收藏、加关注,下次找我不迷路一、啥是线程安全?假设你开了一家包子铺,店里有个公共的蒸笼,里面放着刚蒸好的包子。现在有三个顾客同时来拿包子,要是每个人都随便伸手去拿,会不会出现混乱?比如第一个顾...

取消回复欢迎 发表评论: