百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

案例应用:热力图应用解析,以双色球中奖号码分布研究为例

off999 2024-12-10 19:21 27 浏览 0 评论

热力图是一种数据可视化技术,它通过颜色的变化来展示数据的分布情况,在热力图中,用颜色的深浅程度来表示数据值的大小,通常颜色越深表示数据值越大或者数据越密集,颜色越浅表示数据值越小或者数据越稀疏。

热力图的应用非常广泛,它可以用于显示各种类型的数据分布,通过热力图可直观地看出数据的整体分布情况,以及不同变量之间的差异性,本案例使用双色球数据用热力图展示,用于研究每个中奖号码的分布情况。

如下选取了近30期的开奖号码数据,数据呈现不规则,需要使用Python进行数据处理,将其处理为标准数据。

首先,使用pandas函数导入开奖数据,由于原始数据有合并单元格,但是导入的时候默认会取消单元格,可以向下填充将数据补齐,并且,使用groupby函数按照'期号'和'开奖日期'将中奖号码分组聚合为list列表的形式,如下为数据处理后的结果。

import pandas as pd

#数据导入
df=pd.read_excel(r'D:\系统桌面(勿删)\Desktop\双色球中奖号码.xlsx',usecols=['期号','开奖日期','开奖号码'],dtype={'期号': str,'开奖号码': str})
#数据筛选
df=df.iloc[1:]

#向下填充
df_ffilled = df.fillna(method='ffill')
#中奖号码分组聚合
result = df_ffilled.groupby(['期号','开奖日期']).apply(lambda x: x['开奖号码'].to_list()).reset_index() 
result.rename(columns={0:'中奖号码'},inplace=True)#重命名

result.head()#数据预览

中奖号码数据为列表的形式,将其转化为字符型,然后使用replace函数替换多余的符号,并且,使用split函数将中奖号码分列,如下为每一期中奖号码按照色球位置分列后的结果。

#中奖号码分列
result['中奖号码'] = result['中奖号码'].astype(str)
result['中奖号码']=result['中奖号码'].str.replace("[","")
result['中奖号码']=result['中奖号码'].str.replace("]","")
result['中奖号码']=result['中奖号码'].str.replace("'","")
df_split=result['中奖号码'].str.split(',',expand=True)

df_split.head()

数据分列后,统计每一期中奖号码出现的次数,如下为号码出现的次数,由结果可以得知,以第一个红球位置号码出现次数为例,数字1出现了7次,数字10出现了3次,数据11出现了1次...,依此统计每个号码在该色球位置出现的次数。

#对每一位的中奖号码统计出现次数
df1=df_split.groupby(0).size()
df2=df_split.groupby(1).size()
df3=df_split.groupby(2).size()
df4=df_split.groupby(3).size()
df5=df_split.groupby(4).size()
df6=df_split.groupby(5).size()
df7=df_split.groupby(6).size()

print(df1,df2,df3,df4,df5,df6,df7)

将统计的次数横向合并,由于有些数字没有出现,将显示为NaN,为了便于后面可视化展示,可以将其替换为0,如下即为表格合并后的结果,其中,横向0到6代表着红球和蓝球的位置,竖向10到14代表着中奖号码,表格中的数字为中奖号码出现的次数。

#横向表合并(行对齐)
data=pd.concat([df1,df2,df3,df4,df5,df6,df7],axis=1,sort=True)
data=data.fillna(0)#空值NaN替换为0
data=data.round(0).astype(int) #浮点数转换为整数

data.head()

导入seaborn库,使用sns.heatmap函数绘制热力图,由热力图可以直观地显示每一个中奖号码在每一个色球位置出现的频次,频次越大则出现该数字的概率越大。

import matplotlib.pyplot as plt
import seaborn as sns
sns.set()#使用默认设置
plt.figure(figsize=(6,9))#设置图片大小
plt.rcParams['font.sans-serif'] = ['SimHei']#显示中文

plt.title('双色球中奖数字热力图')

#绘制热力图,annot显示数值 vmin,vmax用于设置颜色映射的数值范围 cmap颜色映射
sns.heatmap(data,annot=True,vmin=0,vmax=5,cmap="Blues") 
#坐标轴设置
plt.xlabel('双色球位数')
plt.ylabel('双色球数字')
x=['红球1','红球2','红球3','红球4','红球5','红球6','蓝球1']
plt.xticks(range(0,7,1),x,ha='left')

plt.show()

可视化结果如下,统计每个中奖号码出现频率越高的号码都有哪些?如下为每个色球位置中奖号码的频次。

  • 红球1:1出现7次,2出现7次
  • 红球2:8出现5次
  • 红球3:13出现4次
  • 红球4:25出现4次
  • 红球5:25出现4次,29出现4次,30出现4次
  • 红球6:33出现5次
  • 蓝球1:4出现5次

基于此可以出现一些组合号码,比如01 08 13 25 25 33 04,由于每次的组合号码的数字都是独立事件,上面的数字组合具有随机性。

以上,我们使用seaborn绘制一个双色球热力图,使用热力图呈现每个中奖号码的出现频次,频率越高,则在热力图上显示的颜色越深,借助案例演示数据可视化在实际生活中的应用,如果你想学习更多数据可视化内容,可以关注我,持续分享数据分析内容~

相关推荐

电脑怎么下载百度(笔记本电脑怎么下载百度)

电脑下载浏览器步骤如下1.打开电脑浏览器,搜索想要下载的电脑版的浏览器,打开官网2.进入官网,点击立即下载3.出现新建下载任务图标,点击下载,下载安装包4.下载完毕,点击打开5.进入安装界面,点击安装...

gho怎么安装系统(gho怎么重装系统)
  • gho怎么安装系统(gho怎么重装系统)
  • gho怎么安装系统(gho怎么重装系统)
  • gho怎么安装系统(gho怎么重装系统)
  • gho怎么安装系统(gho怎么重装系统)
此电脑图标不见了怎么恢复(电脑中此电脑图标不见了怎么恢复)
此电脑图标不见了怎么恢复(电脑中此电脑图标不见了怎么恢复)

步骤/方式1系统版本:windows10系统  品牌型号:联想ThinkPad。 步骤:在桌面空白处点击鼠标右键选择个性化;步骤/方式2点击更改桌面图标。步骤/方式3勾选计算机。步骤/方式4如下所示,即可把“此电脑”图标显示在电脑桌面。...

2025-11-06 15:51 off999

电脑声卡驱动安装(电脑声卡驱动安装失败)
  • 电脑声卡驱动安装(电脑声卡驱动安装失败)
  • 电脑声卡驱动安装(电脑声卡驱动安装失败)
  • 电脑声卡驱动安装(电脑声卡驱动安装失败)
  • 电脑声卡驱动安装(电脑声卡驱动安装失败)
路由器wan口未连接如何处理(路由器wan口未连接是什么原因)

路由器wan口未连接的原因!出现WAN口未连接的情况,有以下2种常见的原因:1、路由器的WAN口没有与Moden(猫)、光猫、入户网线连接,并且路由器自动检测到了该问题而进行的提示2、路由器进行了...

阿里云国际站ECS:阿里云ECS如何提高网站的访问速度?

TG:@yunlaoda360引言:速度即体验,速度即业务在当今数字化的世界中,网站的访问速度已成为决定用户体验、用户留存乃至业务转化率的关键因素。页面加载每延迟一秒,都可能导致用户流失和收入损失。对...

高流量大并发Linux TCP性能调优_linux 高并发网络编程

其实主要是手里面的跑openvpn服务器。因为并没有明文禁p2p(哎……想想那么多流量好像不跑点p2p也跑不完),所以造成有的时候如果有比较多人跑BT的话,会造成VPN速度急剧下降。本文所面对的情况为...

性能测试100集(12)性能指标资源使用率

在性能测试中,资源使用率是评估系统硬件效率的关键指标,主要包括以下四类:#性能测试##性能压测策略##软件测试#1.CPU使用率定义:CPU处理任务的时间占比,计算公式为1-空闲时间/总...

Linux 服务器常见的性能调优_linux高性能服务端编程

一、Linux服务器性能调优第一步——先搞懂“看什么”很多人刚接触Linux性能调优时,总想着直接改配置,其实第一步该是“看清楚问题”。就像医生看病要先听诊,调优前得先知道服务器“哪里...

Nginx性能优化实战:手把手教你提升10倍性能!

关注△mikechen△,十余年BAT架构经验倾囊相授!Nginx是大型架构而核心,下面我重点详解Nginx性能@mikechen文章来源:mikechen.cc1.worker_processe...

高并发场景下,Spring Cloud Gateway如何抗住百万QPS?

关注△mikechen△,十余年BAT架构经验倾囊相授!大家好,我是mikechen。高并发场景下网关作为流量的入口非常重要,下面我重点详解SpringCloudGateway如何抗住百万性能@m...

Kubernetes 高并发处理实战(可落地案例 + 源码)

目标场景:对外提供HTTPAPI的微服务在短时间内收到大量请求(例如每秒数千至数万RPS),要求系统可弹性扩容、限流降级、缓存减压、稳定运行并能自动恢复。总体思路(多层防护):边缘层:云LB...

高并发场景下,Nginx如何扛住千万级请求?

Nginx是大型架构的必备中间件,下面我重点详解Nginx如何实现高并发@mikechen文章来源:mikechen.cc事件驱动模型Nginx采用事件驱动模型,这是Nginx高并发性能的基石。传统...

Spring Boot+Vue全栈开发实战,中文版高清PDF资源

SpringBoot+Vue全栈开发实战,中文高清PDF资源,需要的可以私我:)SpringBoot致力于简化开发配置并为企业级开发提供一系列非业务性功能,而Vue则采用数据驱动视图的方式将程序...

Docker-基础操作_docker基础实战教程二

一、镜像1、从仓库获取镜像搜索镜像:dockersearchimage_name搜索结果过滤:是否官方:dockersearch--filter="is-offical=true...

取消回复欢迎 发表评论: