案例应用:热力图应用解析,以双色球中奖号码分布研究为例
off999 2024-12-10 19:21 32 浏览 0 评论
热力图是一种数据可视化技术,它通过颜色的变化来展示数据的分布情况,在热力图中,用颜色的深浅程度来表示数据值的大小,通常颜色越深表示数据值越大或者数据越密集,颜色越浅表示数据值越小或者数据越稀疏。
热力图的应用非常广泛,它可以用于显示各种类型的数据分布,通过热力图可直观地看出数据的整体分布情况,以及不同变量之间的差异性,本案例使用双色球数据用热力图展示,用于研究每个中奖号码的分布情况。
如下选取了近30期的开奖号码数据,数据呈现不规则,需要使用Python进行数据处理,将其处理为标准数据。
首先,使用pandas函数导入开奖数据,由于原始数据有合并单元格,但是导入的时候默认会取消单元格,可以向下填充将数据补齐,并且,使用groupby函数按照'期号'和'开奖日期'将中奖号码分组聚合为list列表的形式,如下为数据处理后的结果。
import pandas as pd
#数据导入
df=pd.read_excel(r'D:\系统桌面(勿删)\Desktop\双色球中奖号码.xlsx',usecols=['期号','开奖日期','开奖号码'],dtype={'期号': str,'开奖号码': str})
#数据筛选
df=df.iloc[1:]
#向下填充
df_ffilled = df.fillna(method='ffill')
#中奖号码分组聚合
result = df_ffilled.groupby(['期号','开奖日期']).apply(lambda x: x['开奖号码'].to_list()).reset_index()
result.rename(columns={0:'中奖号码'},inplace=True)#重命名
result.head()#数据预览中奖号码数据为列表的形式,将其转化为字符型,然后使用replace函数替换多余的符号,并且,使用split函数将中奖号码分列,如下为每一期中奖号码按照色球位置分列后的结果。
#中奖号码分列
result['中奖号码'] = result['中奖号码'].astype(str)
result['中奖号码']=result['中奖号码'].str.replace("[","")
result['中奖号码']=result['中奖号码'].str.replace("]","")
result['中奖号码']=result['中奖号码'].str.replace("'","")
df_split=result['中奖号码'].str.split(',',expand=True)
df_split.head()数据分列后,统计每一期中奖号码出现的次数,如下为号码出现的次数,由结果可以得知,以第一个红球位置号码出现次数为例,数字1出现了7次,数字10出现了3次,数据11出现了1次...,依此统计每个号码在该色球位置出现的次数。
#对每一位的中奖号码统计出现次数
df1=df_split.groupby(0).size()
df2=df_split.groupby(1).size()
df3=df_split.groupby(2).size()
df4=df_split.groupby(3).size()
df5=df_split.groupby(4).size()
df6=df_split.groupby(5).size()
df7=df_split.groupby(6).size()
print(df1,df2,df3,df4,df5,df6,df7)将统计的次数横向合并,由于有些数字没有出现,将显示为NaN,为了便于后面可视化展示,可以将其替换为0,如下即为表格合并后的结果,其中,横向0到6代表着红球和蓝球的位置,竖向10到14代表着中奖号码,表格中的数字为中奖号码出现的次数。
#横向表合并(行对齐)
data=pd.concat([df1,df2,df3,df4,df5,df6,df7],axis=1,sort=True)
data=data.fillna(0)#空值NaN替换为0
data=data.round(0).astype(int) #浮点数转换为整数
data.head()导入seaborn库,使用sns.heatmap函数绘制热力图,由热力图可以直观地显示每一个中奖号码在每一个色球位置出现的频次,频次越大则出现该数字的概率越大。
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()#使用默认设置
plt.figure(figsize=(6,9))#设置图片大小
plt.rcParams['font.sans-serif'] = ['SimHei']#显示中文
plt.title('双色球中奖数字热力图')
#绘制热力图,annot显示数值 vmin,vmax用于设置颜色映射的数值范围 cmap颜色映射
sns.heatmap(data,annot=True,vmin=0,vmax=5,cmap="Blues")
#坐标轴设置
plt.xlabel('双色球位数')
plt.ylabel('双色球数字')
x=['红球1','红球2','红球3','红球4','红球5','红球6','蓝球1']
plt.xticks(range(0,7,1),x,ha='left')
plt.show()可视化结果如下,统计每个中奖号码出现频率越高的号码都有哪些?如下为每个色球位置中奖号码的频次。
- 红球1:1出现7次,2出现7次
- 红球2:8出现5次
- 红球3:13出现4次
- 红球4:25出现4次
- 红球5:25出现4次,29出现4次,30出现4次
- 红球6:33出现5次
- 蓝球1:4出现5次
基于此可以出现一些组合号码,比如01 08 13 25 25 33 04,由于每次的组合号码的数字都是独立事件,上面的数字组合具有随机性。
以上,我们使用seaborn绘制一个双色球热力图,使用热力图呈现每个中奖号码的出现频次,频率越高,则在热力图上显示的颜色越深,借助案例演示数据可视化在实际生活中的应用,如果你想学习更多数据可视化内容,可以关注我,持续分享数据分析内容~
相关推荐
- 深度技术的win7系统怎么样(深度技术win7系统怎么安装教程)
-
所谓的纯净的win7系统应该说的就是原版的win7系统,相对于Ghost版的系统来说,原版的win7系统是微软发布的未经过第三方修改过的纯净版系统,安装好后,它所有的功能和软件都是微软官方的,不会添加...
- 电脑怎么安全模式开机(电脑怎么安全模式开机启动)
-
电脑开机后进入安全模式的步骤如下:重启电脑:在开机时,狂按F8键,即可进入启动菜单选择界面。选择安全模式:在启动菜单选择界面中,可以看到三个版本的安全模式可以选择,方向键上下调整,然后按下回车键即可。...
- win10企业版长期服务版(win10企业版 长期服务版)
-
Windows10企业版和企业长期服务版是微软为企业用户提供的两个版本,二者主要区别如下:1.版本周期不同。企业版(Enterprise)每年更新两次,每个版本的支持期限仅为18个月,而企业长期服...
- mercury管理页面网址(mercury设置网址是什么)
-
要进入mercury路由器的管理页面,首先需要将电脑与路由器连接,确保网络连接正常。接着在浏览器中输入路由器的默认IP地址(通常为192.168.1.1),按下回车键。输入用户名和密码(默认用户名和密...
- qq手机版官方(qq手机版官方免费下载安装)
-
z.qq.com可以通过以下方式登录手机QQ空间:1、使用手机登录手机腾讯网3g.qq.com,点击“空间”,根据提示QQ号码和QQ密码就可以登录;2、通过手机直接输入手机QQ空间网址z.qq.co...
- w7旗舰版系统怎么恢复出厂设置啊
-
方法一:1、左键单击任务栏开始按钮2、在启动项菜单右侧找到“控制面板”并左键单击3、在打开的界面中找到“区域和语言”选项并左键单击4、在弹出窗口中选择“键盘和语言”,在“选择显示语言”下...
- ubuntu下载安装(Ubuntu下载安装包)
-
要在Ubuntu上从官方网站下载和安装Evolution,您可以按照以下步骤进行操作:1.打开您的网页浏览器,访问Ubuntu的官方网站:https://ubuntu.com。2.点击页面顶部的“...
- 联想显示器售后服务电话(lenovo人工客服24小时)
-
联想显示器保修期限在1~2年之内,一,联想“三包”服务承诺联想按国家有关部门颁布的《微型计算机商品修理更换退货责任规定》(以下称“三包”规定)中的内容和范围,向用户提供“三包”服务。联想承担法定“...
- ipad密码忘了怎么办最简单的方法
-
一般ipad开机密码忘了有以下这种方法可以试一下:操作步骤/方法 1.下载最新版的iTunes。2.通过数据线将ipad与电脑iTunes相连接。3.将ipad按住电源键关机。4.同时按住电...
- 戴尔官翻机官网(戴尔官翻机购买地址)
-
肯定可以购买啊,价格还便宜。如果是官翻机应该是可以的,不像市场上的私人翻新机,这个质量应该有保障的可以买的。就是官方翻新机,市场上是有的。具体进入渠道先不管。反正市面上是肯定有的。但是这类手机是享受苹...
- 手机系统在哪里找(手机系统需要更新吗)
-
设置方法如下:1、首先输入锁屏密码,进入桌面;2、打开【设置】进入系统设置中心,打开【应用市场】即可查找应用程序;3、进入设置中心的【更多设置】,找到【开发者选项】;4、打开【开启开发者选项...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
python入门到脱坑 输入与输出—str()函数
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
失业程序员复习python笔记——条件与循环
-
系统u盘安装(win11系统u盘安装)
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
