案例应用:热力图应用解析,以双色球中奖号码分布研究为例
off999 2024-12-10 19:21 24 浏览 0 评论
热力图是一种数据可视化技术,它通过颜色的变化来展示数据的分布情况,在热力图中,用颜色的深浅程度来表示数据值的大小,通常颜色越深表示数据值越大或者数据越密集,颜色越浅表示数据值越小或者数据越稀疏。
热力图的应用非常广泛,它可以用于显示各种类型的数据分布,通过热力图可直观地看出数据的整体分布情况,以及不同变量之间的差异性,本案例使用双色球数据用热力图展示,用于研究每个中奖号码的分布情况。
如下选取了近30期的开奖号码数据,数据呈现不规则,需要使用Python进行数据处理,将其处理为标准数据。
首先,使用pandas函数导入开奖数据,由于原始数据有合并单元格,但是导入的时候默认会取消单元格,可以向下填充将数据补齐,并且,使用groupby函数按照'期号'和'开奖日期'将中奖号码分组聚合为list列表的形式,如下为数据处理后的结果。
import pandas as pd
#数据导入
df=pd.read_excel(r'D:\系统桌面(勿删)\Desktop\双色球中奖号码.xlsx',usecols=['期号','开奖日期','开奖号码'],dtype={'期号': str,'开奖号码': str})
#数据筛选
df=df.iloc[1:]
#向下填充
df_ffilled = df.fillna(method='ffill')
#中奖号码分组聚合
result = df_ffilled.groupby(['期号','开奖日期']).apply(lambda x: x['开奖号码'].to_list()).reset_index()
result.rename(columns={0:'中奖号码'},inplace=True)#重命名
result.head()#数据预览
中奖号码数据为列表的形式,将其转化为字符型,然后使用replace函数替换多余的符号,并且,使用split函数将中奖号码分列,如下为每一期中奖号码按照色球位置分列后的结果。
#中奖号码分列
result['中奖号码'] = result['中奖号码'].astype(str)
result['中奖号码']=result['中奖号码'].str.replace("[","")
result['中奖号码']=result['中奖号码'].str.replace("]","")
result['中奖号码']=result['中奖号码'].str.replace("'","")
df_split=result['中奖号码'].str.split(',',expand=True)
df_split.head()
数据分列后,统计每一期中奖号码出现的次数,如下为号码出现的次数,由结果可以得知,以第一个红球位置号码出现次数为例,数字1出现了7次,数字10出现了3次,数据11出现了1次...,依此统计每个号码在该色球位置出现的次数。
#对每一位的中奖号码统计出现次数
df1=df_split.groupby(0).size()
df2=df_split.groupby(1).size()
df3=df_split.groupby(2).size()
df4=df_split.groupby(3).size()
df5=df_split.groupby(4).size()
df6=df_split.groupby(5).size()
df7=df_split.groupby(6).size()
print(df1,df2,df3,df4,df5,df6,df7)
将统计的次数横向合并,由于有些数字没有出现,将显示为NaN,为了便于后面可视化展示,可以将其替换为0,如下即为表格合并后的结果,其中,横向0到6代表着红球和蓝球的位置,竖向10到14代表着中奖号码,表格中的数字为中奖号码出现的次数。
#横向表合并(行对齐)
data=pd.concat([df1,df2,df3,df4,df5,df6,df7],axis=1,sort=True)
data=data.fillna(0)#空值NaN替换为0
data=data.round(0).astype(int) #浮点数转换为整数
data.head()
导入seaborn库,使用sns.heatmap函数绘制热力图,由热力图可以直观地显示每一个中奖号码在每一个色球位置出现的频次,频次越大则出现该数字的概率越大。
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()#使用默认设置
plt.figure(figsize=(6,9))#设置图片大小
plt.rcParams['font.sans-serif'] = ['SimHei']#显示中文
plt.title('双色球中奖数字热力图')
#绘制热力图,annot显示数值 vmin,vmax用于设置颜色映射的数值范围 cmap颜色映射
sns.heatmap(data,annot=True,vmin=0,vmax=5,cmap="Blues")
#坐标轴设置
plt.xlabel('双色球位数')
plt.ylabel('双色球数字')
x=['红球1','红球2','红球3','红球4','红球5','红球6','蓝球1']
plt.xticks(range(0,7,1),x,ha='left')
plt.show()
可视化结果如下,统计每个中奖号码出现频率越高的号码都有哪些?如下为每个色球位置中奖号码的频次。
- 红球1:1出现7次,2出现7次
- 红球2:8出现5次
- 红球3:13出现4次
- 红球4:25出现4次
- 红球5:25出现4次,29出现4次,30出现4次
- 红球6:33出现5次
- 蓝球1:4出现5次
基于此可以出现一些组合号码,比如01 08 13 25 25 33 04,由于每次的组合号码的数字都是独立事件,上面的数字组合具有随机性。
以上,我们使用seaborn绘制一个双色球热力图,使用热力图呈现每个中奖号码的出现频次,频率越高,则在热力图上显示的颜色越深,借助案例演示数据可视化在实际生活中的应用,如果你想学习更多数据可视化内容,可以关注我,持续分享数据分析内容~
相关推荐
- 如何理解python中面向对象的类属性和实例属性?
-
类属性和实例属性类属性就是给类对象中定义的属性通常用来记录与这个类相关的特征类属性不会用于记录具体对象的特征类属性的理解:类属性是与类自身相关联的变量,而不是与类的实例关联。它们通...
- Java程序员,一周Python入门:面向对象(OOP) 对比学习
-
Java和Python都是**面向对象编程(OOP)**语言,无非是类、对象、继承、封装、多态。下面我们来一一对比两者的OOP特性。1.类和对象Java和Python都支持面向对象...
- 松勤技术精选:Python面向对象魔术方法
-
什么是魔术方法相信大家在使用python的过程中经常会看到一些双下划线开头,双下划线结尾的方法,我们把它统称为魔术方法魔术方法的特征魔术方法都是双下划线开头,双下划线结尾的方法魔术方法都是pytho...
- [2]Python面向对象-【3】方法(python3 面向对象)
-
方法的概念在Python中,方法是与对象相关联的函数。方法可以访问对象的属性,并且可以通过修改对象的属性来改变对象的状态。方法定义在类中,可以被该类的所有对象共享。方法也可以被继承并重载。方法的语法如...
- 一文带你理解python的面向对象编程(OOP)
-
面向对象编程(OOP,Object-OrientedProgramming)是一个较难掌握的概念,而Python作为一门面向对象的语言,在学习其OOP特性时,许多人都会对“继承”和“多态”等...
- 简单学Python——面向对象1(编写一个简单的类)
-
Python是一种面向对象的编程语言(ObjectOrientedProgramming),在Python中所有的数据类型都是对象。在Python中,也可以自创对象。什么是类呢?类(Class)是...
- python进阶突破面向对象——四大支柱
-
面向对象编程(OOP)有四大基本特性,通常被称为"四大支柱":封装(Encapsulation)、继承(Inheritance)、多态(Polymorphism)和抽象(Abstrac...
- Python学不会来打我(51)面向对象编程“封装”思想详解
-
在面向对象编程(Object-OrientedProgramming,简称OOP)中,“封装(Encapsulation)”是四大核心特性之一(另外三个是继承、多态和抽象),它通过将数据(属性)和...
- Python之面向对象:对象属性解析:MRO不够用,补充3个方法
-
引言在前面的文章中,我们谈及Python在继承关系,尤其是多继承中,一个对象的属性的查找解析顺序。由于当时的语境聚焦于继承关系,所以只是简要提及了属性解析顺序同方法的解析顺序,而方法的解析顺序,在Py...
- Python之面向对象:通过property兼顾属性的动态保护与兼容性
-
引言前面的文章中我们简要提及过关于Python中私有属性的使用与内部“名称混淆”的实现机制,所以,访问私有属性的方法至少有3种做法:1、使用实例对象点操作符的方式,直接访问名称混淆后的真实属性名。2、...
- Python之面向对象:私有属性是掩耳盗铃还是恰到好处
-
引言声明,今天的文章中没有一行Python代码,更多的是对编程语言设计理念的思考。上一篇文章中介绍了关于Python面向对象封装特性的私有属性的相关内容,提到了Python中关于私有属性的实现是通过“...
- Python中的私有属性与方法:解锁面向对象编程的秘密
-
Python中的私有属性与方法:解锁面向对象编程的秘密在Python的广阔世界里,面向对象编程(OOP)是一种强大而灵活的方法论,它帮助我们更好地组织代码、管理状态,并构建可复用的软件组件。而在这个框...
- Python 面向对象:掌握类的继承与组合,让你的代码更高效!
-
引言:构建高效代码的基石Python以其简洁强大的特性,成为众多开发者首选的编程语言。而在Python的面向对象编程(OOP)范畴中,类的继承和组合无疑是两大核心概念。它们不仅能帮助我们实现代码复用,...
- python进阶-Day2: 面向对象编程 (OOP)
-
以下是为Python进阶Day2设计的学习任务,专注于面向对象编程(OOP)的核心概念和高阶特性。代码中包含详细注释,帮助理解每个部分的实现和目的。任务目标:复习OOP基础:类、对象、继...
- 外婆都能学会的Python教程(二十八):Python面向对象编程(二)
-
前言Python是一个非常容易上手的编程语言,它的语法简单,而且功能强大,非常适合初学者学习,它的语法规则非常简单,只要按照规则写出代码,Python解释器就可以执行。下面是Python的入门教程介绍...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python字典遍历 (54)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python重命名文件 (54)
- python面向对象编程 (60)
- python串口编程 (60)
- python读取文件夹下所有文件 (59)
- java调用python脚本 (56)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)