Python:数据可视化工具中的不二之选,数据可视化应用探索
off999 2024-12-30 06:07 32 浏览 0 评论
如果你会一点编程的话,那么做数据可视化一定要使用Python,原因很简单,使用Python做数据可视化简单而实用,图表类型丰富,Python中的matplotlib、seaborn、pyecharts均有强大的绘图功能,下面例举的可视化案例对你一定有所帮助!
热力图
使用heatmap函数,用于绘制热力图,从平面图上展示每个数字出现的频率,数字出现的频率越小,则颜色越深,数字出现的频率越大,则颜色越浅,从而将数字信息直观的表达出来。
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()#使用默认设置
plt.figure(figsize=(6,6))
plt.rcParams['font.sans-serif'] = ['SimHei']#显示中文
#提取每一位的中奖号码
series=df['中奖号码'].str.split(' ',expand=True)
#对每一位的中奖号码统计出现次数
df1=df.groupby(series[0]).size()
df2=df.groupby(series[1]).size()
df3=df.groupby(series[2]).size()
df4=df.groupby(series[3]).size()
df5=df.groupby(series[4]).size()
df6=df.groupby(series[5]).size()
df7=df.groupby(series[6]).size()
#横向表合并(行对齐)
data=pd.concat([df1,df2,df3,df4,df5,df6,df7],axis=1,sort=True)
data=data.fillna(0)#空值NaN替换为0
data=data.round(0).astype(int) #浮点数转换为整数
plt.title('双色球中奖数字热力图')
sns.heatmap(data,annot=True,fmt='d',lw=0.5) #绘制热力图
plt.xlabel('中奖号码位数')
plt.ylabel('双色球数字')
x=['前区1','前区2','前区3','前区4','前区5','后区1','后区2']
plt.xticks(range(0,7,1),x,ha='left')
plt.show()饼图
对各个区域的销售数计数,导入matplotlib包,传入销售数据列,并对具体的图表参数进行设置,可得出华南区域的销售数占比最大为36.3%,西南区域的销售数占比最小为3.1%。
import matplotlib.pyplot as plt
import matplotlib.style as psl
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
psl.use('ggplot')
df_QY=df.groupby(['区域'])['销售数'].count().reset_index()
#饼图
labels = df_QY['区域'].tolist()
explode = [0.05,0.05,0,0,0,0] # 用于突出显示数据
df_QY['销售数'].plot(kind='pie',figsize=(9,6),
autopct='%.1f%%',#数据标签
labels=labels,
startangle=260, #初始角度
explode=explode, # 突出显示数据
pctdistance=0.87, # 设置百分比标签与圆心的距离
textprops = {'fontsize':12, 'color':'k'}, # 设置文本标签的属性值
)
plt.title("各区域销售数占比")
plt.show()箱线图
对利润做箱线图,使用boxplot函数,并对箱线图图表的参数进行设置,可得出利润的数据分布情况,箱线图中的大多数利润数据都超过了箱线图的上下限。
import matplotlib.pyplot as plt
import matplotlib.style as psl
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
psl.use('ggplot')
plt.title('利润箱线图')
df_XB=df[df['区域']=='西北']
#箱线图
plt.boxplot(x=df_XB['利润'],#指定绘制箱线图的数据
whis=1.5, #指定1.5倍的四分位数差
widths=0.1, #指定箱线图中箱子的宽度为0.3
showmeans=True, #显示均值
#patch_artist=True, #填充箱子的颜色
#boxprops={'facecolor':'RoyalBlue'}, #指定箱子的填充色为宝蓝色
flierprops={'markerfacecolor':'red','markeredgecolor':'red','markersize':3}, #指定异常值的填充色、边框色和大小
meanprops={'marker':'h','markerfacecolor':'black','markersize':8}, #指定中位数的标记符号(虚线)和颜色
medianprops={'linestyle':'--','color':'orange'}, #指定均值点的标记符号(六边形)、填充色和大小
labels=['西北']
)
plt.show()折线图
对销售数做折线图,导入seaborn库,日期列做为X轴,销售数作为Y轴,由折线图可以看到销售数随日期的波动变化趋势。
import seaborn as sns
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
plt.figure(figsize=(10,6))
# 使用Seaborn绘制折线图
sns.lineplot(data=df, x='日期', y='销售数', color='blue')
# 设置图表标题和轴标签
plt.title('销售数折线图')
plt.xlabel('日期')
plt.ylabel('销售额')
# 显示图形
plt.show()词云图
对商品品类做词云图进行展示,wordcloud库可专门做词云图,通过使用字典统计商品类别数量,创建词云对象后,使用matplotlib绘制词云图,由词云图可以看出床品件套的品类最多,办公家具的品类最少。
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 商品类别列表
product_categories = df['商品品类'].tolist()
# 使用字典统计商品类别数量
category_counts = dict()
for category in product_categories:
if category in category_counts:
category_counts[category] += 1
else:
category_counts[category] = 1
#创建词云对象
wordcloud = WordCloud(font_path='simhei.ttf', background_color='white').generate_from_frequencies(category_counts)
# 使用matplotlib绘制词云图
plt.figure(figsize=(9, 6))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show()玫瑰图
调用pyecharts库里面的Pie图表,用来创建玫瑰图,rosetype参数用于设置是否展示成南丁格尔玫瑰图,默认None不展示成玫瑰图,设置rosetype="radius",用扇形圆心角展现数据的百分比,通过半径展现数据大小。
import pandas as pd
from pyecharts.charts import Pie
from pyecharts import options as opts
df=pd.read_excel(r'C:\Users\\Desktop\电商销售数据.xlsx')
df=df.groupby('省份')['销售数'].sum().reset_index()
df = df.sort_values(by='销售数',ascending=False)
cate =df['省份'].to_list()
data = df['销售数'].to_list()
#玫瑰图美化
pie = Pie(init_opts=opts.InitOpts(width='800px', height='600px', bg_color='white'))
pie.add('',[list(z) for z in zip(cate, data)],radius=['10%', '70%'],center=['50%', '50%'], rosetype="radius"
).set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}")#设置数据标签
).set_global_opts(title_opts=opts.TitleOpts(title='各省份销售数据玫瑰图',pos_left='350',pos_top='20',
title_textstyle_opts=opts.TextStyleOpts(color='black', font_size=16)),
legend_opts=opts.LegendOpts(is_show=False)#去除图例
).set_colors(
['rgb({b},0,{r})'.format(r=450-10(len(df)-x+1), b=200-10x) for x in range(len(df))])#设置渐变颜色
pie.render_notebook()如下即创建了一个关于各省份销售数据的玫瑰图,使用代码调用pyecharts库,并导入案例数据,并且调整玫瑰图的视图参数,使得玫瑰图有更好的视觉呈现,直观上可以突出重要数据。
学习数据可视化工具可根据个人需求和喜好来选择,希望本文的介绍能够帮助你更好地了解Python数据可视化工具,从而更好地进行数据分析和呈现,如果你在学习过程中遇到问题,可随时与我沟通和交流,解决你的数据可视化难题~
相关推荐
- 阿里云国际站ECS:阿里云ECS如何提高网站的访问速度?
-
TG:@yunlaoda360引言:速度即体验,速度即业务在当今数字化的世界中,网站的访问速度已成为决定用户体验、用户留存乃至业务转化率的关键因素。页面加载每延迟一秒,都可能导致用户流失和收入损失。对...
- 高流量大并发Linux TCP性能调优_linux 高并发网络编程
-
其实主要是手里面的跑openvpn服务器。因为并没有明文禁p2p(哎……想想那么多流量好像不跑点p2p也跑不完),所以造成有的时候如果有比较多人跑BT的话,会造成VPN速度急剧下降。本文所面对的情况为...
- 性能测试100集(12)性能指标资源使用率
-
在性能测试中,资源使用率是评估系统硬件效率的关键指标,主要包括以下四类:#性能测试##性能压测策略##软件测试#1.CPU使用率定义:CPU处理任务的时间占比,计算公式为1-空闲时间/总...
- Linux 服务器常见的性能调优_linux高性能服务端编程
-
一、Linux服务器性能调优第一步——先搞懂“看什么”很多人刚接触Linux性能调优时,总想着直接改配置,其实第一步该是“看清楚问题”。就像医生看病要先听诊,调优前得先知道服务器“哪里...
- Nginx性能优化实战:手把手教你提升10倍性能!
-
关注△mikechen△,十余年BAT架构经验倾囊相授!Nginx是大型架构而核心,下面我重点详解Nginx性能@mikechen文章来源:mikechen.cc1.worker_processe...
- 高并发场景下,Spring Cloud Gateway如何抗住百万QPS?
-
关注△mikechen△,十余年BAT架构经验倾囊相授!大家好,我是mikechen。高并发场景下网关作为流量的入口非常重要,下面我重点详解SpringCloudGateway如何抗住百万性能@m...
- Kubernetes 高并发处理实战(可落地案例 + 源码)
-
目标场景:对外提供HTTPAPI的微服务在短时间内收到大量请求(例如每秒数千至数万RPS),要求系统可弹性扩容、限流降级、缓存减压、稳定运行并能自动恢复。总体思路(多层防护):边缘层:云LB...
- 高并发场景下,Nginx如何扛住千万级请求?
-
Nginx是大型架构的必备中间件,下面我重点详解Nginx如何实现高并发@mikechen文章来源:mikechen.cc事件驱动模型Nginx采用事件驱动模型,这是Nginx高并发性能的基石。传统...
- Spring Boot+Vue全栈开发实战,中文版高清PDF资源
-
SpringBoot+Vue全栈开发实战,中文高清PDF资源,需要的可以私我:)SpringBoot致力于简化开发配置并为企业级开发提供一系列非业务性功能,而Vue则采用数据驱动视图的方式将程序...
- Docker-基础操作_docker基础实战教程二
-
一、镜像1、从仓库获取镜像搜索镜像:dockersearchimage_name搜索结果过滤:是否官方:dockersearch--filter="is-offical=true...
- 你有空吗?跟我一起搭个服务器好不好?
-
来人人都是产品经理【起点学院】,BAT实战派产品总监手把手系统带你学产品、学运营。昨天闲的没事的时候,随手翻了翻写过的文章,发现一个很严重的问题。就是大多数时间我都在滔滔不绝的讲理论,却很少有涉及动手...
- 部署你自己的 SaaS_saas如何部署
-
部署你自己的VPNOpenVPN——功能齐全的开源VPN解决方案。(DigitalOcean教程)dockovpn.io—无状态OpenVPNdockerized服务器,不需要持久存储。...
- Docker Compose_dockercompose安装
-
DockerCompose概述DockerCompose是一个用来定义和管理多容器应用的工具,通过一个docker-compose.yml文件,用YAML格式描述服务、网络、卷等内容,...
- 京东T7架构师推出的电子版SpringBoot,从构建小系统到架构大系统
-
前言:Java的各种开发框架发展了很多年,影响了一代又一代的程序员,现在无论是程序员,还是架构师,使用这些开发框架都面临着两方面的挑战。一方面是要快速开发出系统,这就要求使用的开发框架尽量简单,无论...
- Kubernetes (k8s) 入门学习指南_k8s kubeproxy
-
Kubernetes(k8s)入门学习指南一、什么是Kubernetes?为什么需要它?Kubernetes(k8s)是一个开源的容器编排系统,用于自动化部署、扩展和管理容器化应用程序。它...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
慕ke 前端工程师2024「完整」
-
失业程序员复习python笔记——条件与循环
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
