Spark实战项目:交通实战项目(附加学习视频)
off999 2024-12-25 14:48 75 浏览 0 评论
前言
今天为大家带来是关于spark的实战项目。本次项目小编整理成了视频和文档的形势以及罗列了每一个重要的笔记和学习路线方便大家学习和参考!
1.数据表
2.数据来源
3.数据模拟
4.项目业务
- 卡扣监控
- 车流量top5的卡扣
- top5卡扣下所有车辆详细信息
- 获取车辆高速通过的TOPN卡扣
- 车辆高速这5个卡扣每个卡扣下车辆速度top10
- 碰撞分析
- 车辆轨迹
- 随机抽取车辆
- 计算卡扣流量转换率
数据表
monitor_flow_action 车流量监控表
monitor_camera_info 卡扣摄像头基本关系表数据来源
1.如果任务在本地执行,数据是每次运行模拟
2.如果任务在集群中运行,数据来源是Hive表
数据模拟
本地模拟
数据导入到Hive中
项目业务
1.卡扣监控
正常的卡扣数 7
异常的卡扣数 2
正常的摄像头个数 1000
异常的摄像头个数 5
异常的摄像头详细信息
0001:33333,44444~00005:12814,87463,99123
monitor_flow_action:
(0006,11111_22222,33333,44444,55555)
monitor_camera_info:
(0006,11111_22222,33333,44444,55555)
提交任务命令:
./spark-submit --master spark://node1:7077,node2:7077 --jars /root/test/mysql-connector-java-5.1.47.jar,/root/test/fastjson-1.2.11.jar --driver-class-path /root/test/mysql-connector-java-5.1.47.jar:/root/test/fastjson-1.2.11.jar --class com.bjsxt.spark.skynet.MonitorFlowAnalyze /root/test/TrafficProject-1.0-SNAPSHOT.jar 1
./spark-submit --master spark://node1:7077,node2:7077 --class com.bjsxt.spark.skynet.MonitorFlowAnalyze /root/test/TrafficProject-1.0-SNAPSHOT-jar-with-dependencies.jar 12.车流量top5的卡扣
3.top5卡扣下所有车辆详细信息
4.获取车辆高速通过的TOPN卡扣
二次排序问题
A B
speed >=120 高速 1 1
90<=speed<120 中速 2 10
60<=speed<90 正常 3 2
speed<60 低速 10 20
5.车辆高速这5个卡扣每个卡扣下车辆速度top10
分组取topN问题
- 1.原生集合排序
- 2.定义定长数组
6.碰撞分析
01,02中这一天同时出现的车辆
01:(car,row) 02:(car,row)
(car,row).join(car,row)
01:car 02:car
car02.intersection(car02)
7.车辆轨迹
统计卡扣0001下所有车辆的轨迹 -- take(20)
8.随机抽取车辆
在一天中抽取1000辆车分析当前道路的运行情况。这些车辆要分布均匀
一天中通过了车辆10000车。要随机抽取1000量车来代表当前道路的运行情况。怎么抽?
sample(0.1) = 1000
00-01:100 -- 100/10000 * 1000 = 10
01-02:200 -- 20
02-03:50 -- 5
03-04:100 -- 10
04-05:100
06-07:100
07-08:2000 --200
08-09:2000 --200
...
...
按照小时段抽取车辆。
9.计算卡扣流量转换率
一辆车的轨迹:
0001->0002->0001->0003->0001->0002
卡扣0001到卡扣0002的车流量转化率:2/3
0001,0002,0003,0004,0005:
0001,0002:
经过卡扣0001又经过卡扣0002的车辆数/经过卡扣0001的车辆数
0001,0002,0003:
经过卡扣0001,0002又经过卡扣0003的车辆数/经过卡扣0001,0002的车辆数
0001,0002,0003,0004:
经过卡扣0001,0002,0003又经过卡扣0004的车辆数/经过卡扣0001,0002,0003的车辆数
0001,0002,0003,0004,0005:
经过卡扣0001,0002,0003,0004又经过卡扣0005的车辆数/经过卡扣0001,0002,0003,0004的车辆数
10.SparkSQL
计算每个区域中车流量top3道路
海淀区 建材城西路 10000 0001=3000|0002=4000|0003=3000
海淀区 建材城东路 8000 0004=3000|0005=5000
海淀区 安宁庄东路 7000
朝阳区 朝阳路01 9000
朝阳区 朝阳路02 8000
朝阳区 朝阳路03 7000
tmp_car_flow_basic:
area_id area_name road_id monitor_id car
select
area_name,road_id,car_count,monitor_infos
from
(select
area_name,road_id, car_count,monitor_infos,row_number() over (partition by area_name order by car_count desc) as rn
from
(select
area_name,road_id,count(car) as car_count,UDAF(monitor_id) as monitor_infos
from
tmp_car_flow_basic
group by
area_name,road_id) tmp_area_road_flow_count) tmp
where rn<=3
学习路线
- 01-代码调优
- 02-Spark数据本地化调节+内存调节+shuffle调优
- 03-Spark 堆外内存调节+解决数据倾斜01
- 04-解决数据倾斜02
- 05-解决数据倾斜03
- 06-项目-卡扣流量转换率
- 07-项目-卡扣流量转换率代码
- 08-项目-区域道路车流量top3
实战笔记
- Spark-day1
- Spark-day2
- Spark-day3
- Spark-day4
- Spark-day5
- Spark-day6
- Spark-day7
- Spark-day8
- Spark-day9
- Spark-day10
最后
小编把一些重点知识点整理成视频和文档,想要获取的小伙伴可以私信【学习】获取哦~~~
相关推荐
- 怎么开启路由器wifi(怎么开启路由器的dhcp功能)
-
把路由器改为开放网络方法如下:1、打开浏览器,在地址栏输入路由器网关IP地址(路由器背后的标签上有,一般是192.168.1.1),输入登录用户名和密码(一般均为admin);2、登录成功后就显示运行...
- win10加载不出来桌面黑屏(window10加载不出来)
-
方法一、如果是遇到了突发性黑屏首先尝试使用Ctrl+Alt+Delete组合键来进行电脑重启一般重启可以解决大部分黑屏故障。win10电脑黑屏按什么键恢复_win10电脑黑屏一键恢复的方法方法...
- 怎么用火绒关闭win安全中心(win10火绒安全软件怎么关闭)
-
一、火绒防火墙关闭方法在电脑上运行火绒软件后,点击首页界面的“防护中心”,在病毒防护界面可以关闭文件、U盘、邮件等保护功能,。系统防护:在该界面可以关闭系统防护功能,。网络防护:可以关闭网络保护等功...
- 微软应用商店下载手机版(微软应用商店在哪下)
-
、在桌面任务栏找到微软应用商店,点击并打开。2、进入页面后点击【应用】,进入应用页面。3、在页面里往下移动,找到热门应用,找到一个软件,点击进入。4、进入页面后,点击【安装】,软件会自动安装,安装完毕...
- win11系统怎么查看电脑配置(win11怎么查看系统版本)
-
答:win11查看电脑配置步骤如下。1.点击下方任务栏的windows图标或者按下键盘“windows键”打开开始菜单。2.在开始菜单中找到“设置”或“settings”,一般是右上角的齿轮状按钮,3...
- 麦克风没坏但是没声音(麦克风没声怎么回事)
-
几种可能性,供您参考:1、麦是完全好的(其它机子上可以用)2、插孔没有插错3、音量控制里的麦克风并没有静音掉4、声卡驱动已重装过N次,新的旧的都试过了5、音量控制→属性→录音→麦克风下面的勾...
- wps office是干什么的(wps office是干什么的可以卸载吗)
-
WPSOffice一站式办公服务平台,具有可兼容Word、Excel、PPT三大办公组件的不同格式,支持PDF文档的编辑与格式转换集成思维导图、流程图等诸多功...
- 百度网页(百度网页自动翻译怎么设置)
-
1、百度的新闻源网站太多了,基本上大型的商业门户+政府官方的媒体、机构部门都是。2、出现在【百度新闻】里的网站都是新闻源网站。3、怎么判断一个网站是不是新闻源:1)在百度新闻下直接搜网站名字,如果出现...
- 外国网站的浏览器下载(外国网站的浏览器下载Games)
-
答,可在浏览器上面下载所需要的视频/音乐的名称,下载完毕后,按所给的排列表找出所需要的视频/音乐。如果是喜欢的视频/音乐它在浏览器里边都有分类,可详细的介绍一下自己吧,还可以在古典音乐或者名著导读介绍...
-
- 京东攒机助手(京东攒机在哪)
-
自己在京东买的配置,以为身边的人能帮忙组装,但是好像超过了个人的认知,所以无奈之下只能在京东找专业人士进行安装,挺快,前一天傍晚下单,第二天上午上班就来了,组装师傅挺好,挺有耐心,业务也挺熟练,走线看起来也不错,买的机箱是师傅从来没有接触过...
-
2025-11-14 22:03 off999
- 腾讯电脑管家和360哪个好(腾讯电脑管家好用还是360好用)
-
两个都很好。1.腾讯电脑管家和360卫士都是电脑上最常见的免费杀毒软件,两款软件在病毒查杀上都是首屈一指的。2.360卫士在功能上十分丰富,从木马查杀到电脑清理以及优化加速都是一应俱全的,而且还集成了...
- 笔记本突然没声音(笔记本突然没声音是什么原因)
-
可能是因为电脑声音驱动设备故障导致电脑没有声音。解决方法:使用Win+X快捷键,然后在弹出的窗口中点击“设备管理器”选项,之后点击“打开声音、视频和游戏控制器”选项,打开的属性界面查看运行是否正常,或...
- 大白菜一键装机win7系统(大白菜装系统教程win7)
-
1.电脑开机按f2或del进bios里面,启动项里面设置U盘启动,保存退出重启。2.键盘上一直按f12或f10,选择大白菜的u盘,进入pe界面,键盘按上下健移动,选择2003pe或win10pe,按回...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
慕ke 前端工程师2024「完整」
-
失业程序员复习python笔记——条件与循环
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
