用Python带你见识一下全国请假的通用理由 这个你肯定用的上
off999 2024-12-30 06:07 17 浏览 0 评论
前言
作为一名打工人,每个月都会有那么两天是抗拒上班不想上班的,请病假又太麻烦,要这个证明那个证明的,所以说只能请事假,虽然会没得工资,但是为了咱们心情愉悦,很多时候不能太看重那两天的钱了,那么你们通常的请假理由一般都是啥呢?我用Python分析了全国的请假理由才选定了这个理由!
看看有没有你用过的理由吧
数据采集
我们是从微博移动端来进行数据采集的。我们按F12,打开开发者模式,对网页进行观察
我们发现数据存储的网页是一个hotflow开头的页面,它的数据存储的方式是Ajax,那我们就可以知道请求的页面和提取数据的方式了。
在上面,我们已经找到数据存储的网页和方式,那么只需要找到页面之间的联系,构造好循环,就可以批量开始爬取啦~
接下来对不同页面之间的URL进行观察
它们URL里面的id和mid是固定不变的,但是max_id是变化的,然后我又在页面里面发现了max_id值的规律,每一页的max_id的值都在上一页中存储着。
但是这样还不能够全部都访问,具体的原因和改进措施,这里因为篇幅,志斌就不介绍了,有兴趣的读者可以看看这两篇文章,有详细解释。最后,如果你的时间不是很紧张,并且又想快速的python提高,最重要的是不怕吃苦,建议你可以价位(同音):762459510 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~
数据采集的核心代码:
import requests
import re
import time
import csv
for page in range(1,10000):
if page == 1 :
params = (
(‘id’, ‘4679186482727431’),
(‘mid’, ‘4686092090212455’),
(‘max_id_type’, ‘0’),
)
response = requests.get(‘https://m.weibo.cn/comments/hotflow’, headers=headers, params=params)
a = response.json()[‘data’][‘max_id’]
b = response.json()[‘data’][‘max_id_type’]
for i in response.json()[‘data’][‘data’]:
pinglunshijian = i[‘created_at’]
ri = pinglunshijian.split()[2]
shi = pinglunshijian.split()[3].split(’:’)[0]
dianzanshu = i[‘like_count’]
neirong = re.sub(r’]*>’, ‘’, i[‘text’])
id = i[‘user’][‘id’]
yonghumingcheng = i[‘user’][‘screen_name’]
with open(‘请假.csv’,‘a’,newline=’’) as f:
writer = csv.writer(f)
writer.writerow([yonghumingcheng,dianzanshu,ri,shi])
with open(r’请假.txt’, ‘a’, encoding=‘utf-8’) as f:
f.write(f’\n’)
可视化展示
我们此次一共获取了6216条数据,对这些数据进行可视化展示。
01
评论点赞top5用户
我们先来看看那些用户的评论最受大家认同。
这位叫顾狸狸的网友的评论点赞数是最高的,远超后几名,让我们来看看她的评论是什么,竟能让大家这么认同~
这理由确实可哇!而且很有文艺范,不像我只会用亲戚朋友结婚来当理由~
评论词云图
我们发现结婚、姐姐、婚礼这三个词比较多,结合从微博上看到的评论,看来大家都是一样用参加姐姐婚礼请假回家的理由最多~
图片来源于微博~
词云图代码:
with open(“请假.txt”,encoding=‘utf-8’)
as f: job_title_1 = f.read() contents_cut_job_title = jieba.cut(job_title_1)
contents_list_job_title = " “.join(contents_cut_job_title)
wc = WordCloud(stopwords=STOPWORDS.add(“一个”), collocations=False,
background_color=“white”,
font_path=r"K:\苏新诗柳楷简.ttf”,
width=400, height=300, random_state=42,
mask=imread(‘xin.jpg’, pilmode=“RGB”) ) wc.generate(contents_list_job_title)
wc.to_file(“推荐语.png”)
相关推荐
- 每天一个 Python 库:datetime 模块全攻略,时间操作太丝滑!
-
在日常开发中,时间处理是绕不开的一块,比如:生成时间戳比较两个时间差转换为可读格式接口传参/前端展示/日志记录今天我们就用一个案例+代码+思维导图,带你完全搞定datetime模块的用法!...
- 字节跳动!2023全套Python入门笔记合集
-
学完python出来,已经工作3年啦,最近有很多小伙伴问我,学习python有什么用其实能做的有很多可以提高工作效率增强逻辑思维还能做爬虫网站数据分析等等!!最近也是整理了很多适合零基...
- 为什么你觉得Matplotlib用起来困难?因为你还没看过这个思维导图
-
前言Matplotlib是一个流行的Python库,可以很容易地用于创建数据可视化。然而,设置数据、参数、图形和绘图在每次执行新项目时都可能变得非常混乱和繁琐。而且由于应用不同,我们不知道选择哪一个图...
- Python新手必看!30分钟搞懂break/continue(附5个实战案例)
-
一、跳转语句的使命当程序需要提前结束循环或跳过特定迭代时,break和continue就是你的代码急刹按钮和跳步指令。就像在迷宫探险中:break=发现出口立即离开continue=跳过陷阱继续前进二...
- 刘心向学(24)Python中的数据类(python中5种简单的数据类型)
-
分享兴趣,传播快乐,增长见闻,留下美好!亲爱的您,这里是LearningYard新学苑。今天小编为大家带来文章“刘心向学(24)Python中的数据类”欢迎您的访问。Shareinterest,...
- 刘心向学(25)Python中的虚拟环境(python虚拟环境安装和配置)
-
分享兴趣,传播快乐,增长见闻,留下美好!亲爱的您,这里是LearningYard新学苑。今天小编为大家带来文章“刘心向学(25)Python中的虚拟环境”欢迎您的访问。Shareinte...
- 栋察宇宙(八):Python 中的 wordcloud 库学习介绍
-
分享乐趣,传播快乐,增长见识,留下美好。亲爱的您,这里是LearingYard学苑!今天小编为大家带来“Python中的wordcloud库学习介绍”欢迎您的访问!Sharethefun,...
- AI在用|ChatGPT、Claude 3助攻,1分钟GET高颜值思维导图
-
机器之能报道编辑:Cardinal以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人...
- 使用DeepSeek + Python开发AI思维导图应用,非常强!
-
最近基于Deepseek+PythonWeb技术开发了一个AI对话自动生成思维导图的应用,用来展示下如何基于低门槛的Python相关技术栈,高效结合deepseek实现从应用场景到实际应用的快速落地...
- 10幅思维导图告诉你 - Python 核心知识体系
-
首先,按顺序依次展示了以下内容的一系列思维导图:基础知识,数据类型(数字,字符串,列表,元组,字典,集合),条件&循环,文件对象,错误&异常,函数,模块,面向对象编程;接着,结合这些思维导图主要参考的...
- Python基础核心思维导图,让你轻松入门
-
Python基础核心思维导图【高清图文末获取】学习路线图就给大家看到这里了,需要的小伙伴下方获取获取方式看下方图片...
- Python基础核心思维导图,学会事半功倍
-
Python基础核心思维导图【高清图文末获取】学习路线图就给大家看到这里了,需要的小伙伴下方获取获取方式看下方图片...
- 硬核!288页Python核心知识笔记(附思维导图,建议收藏)
-
今天就给大家分享一份288页Python核心知识笔记,相较于部分朋友乱糟糟的笔记,这份笔记更够系统地总结相关知识,巩固Python知识体系。文末获取完整版PDF该笔记学习思维导图:目录内容展示【领取方...
- Python学习知识思维导图(高效学习)
-
Python学习知识思维导图python基础知识python数据类型条件循环列表元组字典集合字符串序列函数面向对象编程模块错误异常文件对象#python##python自学##编程#...
- 别找了!288页Python核心知识笔记(附思维导图,建议收藏)
-
今天就给大家分享一份288页Python核心知识笔记,相较于部分朋友乱糟糟的笔记,这份笔记更够系统地总结相关知识,巩固Python知识体系。文末获取完整版PDF该笔记学习思维导图:目录内容展示【领取方...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- 每天一个 Python 库:datetime 模块全攻略,时间操作太丝滑!
- 字节跳动!2023全套Python入门笔记合集
- 为什么你觉得Matplotlib用起来困难?因为你还没看过这个思维导图
- Python新手必看!30分钟搞懂break/continue(附5个实战案例)
- 刘心向学(24)Python中的数据类(python中5种简单的数据类型)
- 刘心向学(25)Python中的虚拟环境(python虚拟环境安装和配置)
- 栋察宇宙(八):Python 中的 wordcloud 库学习介绍
- AI在用|ChatGPT、Claude 3助攻,1分钟GET高颜值思维导图
- 使用DeepSeek + Python开发AI思维导图应用,非常强!
- 10幅思维导图告诉你 - Python 核心知识体系
- 标签列表
-
- python计时 (54)
- python安装路径 (54)
- python类型转换 (75)
- python进度条 (54)
- python的for循环 (56)
- python串口编程 (60)
- python写入txt (51)
- python读取文件夹下所有文件 (59)
- java调用python脚本 (56)
- python操作mysql数据库 (66)
- python字典增加键值对 (53)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python qt (52)
- python人脸识别 (54)
- python斐波那契数列 (51)
- python多态 (60)
- python命令行参数 (53)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- centos7安装python (53)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)