百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

中年大叔学编程-我用Python保存金山词霸每日一句

off999 2024-12-01 02:18 22 浏览 0 评论

其实金山词霸每日一句已经出来很久了,但是我都不知道,今天去金山词霸的官网看了看,感觉这些句子都挺不错的,所以就想着把它们给存下来。

我大概看了一下他的页面,请求的敏感数据是加密的,页面是基于请求的数据动态渲染的,去解析结构的话,会比较花时间,这里我就使用selenium来简化操作,它可以模拟浏览器,直接把数据渲染成最终的展示出来的页面,然后,直接解析最终的html就可以得到最终的结果。

安装selenium

pip install selenium

因为是这里是用的google浏览器版本 83.0.4103.97(正式版本) (32 位),所以 这里我们需要去http://npm.taobao.org/mirrors/chromedriver下载对应的chromedriver驱动,然后解压到Python的安装目录。 如果不指定自己的安装路径,可以在cmd中执行where python命令来查找

C:\Users\lenovo>where python
D:\Programs\Python\Python38-32\python.exe
C:\Users\lenovo\AppData\Local\Microsoft\WindowsApps\python.exe

把我们下载的chromedriver复制到对应的目录,我这里是D:\Programs\Python\Python38-32\

使用的selenium

那么这里先简单的写几句代码

from selenium import webdriver
browser=webdriver.Chrome()
browser.get('http://news.iciba.com/views/dailysentence/daily.html#!/detail/title/2020-06-05')
print(browser.page_source)

我们运行python demo.py就会看到这样的效果

这里我需要它的图片、英文和汉译,我们来看看它的网页元素结构

它的英文和汉译分别在detail-content-en和detail-content-zh两个class节点中,这里我们需要借助另外一个插件来解析selenium获取到的html,它就是PyQuery,先执行pip install PyQuery 把它安装下来,现在我们来开始获取他的英文内容、汉译内容以及图片地址

from selenium import webdriver
from pyquery import PyQuery as pq
from time import sleep

browser = webdriver.Chrome()
browser.get(
    'http://news.iciba.com/views/dailysentence/daily.html#!/detail/title/2020-06-05')  # 访问页面
sleep(5)  # 等待5秒钟
html = browser.page_source  # 获取页面渲染好的html
page = pq(html)  # 装载到pyquery中
en = page(".detail-content-en")   # 查找英文节点
zh = page(".detail-content-zh")   # 查找中文节点
img = page(".detail-banner-img")  # 查找图片
print(en.text())
print(zh.text())
print(img.attr('src'))
browser.quit()  # 退出浏览器

现在,我们来把每日一句的内容保存下来

from selenium import webdriver
from pyquery import PyQuery as pq
import time
import requests

cur_date = time.strftime("%Y-%m-%d", time.localtime(time.time()))  # 取当前日期
browser = webdriver.Chrome()
browser.get(
    'http://news.iciba.com/views/dailysentence/daily.html#!/detail/title/'+cur_date)  # 访问页面
time.sleep(5)  # 等待5秒钟
html = browser.page_source  # 获取页面渲染好的html
page = pq(html)  # 装载到pyquery中
en = page(".detail-content-en")   # 查找英文节点
zh = page(".detail-content-zh")   # 查找中文节点
img = page(".detail-banner-img")  # 查找图片
with open('D:/ciba/'+cur_date+'.txt', 'wb') as file:  # 将内容写入txt文本
    file.write(en.text().encode())
    file.write("\n".encode())
    file.write(zh.text().encode())

img_url = img.attr('src')
r = requests.get(img_url)
with open('D:/ciba/'+cur_date+'.jpg', 'wb')as f:  # 将图片保存成文件
    f.write(r.content)

browser.quit()  # 退出浏览器

现在,我们执行python demo.py,就可以得到这样的效果

是不是感觉有点意思?

我只是记录我的学习过程,由于书读的少,可能很多地方表述或者是理解得不对,请轻喷并指正。

相关推荐

显示桌面快捷键(怎么设置桌面快捷图标)

电脑上显示桌面的快捷键如下:1,常用。同时按Win徽标键+D键(win键位于Ctrl与Alt之间像个飘起来的田字):按一次显示桌面,再同时按一次返回到窗口。2,同时按Win徽标键+M:原本含义是“...

如何使用u盘拷贝文件(如何使用u盘拷贝文件到电脑)

1、插入u盘,在桌面上或“我的电脑”中能查看u盘信息。2、在电脑中找到需要拷贝的文件,右键点击复制。3、进入u盘界面,在空白处点击右键,选择“粘贴”即可拷贝到u盘。或者,同时打开需要复制的文件窗口和u...

win10官方iso镜像下载地址(win10官方iso镜像怎么安装)

您好,要安装Windows10原装ISO镜像,您可以按照以下步骤进行操作:1.首先,确保您拥有可用的Windows10原装ISO镜像文件。您可以从Microsoft官方网站下载或通过其他合法渠道...

暴风激活工具激活不了(暴风激活工具激活不了office)

本人认为是安全的,原因如下:(1)跟其他激活工具相比,它体积最小!会干闲事的工具,其代码会较多,因此体积一般也较大;(2)能离线激活!在众多工具中,暴风激活工具是离线激活的.若体积小还...

笔记本电脑连接上wifi却不能上网

1、鼠标右键我的电脑(计算机,win8里叫这台电脑),然后再点击管理。2、进入管理列表后,点击服务和应用程序,在点击里面的服务。在服务中找到WLANAutoConfig,把这个服务改为自动,并且点...

安卓商店下载(安卓商店下载安装到手机)

要限制华为iPad上的下载,您可以按照以下步骤进行操作:首先,打开设置菜单,然后选择应用和通知。在应用和通知菜单中,您可以找到已安装的应用程序列表。选择您想要限制下载的应用程序,然后点击它。在应用程序...

电脑软件开机自启动怎么设置

1、首先找到自己华硕笔记本,然后把笔记本翻开,可以看到键盘的这一面,右上角有一个比较大的按钮(不同型号不一样),然后点击一下即可成功开机。2、点击开机按钮之后,可以看到笔记本的桌面出现了一个华硕log...

手机双系统怎么切换(oppo手机双系统怎么切换)

realmeQ3有系统分身功能打开设置,直接到搜索栏搜索系统分身并开启,就可以开启系统分身功能了,设置系统分身时会请用户另外设置一个不同于主系统的密码,锁屏后解锁时输入主系统密码进入主系统,输入分身...

ie10浏览器官网入口(ie8_11浏览器官网)

在Windows10系统中,您可以按照以下步骤找到InternetExplorer(IE)浏览器:1.点击左下角的“开始”按钮。2.在弹出的菜单中,选择“设置”。3.在“系统”选项卡中,...

win10安装版非ghost(u盘安装win10非ghost)

建议不要在DOS环境下进行分区,这样的技术其实已经很久没有更新了,比如盘符显示乱码等等等等。建议进入PE环境进行分区操作,这样在引导错误时能够有专门的工具修复。我在此强力建议不要使用GHOST系统,虽...

win10关闭自动更新方法联想(联想笔记本关闭win10自动更新)

方法一鼠标单击左下角的开始菜单,选择设置;点击更新和安全;在默认界面,点击右侧的高级选项;将更新选项与更新通知下的所有选项关闭即可。方法二鼠标右键单击此电脑,选择管理;进入计算机管理界面,点击展开“服...

改wifi密码的网址(wifi改密码网站)

WiFi官方密码忘记了,用手机修改的话需要有相关的软件账号的登录才行,否则的话是无法登录进去进行密码的修改的,此外如果这个WiFi的话不是个人的WiFi应用,而是一个区域,或者说是平台的WiFi官方...

office2013激活工具免费(office2013激活工具哪个好用)
  • office2013激活工具免费(office2013激活工具哪个好用)
  • office2013激活工具免费(office2013激活工具哪个好用)
  • office2013激活工具免费(office2013激活工具哪个好用)
  • office2013激活工具免费(office2013激活工具哪个好用)
微星主板bios怎么进u盘装系统

一:首先将已经使用U启动软件制作好启动盘的U盘插入电脑主机后面的USB插口处,(注意:请不要用USB延长线来连接U盘,可能会造成无法读取U盘的情况!),然后开机启动计算机,待显示开机画面的时候连续按下...

电脑装机配置推荐(装机配置推荐2021)
  • 电脑装机配置推荐(装机配置推荐2021)
  • 电脑装机配置推荐(装机配置推荐2021)
  • 电脑装机配置推荐(装机配置推荐2021)
  • 电脑装机配置推荐(装机配置推荐2021)

取消回复欢迎 发表评论: