百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python用request库读取网页源码(含py文件内容)

off999 2024-10-23 12:45 26 浏览 0 评论

本代码操作前提安装了Python38版本以及request库,并且将下面的代码复制保存为网页测试.py运行即可(为保证代码编写规范,建议用sublime text 3进行操作)。

操作及运行如图:







代码部分:

import requests #导入request库

import re #导入re库

#下面三行是编码转换的功能

import sys #导入sys库

#reload(sys)

#sys.setdefaultencoding("utf-8")

import importlib #导入importlib库

importlib.reload(sys)

#Python解决NameError: name 'reload' is not defined的问题

#遇到这个问题,对于 Python 2.X:

#1 import sys

#2 reload(sys)

#3 sys.setdefaultencoding("utf-8")

#对于 Python 3.3及其以下版本:

#1 import imp

#2 imp.reload(sys)

#需要注意:

#1. Python 3 与 Python 2 有很大的区别,其中Python 3 系统默认使用的就是utf-8编码。

#2. 所以,对于使用的是Python 3 的情况,就不需要sys.setdefaultencoding("utf-8")这段代码。

#3. 最重要的是,Python 3 的 sys 库里面已经没有 setdefaultencoding() 函数了。

#对于 Python 3.4及其以上版本:

#1 import importlib

#2 importlib.reload(sys)

url= str(input("请输入:")) #提示用户输入信息,并强制类型转换为字符串型

#hea是我们自己构造的一个字典,里面保存了user-agent。

#让目标网站误以为本程序是浏览器,并非爬虫。

#从网站的Requests Header中获取。【审查元素】

hea = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.118 Safari/537.36'}

html = requests.get(url,headers = hea)

html.encoding = 'utf-8' #这一行是将编码转为utf-8否则中文会显示乱码。

print(html) #如果返回<Response [200]>是HTTP状态码,表示网络请求成功的意思,返回这个状态表示已经获取到数据了。【200】请求成功【303】重定向【400】请求错误【401】未授权【403】禁止访问【404】文件未找到【500】服务器错误

print(html.text) #显示已经获取到的网页源码

相关推荐

电脑桌面此电脑没了怎么恢复

1.在桌面上单击鼠标右键。将光标移到查看选项上。2.此时在右边找到显示桌面图标选项。此时在右边找到显示桌面图标选项。3.此时即可发现桌面的图标回来了。电脑桌面什么都没有了,可以建议找到设置,尝试恢复电...

台式电脑怎么重置系统(台式电脑怎么重新设置)

1、Win10系统启动到LOGO界面后,强制重启,反复3次左右,至到显示疑难解答,我们点击疑难解答进入;2.选重置此点电脑;3.接下来这里,我选择的删除所有内容。这里是准备要格式化系统分区C盘,如果想...

电脑与打印机连的最简单步骤
  • 电脑与打印机连的最简单步骤
  • 电脑与打印机连的最简单步骤
  • 电脑与打印机连的最简单步骤
  • 电脑与打印机连的最简单步骤
如何登录hotmail邮箱(国内怎么登陆hotmail)
  • 如何登录hotmail邮箱(国内怎么登陆hotmail)
  • 如何登录hotmail邮箱(国内怎么登陆hotmail)
  • 如何登录hotmail邮箱(国内怎么登陆hotmail)
  • 如何登录hotmail邮箱(国内怎么登陆hotmail)
电脑公司模拟器破解版下载(电脑公司模拟器1.0.8)

直接先将xci程序复制到switch存储卡根目录,而后通过主机自带的安装程序直接安装

xp系统永久激活密钥2020年(xp系统激活秘钥)

windowsxp产品密钥大全YBVJB-YV2JW-7FHPT-6D8XG-RT83GHRXTR-FKTCV-X8QCH-D7PTH-KYYPBJF8MD-XB4Y4-HHB28-Q3G2K-QW...

手写中文输入法下载安装(中文手写输入器)

1、首先第一步就是打开手机主界面,然后依次打开“设置”、“通用”、“键盘”,2、跳转的页面再点击“键盘”,3、勾选自己喜欢的中文手写模式,最后点击设定即可。仅参考先打开手机设置,然后点击一个语言和输入...

office2007的产品密钥(office 产品密钥)

下载一个kms软件关闭杀毒软件大概三十秒就会完成相应的注册然后就可以正常的使用了

十大杀毒app排行(知名杀毒软件)

360安全卫士今天就为您推荐杀毒软件排行榜第一的免费软件——360安全卫士,首创即扫即清功能,操作流程更简单,而且在用户使用过程当中还能有效拦截病毒的侵入,提供强力守护。状元:BitDefender ...

制作u盘系统安装盘win7(u盘制作win7操作系统)
  • 制作u盘系统安装盘win7(u盘制作win7操作系统)
  • 制作u盘系统安装盘win7(u盘制作win7操作系统)
  • 制作u盘系统安装盘win7(u盘制作win7操作系统)
  • 制作u盘系统安装盘win7(u盘制作win7操作系统)
笔记本怎么关闭防火墙(笔记本怎么关掉防火墙)

Win10教育版关闭防火墙设置方法  步骤1、在Win10桌面这台电脑图标上右键,然后选择“属性”。  步骤2、进入这台电脑属性之后,再点击左上角的“控制面板主页”。  步骤3、进入Win10控制面板...

32g内存还需要虚拟内存吗(32g内存还需要虚拟内存吗 知乎)

还需要的。虚拟内存是一定要的。就算你32G内存也是需要一个虚拟的转换空间。这个可以自己手动设置7000M左右就可以了,不用设置太大,没有用。虚拟内存是一定要的。就算你32G内存也是需要一个虚拟的...

5年前删qq好友恢复(几年前qq好友删除怎么恢复好友)
  • 5年前删qq好友恢复(几年前qq好友删除怎么恢复好友)
  • 5年前删qq好友恢复(几年前qq好友删除怎么恢复好友)
  • 5年前删qq好友恢复(几年前qq好友删除怎么恢复好友)
  • 5年前删qq好友恢复(几年前qq好友删除怎么恢复好友)
腾达路由器安装方法(腾达路由器安装方法和详细步骤)
  • 腾达路由器安装方法(腾达路由器安装方法和详细步骤)
  • 腾达路由器安装方法(腾达路由器安装方法和详细步骤)
  • 腾达路由器安装方法(腾达路由器安装方法和详细步骤)
  • 腾达路由器安装方法(腾达路由器安装方法和详细步骤)
windows补丁怎么更新(windows 补丁更新)

windowsserver系统补丁升级的方法,1.打开WindowsServer系统运行对话框;2.在对话框中输入“control”;3.系统控制面板窗口自动打开;4.点击“Systemand...

取消回复欢迎 发表评论: