百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python 中常见下载文件方法九个方面知识

off999 2024-09-16 00:43 73 浏览 0 评论

在 Python 中,我们常常需要下载文件,例如爬虫下载页面中的图片、下载页面的链接pdf文件或者word文档、音频和视频;下载远程服务器上的资源,如压缩文件、视频、grib2等等。那么我们可以通过哪些方法来实现文件的下载呢?

需要说明的是:本例子使用下载网址为:http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3,是一首MP3的歌曲,4M的大小。粉丝可以在评论区讨论。

第一、使用requests

Requests 是 Python 中非常常用的第三方库,是一个非常强大、简单易用的 HTTP 请求库。

我们直接采用requests.get 获得文件的内容,然后二进制的方法保存文件内容。url:下载的文件名;localfile:保存的本地文件名。timeout:单位秒,如果文件比较大,可以适当的延长时间。如果文件比较大,需要下载比较长的时间,这个方法就不太适合了。示例代码如下:

import requests
url =  'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'
localfile = './233599851.mp3'
#url:下载的文件名;localfile:保存的本地文件名。timeout:单位秒
r = requests.get(url,timeout=300)
with open(localfile, "wb") as fp:
    fp.write(r.content)

第二、使用urllib

urllib库是Python的标准库,因此不需要安装它。 urllib 库是一个非常方便的下载工具,提供了简单易用的下载接口。调用 urllib 库的 urlretrieve() 方法下载文件。示例代码如下:

import urllib.request
url =  'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'
localfile = './233599851.mp3'
urllib.request.urlretrieve(url, localfile)  

第三、使用urllib2

urllib2库是urllib库的增强版,提供了更多的功能和更好的错误处理。需要说明的是:urllib2 是 Python2.7 自带的模块(不需要下载,导入即可使用),在 python3 中,urllib2 被改为urllib.request。为了教程的完整性,还是在这里介绍一下。示例代码如下:

import urllib2 
url =  'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'
localfile = './233599851.mp3'
data = urllib2.urlopen(url).read()
with open(localfile, 'wb') as video:
    video.write(data)

第四、使用urllib3

urllib3是urllib模块的改进版本,是一个轻量级的python库,提供了线程安全,HTTP连接池和重用,文件发送等。我们将通过使用urllib3来获取一个链接并将它存储在一个文件中。示例代码如下:

import urllib3 
url =  'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'
localfile = './233599851.mp3'
#创建一个HTTP连接池
http = urllib3.PoolManager()
r = http.request('GET',url)
print(r.data)
with open(localfile, 'wb') as mp3:
    mp3.write(r.data)
    
r.release_conn() #最后释放这个HTTP连接

第五、使用wget

wget是一个从网络上自动下载文件的自由工具,跨平台软件。它支持HTTP,HTTPS和FTP协议,可以使用HTTP代理。这里使用Python的wget模块从一个URL下载文件。wget.download直接从地址url下载到本地localfile。需要使用pip命令安装后才能使用。

pip install wget

示例代码如下:

import wget
url =  'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'
localfile = './233599851.mp3'
wget.download(url,localfile)

除了使用 Python 编程语言,我们还可以使用命令行工具 wget 来下载文件。

下面是一个示例代码:

import os
url =  'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'
localfile = './233599851.mp3'
os.system(f'wget -O {localfile} {url}')

第六、下载重定向的文件

有时我们下载一个链接文件,但是远端的服务器将URL会被重定向到另一个的源URL。遇到这种情况,使用requests.get可以轻松解决。get方法中,我们将allow_redirects设置为True,这将允许URL中的重定向,获得重定向后的内容后,然后二进制的方法保存文件内容。示例代码如下:

url =  'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'
localfile = './233599851.mp3'
r = requests.get(url,timeout=300, allow_redirects=True)
with open(localfile, "wb") as fp:
    fp.write(r.content)

下面介绍大文件的下载方法。

大文件的下载,需要使用文件流进行下载,它是一种更高效、更安全的方式。使用文件流进行下载的原理,就是将文件一块一块地按顺序从网络上读取,每读取一块就立即写入本地文件。这样的方法既可以保证安全可靠地下载大文件,又可以避免因内存不足而导致的程序崩溃。

第七、使用requests库中的get方法,下载大文件

使用requests库中的get方法,并将stream参数设置为True即可。

示例代码如下:

url =  'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'
localfile = './233599851.mp3'
r = requests.get(url,  stream=True)
fp = open(localfile,  "wb")    
for chunk in r.iter_content(chunk_size=1024):
    if chunk:
        fp.write(chunk)
        fp.flush()

第八、使用urllib2,下载大文件

需要说明的是,urllib2是Python2.7 自带的模块,示例代码只能在Python2.7运行。作为知识了解一下。示例代码如下:

url =  'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'
localfile = './233599851.mp3'
r = urllib2.Request(url)
u = urllib2.urlopen(r)
with open('localfile, 'wb') as f:
    while True:
          tmp = u.read(1024)
          if not tmp:
                break
          f.write(tmp)

第九、使用urllib3,下载大文件

既然使用urllib2库可以下载文件,当然使用urllib3库也能办到。利用http连接池的request方法,并将preload_content参数设置为False即可。示例代码如下:

import urllib3 
url =  'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'
localfile = './233599851.mp3'

#创建一个HTTP连接池
http = urllib3.PoolManager()

r = http.request('GET', url, preload_content=False)
chunk_size = 1024
with open(localfile, 'wb') as out:
    while True:
        data = r.read(chunk_size)
        if not data:
            break
        out.write(data)
r.release_conn() #最后释放这个HTTP连接

总结

通过介绍常见下载文件方法九个方面知识,我们可以轻松地实现 Python 下载文件的功能,同时也阐述了大文件下载的处理方法。当然,下载文件应该还有其他的方法,这里就不一一介绍。其中,使用 Requests 库是最为常用的方法,因为它提供了很多强大而灵活的功能,非常方便编写复杂的下载程序,这个也是我在项目中常用的方法。wget库下载功能强大,也是一个非常好的方法。

相关推荐

下载淘宝购物网(淘宝购物下载和安装最新版)

  捷易淘宝小号购买平台助手是一款专业的淘宝小号出售平台助手,软件全自动智能搜索你需要的淘宝小号,最安全的淘宝在线交易平台。  专业多线程快速查询你需要的淘宝小号  支持多种小号,如。淘宝邮箱小号,手...

免费在线影视观看网站(在线观看影视剧网址)

有蛮多的,茶杯狐影视,555影视,首播影院都是可以看电影的免费网址,里面有很多最新更新的电影,综艺,电视剧,动漫,可以收藏起来目前有许多观看最新电影的网站可供选择。其中一些知名的网站包括Netflix...

4399造梦西游3(4399造梦西游3账号)

在4399造梦西游三中,要进入下界需要完成一定的任务。首先,需要完成主线任务“寻找下界之门”,该任务需要完成一系列的支线任务,包括“寻找下界之钥”、“寻找下界之路”等。完成这些任务后,就可以进入下界了...

原来的琪琪电影在线看(原来琪琪电影在线看免费)

186x2=372原来多372张

python编程软件(python编程软件怎么读)

学点编程是一款手机编程应用,这款软件界面漂亮,功能强大,支持多种语言,内容丰富,编程的程序员们可千万不要错过啦!应用包含一张涵盖了所有HTML5元素释义的列表,并能查看元素在内置浏览器中实现的样式...

google play apk(Google play apk English)

googleplay是一款谷歌开发的、用于帮助用户加快游戏软件运转速度的软件。该软件可以快速与谷歌游戏中心连接,从而加快游戏同步数据的传输。  如果用户不需要使用该软件了,则可以尝试直接使用卸载功能卸...

单人枪战单机游戏(单人枪战闯关游戏)

有胡闹厨房,NBA2K,Knack纳克,光环战斗进化,杀手5赦免。钓鱼星球。神鬼寓言,战争机器,精灵与森林,盗贼之海,丧尸围城枪火重生,这是融合了第一人称射击、Roguelite随机元素和RPG策略...

三国战纪街机版下载(三国战纪街机版下载教程)

三国战纪单机手机版非常容易上手,可以通过以下步骤进行玩耍:容易上手。游戏的操作非常简单,只需要用手指点击屏幕即可完成。游戏同时提供了简单、普通、困难等多个难度设置,能够满足不同玩家的需求。在游戏中,玩...

永久免费的网盘哪个好用(百度网盘登录入口)

现在的网盘很多都是免费的哦,而且也很安全,我自己就在用天翼云网盘。天翼云虽然刚登陆是15G,但是现在登陆客户端就有10T的容量了,可以存很多东西了。天翼云网盘还有个挺好的功能叫做私密空间,每次登陆都要...

热血传奇官方正版下载(热血传奇官网下载安装)

1.可以通过官方网站或者应用商店下载热血传奇。2.热血传奇作为一款热门的网络游戏,开发商通常会提供官方网站或者在应用商店上架,方便玩家下载和安装。3.此外,还可以通过一些第三方游戏平台或者论坛等...

经典老歌500首铃声(免费设为铃声的歌曲)

许慧欣七月七日晴黄格选春水流任贤齐沧海一声笑杨培安我相信邓丽君路边的野花不要采乌兰托娅套马杆索朗扎西姑娘我爱你刀郎情人西域刀郎寻找玛依拉林依轮透过开满鲜花的月亮...

网页黄冈大推广(黄冈宣传)

意思是职称通过了最终审核,已被批准,也就意味着职称稳了,可以享受其相应的待遇了。职称,指教授,讲师,中级,高级等专业技术等级。终审,指最终审核。通过,指批准了。职称终审通过多指工作在技术,学术行业领城...

可以插二次元角色的游戏ios(二次元插图软件)

决战平安京,和光影对决,就是二次元moba游戏其中决战平安京的画质什么的,个人感觉更好~推荐“影视大全-人人美剧视频影视大全苹果版App”。这是一款资源最全的影视苹果端追剧应用,汇聚全网电影、电视剧、...

手机字体上面带拼音(手机字体上面带拼音怎么取消)
手机字体上面带拼音(手机字体上面带拼音怎么取消)

通过修改手机中的字体来设置的,方法如下(以华为mate8手机为例):1、首先,在华为手机上找到系统自带的主题的应用软件,并点击打开它。2、然后,在打开的主题界面点击底部的字体的标签栏目。3、接着,在字体的界面上方的搜索框中输入“拼音”,并进...

2026-02-03 22:51 off999

国内国外精品影视网站(国外影视网站排行)

影视大全强烈推荐的视频app影视大全。是一款作品非常多,大多数都是免费,无广告,无弹窗。它上面也实时更新一些影视作品。有一些在其他影视app中搜索不到,或者收费的作品,在他上面,都是免费的。同时呢,这...

取消回复欢迎 发表评论: