百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

实例Python并发编程(python并发原理)

off999 2024-10-23 12:40 17 浏览 0 评论

我们知道现在硬件飞速发展,多核CPU 成了标配。为了提高程序的效率,一个方面改变程序的顺序执行,用异步方式,防止由于某个耗时步骤,而影响后续程序的执行。另一个方面是采用并发方式执行,重复利用多核CPU优势加速执行。关于并发编程大家可能比较熟悉的是Golang的协程、通道和Node.js 的async.parallel异步并发编程。就并发编程来说,Python不是一门合适的语言,主要是Python有一个解析器(CPython)内置的全局解释锁GIL。 GIL限制Python中一次只能有一个线程访问Python对象,从而我们无法实现多线程分配到多个CPU执行,这是一个极大限制,限制Python并发编程。当然限制归限制,Python标准库中都已经引入了多进程和多线程库,所以Python并发程序相当简单。

本文中,虫虫给大家实例介绍一下Python的并发编程

并发编程

关于python并发编程,我们推荐优雅地创建并发程序三部曲:

首先,编写一个按顺序执行任务的脚本。

其次,脚本中的执行程序(耗时任务)提取为一个执行函数,并使用map函数调用。

最后,使用并发模块中的函数替换map即可。

实例脚本

该实例中,我们用到一个小的图片爬虫,使用urllib从Picsum网站下载20张图片,具体脚本程序如下:

import urllib.request
import time
url = 'https://picsum.photos/id/{}/200/300'
args = [(n, url.format(n)) for n in range(20)]
start = time.time()
for pic_id, url in args:
 res = urllib.request.urlopen(url)
 pic = res.read()
 with open(f'./{pic_id}.jpg', 'wb') as f:
 f.write(pic)
 print(f'图片 {pic_id} 已经保存!')
end = time.time()
msg ='共耗时 {:.3f} 秒下载完成。'
print(msg.format(end-start)

python pic_get.py 运行该脚本,结果如下:

图片 0 已经保存!
图片 1 已经保存!
图片 2 已经保存!
...
共耗时 26.694 秒下载完成。

下载共耗费不到半分钟,接着按照我们优雅的三部曲,改造这个脚本。

使用Map改造脚本

下面脚本中,我们将下载图片的代码打包到一个执行函数get_img中。

import urllib.request
import time
def get_img(pic_id, url):
 res = urllib.request.urlopen(url)
 pic = res.read()
 with open(f'test/{pic_id}.jpg', 'wb') as f:
 f.write(pic)
 print(f'图片 {pic_id} 已经保存!')
def main():
 url = 'https://picsum.photos/id/{}/200/300'
 pic_ids = [i for i in range(20)] ;
 urls=[(url.format(n)) for n in range(20)]
 start = time.time()
 for _ in map(get_img, pic_ids, urls):
 pass
 end = time.time()
 msg = '共耗时{:.3f}秒下载完成。'
 print(msg.format(end-start))
if __name__ == '__main__':
 main()

上述脚本中,用map函数替换先前脚本中的for循环(黑体部分)。map是一个函数式编程语法,该函数会生成一个迭代器,迭代器会执行迭代调用get_img()。关于map()函数熟悉函数式编程人可能会觉得有点奇怪,请自己搜索资料充电,此处,我们用它来充当并发编程网关。

图片 0 已经保存!
图片 1 已经保存!
图片 2 已经保存!
...
图片 19 已经保存!
共耗时26.023秒下载完成。

用map改造后,运行脚本总耗时大体上和脚本一致。

多线程并发处理

Python标准库的current.futures模块包含了大量并发编程的包装函数,详细说明,可参见官方文档,此处我们直接上代码。

将pic_get1.py中的程序做简单改进,就能实现多线程脚本:

首先在脚本开头引入多线程函数:

from concurrent.futures import ThreadPoolExecutor

接着替换

 for _ in map(get_img, pic_ids, urls):
 pass

with ThreadPoolExecutor(max_workers=20) as do:
 do.map(get_img, pic_ids, urls)

即可。执行结果:

图片 0 已经保存!
图片 2 已经保存!
图片 5 已经保存!
...
图片 9 已经保存!
共耗时2.913秒下载完成。

总耗时由26秒,减少到了大约3秒。大概快了8倍。并发执行的效果还是杠杠的。

程序中我们使用with ThreadPoolExecutor语句产生一个执行器do。通过将get_img和相应的参数映射到执行程序,自动生成多线程执行。

大家可能注意到了在多线程脚本执行后,图片下载时候不是以前的0~19的顺序的,而是不同线程并发执行的所以完成提示信息也是乱序的。

多进程处理

多进程的改造也非常简单,我么只需把之前多线程脚本中的ThreadPoolExecutor替换为ProcessPoolExecutor即可。

from concurrent.futures import ProcessPoolExecutor

...

with ProcessPoolExecutor(max_workers=20) as do:
 do.map(get_img, pic_ids, urls)

执行结果:

图片 9 已经保存!
图片 6 已经保存!
...
图片 11 已经保存!
图片 15 已经保存!
共耗时4.606秒下载完成

也非常快了,4秒钟就完成了,但是比多线程的3秒,稍微慢点。为什么多进程要比多线程慢呢?顾名思义,多进程程序会启用多个进程,而多线程会使用线程。Python中一个进程可以运行多个线程。每个进程都有其适当的Python解释器和适当的GIL。相比较而已,启动一个进程是更加耗时,重的操作,所以需要花费的时间更多。

斐波那契数列计算

为了进一步说明Python中线程和进程之间的区别,我们再来举一个大量计算的例子,斐波那契数列的计算。

根据斐波那契数列的定义我们用递归方法编写实现其计算:

def fib(n):
 if n == 1:
 return 0
 elif n == 2:
 return 1
 else:
 return fib(n-1) + fib(n-2)

在不使用numpy的情况下用普通Python计算比较慢:

def main():
 fib_range = list(range(1, 35))
 times = []
 for run in range(10):
 start = time.time()
 for n in fib_range:
 fib(n)
 end = time.time()
 times.append(end-start)
 print('波那契数列fib(35)计算平均耗时 {:.3f}。'.format(np.mean(times))

结果:

波那契数列fib(35)计算平均耗时 5.200

下面我们试着用并发计算来加速计算。

让我们通过线程加速它!为此,我用受信任的ThreadPoolExecutor替换for循环,如下所示:

with ProcessPoolExecutor() as do:
 do.map(fib, fib_range)

执行结果:

波那契数列fib(35)计算平均耗时 5.239。

什么?加速后,反而慢,好像多线程没起到作用。这就是GIL的因素导致的,尽管使用了多个线程,生成了一堆线程,但是这些线程都在同一进程中运行并共享一个GIL。所以斐波那契序列尽管是并发计算的,这些线程在只能在一个CPU上循序执行。

进程可以分布在不同的CPU核心,而在同一进程上运行的线程则不能。使CPU消耗最大的操作为CPU绑定操作。为了加快CPU限制的操作,应该启动多个进程计算。我们用ProcessPoolExecutor替换ThreadPoolExecutor再试试:

波那契数列fib(35)计算平均耗时 3.591

性能提高了一点。

除了并发的方式外,我们可以用算法优化方法来提高性能,在数值计算中,这是一种更有效的方法,比如,我们改造fib函数:

def fib(n):
 a, b, i = 0, 1, 1
 while i < n:
 a, b = b, a + b
 i += 1
 return b

上述方法中,巧妙用内存存中的变量历史迭代的前两次结果都存在内存中,所以该次计算中无需回溯迭代计算,这样计算效率O(1),基本上可以秒出结果。

使用新算法后的执行结果:

波那契数列fib(35)计算平均耗时 0.000。

总结

本文我们实例介绍了Python中的并发编程,关于并发编程由于标准库中给我们打包好了方便使用的并发函数使得其使用非常方便。需要注意的是Python中的并发不管是多线程在IO操作中是有效的,而在其他方面,如数值结算时候就受GIL限制无用了。关于并发计算和GIL有心的话,可以参考有关文档进一步深入学习了解。

相关推荐

python gui编程框架推荐以及介绍(python gui开发)

Python的GUI编程框架有很多,这里为您推荐几个常用且功能强大的框架:Tkinter:Tkinter是Python的标准GUI库,它是Python内置的模块,无需额外安装。它使用简单,功能较为基础...

python自动化框架学习-pyautogui(python接口自动化框架)

一、适用平台:PC(windows和mac均可用)二、下载安装:推荐使用命令行下载(因为会自动安装依赖库):pipinstallPyAutoGUI1该框架的依赖库还是蛮多的,第一次用的同学耐心等...

Python 失宠!Hugging Face 用 Rust 新写了一个 ML框架,现已低调开源

大数据文摘受权转载自AI前线整理|褚杏娟近期,HuggingFace低调开源了一个重磅ML框架:Candle。Candle一改机器学习惯用Python的做法,而是Rust编写,重...

Flask轻量级框架 web开发原来可以这么可爱呀~(建议收藏)

Flask轻量级框架web开发原来可以这么可爱呀大家好呀~今天让我们一起来学习一个超级可爱又实用的PythonWeb框架——Flask!作为一个轻量级的Web框架,Flask就像是一个小巧精致的工...

Python3使用diagrams生成架构图(python架构设计)

目录技术背景diagrams的安装基础逻辑关系图组件簇的定义总结概要参考链接技术背景对于一个架构师或者任何一个软件工程师而言,绘制架构图都是一个比较值得学习的技能。这就像我们学习的时候整理的一些Xmi...

几个高性能Python网络框架,高效实现网络应用

Python作为一种广泛使用的编程语言,其简洁易读的语法和强大的生态系统,使得它在Web开发领域占据重要位置。高性能的网络框架是构建高效网络应用的关键因素之一。本文将介绍几个高性能的Python网络框...

Web开发人员的十佳Python框架(python最好的web框架)

Python是一种面向对象、解释型计算机程序设计语言。除了语言本身的设计目的之外,Python的标准库也是值得大家称赞的,同时Python还自带服务器。其它方面,Python拥有足够多的免费数据函数库...

Diagram as Code:用python代码生成架构图

工作中常需要画系统架构图,通常的方法是通过visio、processon、draw.io之类的软件,但是今天介绍的这个软件Diagrams,可以通过写Python代码完成架构图绘制,确实很co...

分享一个2022年火遍全网的Python框架

作者:俊欣来源:关于数据分析与可视化最近Python圈子当中出来一个非常火爆的框架PyScript,该框架可以在浏览器中运行Python程序,只需要在HTML程序中添加一些Python代码即可实现。该...

10个用于Web开发的最好 Python 框架

Python是一门动态、面向对象语言。其最初就是作为一门面向对象语言设计的,并且在后期又加入了一些更高级的特性。除了语言本身的设计目的之外,Python标准库也是值得大家称赞的,Python甚至还...

使用 Python 将 Google 表格变成您自己的数据库

图片来自Shutterstock,获得FrankAndrade的许可您知道Google表格可以用作轻量级数据库吗?GoogleSheets是一个基于云的电子表格应用程序,可以像大多数数据库管...

牛掰!用Python处理Excel的14个常用操作总结!

自从学了Python后就逼迫用Python来处理Excel,所有操作用Python实现。目的是巩固Python,与增强数据处理能力。这也是我写这篇文章的初衷。废话不说了,直接进入正题。数据是网上找到的...

将python打包成exe的方式(将python文件打包成exe可运行文件)

客户端应用程序往往需要运行Python脚本,这对于那些不熟悉Python语言的用户来说可能会带来一定的困扰。幸运的是,Python拥有一些第三方模块,可以将这些脚本转换成可执行的.exe...

对比Excel学Python第1练:既有Excel,何用Python?

背景之前发的文章开头都是“Python数据分析……”,使得很多伙伴以为我是专门分享Python的,但我的本意并非如此,我的重点还是会放到“数据分析”上,毕竟,Python只是一种工具而已。现在网上可以...

高效办公:Python处理excel文件,摆脱无效办公

一、Python处理excel文件1.两个头文件importxlrdimportxlwt其中xlrd模块实现对excel文件内容读取,xlwt模块实现对excel文件的写入。2.读取exce...

取消回复欢迎 发表评论: