这些方法,能够让你的Python程序快如闪电
off999 2024-09-27 13:51 67 浏览 0 评论
选自towardsdatascience
作者:Martin Heinz机器之心编译
参与:郭元晨、魔王
本文将介绍如何提升 Python 程序的效率,让它们运行飞快!
讨厌 Python 的人总是会说,他们不想用 Python 的一个重要原因是 Python 很慢。而事实上,无论使用什么编程语言,特定程序的运行速度很大程度上取决于编写程序的开发人员以及他们优化程序、加快程序运行速度的技能。
那么,让我们证明那些人错了!本文将介绍如何提升 Python 程序的效率,让它们运行飞快!
计时与性能分析
在开始优化之前,我们首先需要找到代码的哪一部分真正拖慢了整个程序。有时程序性能的瓶颈显而易见,但当你不知道瓶颈在何处时,这里有一些帮助找到性能瓶颈的办法:
注:下列程序用作演示目的,该程序计算 e 的 X 次方(摘自 Python 文档):
#?slow_program.py
from?decimal?import?*
def?exp(x):
????getcontext().prec?+=?2
????i,?lasts,?s,?fact,?num?=?0,?0,?1,?1,?1
????while?s?!=?lasts:
????????lasts?=?s
????????i?+=?1
????????fact?*=?i
????????num?*=?x
????????s?+=?num?/?fact
????getcontext().prec?-=?2
????return?+s
exp(Decimal(150))
exp(Decimal(400))
exp(Decimal(3000))
最懒惰的「性能分析」
首先,最简单但说实话也很懒的方法——使用 Unix 的 time 命令:
~?$?time?python3.8?slow_program.py
real????0m11,058s
user????0m11,050s
sys?????0m0,008s
如果你只想给整个程序计时,这个命令即可完成目的,但通常是不够的……
最细致的性能分析
另一个极端是 cProfile,它提供了「太多」的信息:
~?$?python3.8?-m?cProfile?-s?time?slow_program.py
?????????1297?function?calls?(1272?primitive?calls)?in?11.081?seconds
???Ordered?by:?internal?time
???ncalls??tottime??percall??cumtime??percall?filename:lineno(function)
????????3???11.079????3.693???11.079????3.693?slow_program.py:4(exp)
????????1????0.000????0.000????0.002????0.002?{built-in?method?_imp.create_dynamic}
??????4/1????0.000????0.000???11.081???11.081?{built-in?method?builtins.exec}
????????6????0.000????0.000????0.000????0.000?{built-in?method?__new__?of?type?object?at?0x9d12c0}
????????6????0.000????0.000????0.000????0.000?abc.py:132(__new__)
???????23????0.000????0.000????0.000????0.000?_weakrefset.py:36(__init__)
??????245????0.000????0.000????0.000????0.000?{built-in?method?builtins.getattr}
????????2????0.000????0.000????0.000????0.000?{built-in?method?marshal.loads}
???????10????0.000????0.000????0.000????0.000?<frozen?importlib._bootstrap_external>:1233(find_spec)
??????8/4????0.000????0.000????0.000????0.000?abc.py:196(__subclasscheck__)
???????15????0.000????0.000????0.000????0.000?{built-in?method?posix.stat}
????????6????0.000????0.000????0.000????0.000?{built-in?method?builtins.__build_class__}
????????1????0.000????0.000????0.000????0.000?__init__.py:357(namedtuple)
???????48????0.000????0.000????0.000????0.000?<frozen?importlib._bootstrap_external>:57(_path_join)
???????48????0.000????0.000????0.000????0.000?<frozen?importlib._bootstrap_external>:59(<listcomp>)
????????1????0.000????0.000???11.081???11.081?slow_program.py:1(<module>)
...
这里,我们结合 cProfile 模块和 time 参数运行测试脚本,使输出行按照内部时间(cumtime)排序。这给我们提供了大量信息,上面你看到的行只是实际输出的 10%。从输出结果我们可以看到 exp 函数是罪魁祸首(惊不惊喜,意不意外),现在我们可以更加专注于计时和性能分析了……
计时专用函数
现在我们知道了需要关注哪里,那么我们可能只想要给运行缓慢的函数计时而不去管代码的其他部分。我们可以使用一个简单的装饰器来做到这点:
def?timeit_wrapper(func):
????@wraps(func)
????def?wrapper(*args,?**kwargs):
????????start?=?time.perf_counter()??#?Alternatively,?you?can?use?time.process_time()
????????func_return_val?=?func(*args,?**kwargs)
????????end?=?time.perf_counter()
????????print('{0:<10}.{1:<8}?:?{2:<8}'.format(func.__module__,?func.__name__,?end?-?start))
????????return?func_return_val
????return?wrapper
接着,将该装饰器按如下方式应用在待测函数上:
@timeit_wrapper
def?exp(x):
????...
print('{0:<10}?{1:<8}?{2:^8}'.format('module',?'function',?'time'))
exp(Decimal(150))
exp(Decimal(400))
exp(Decimal(3000))
得到如下输出:
~?$?python3.8?slow_program.py
module?????function???time??
__main__??.exp??????:?0.003267502994276583
__main__??.exp??????:?0.038535295985639095
__main__??.exp??????:?11.728486061969306
此时我们需要考虑想要测量哪一类时间。time 库提供了 time.perf_counter 和 time.process_time 两种时间。其区别在于,perf_counter 返回绝对值,其中包括了 Python 程序并不在运行的时间,因此它可能受到机器负载的影响。而 process_time 只返回用户时间(除去了系统时间),也就是只有进程运行时间。
让程序更快
现在到了真正有趣的部分了,让 Python 程序跑得更快!我不会告诉你一些奇技淫巧或代码段来神奇地解决程序的性能问题,而更多是关于通用的想法和策略。使用这些策略,可以对程序性能产生巨大的影响,有时甚至可以带来高达 30% 的提速。
使用内置的数据类型
这一点非常明显。内置的数据类型非常快,尤其相比于树或链表等自定义类型而言。这主要是因为内置数据类型使用 C 语言实现,使用 Python 实现的代码在运行速度上和它们没法比。
使用 lru_cache 实现缓存/记忆
我在之前的博客中介绍过这一技巧,但我认为它值得用一个简单例子再次进行说明:
import?functools
import?time
#?caching?up?to?12?different?results
@functools.lru_cache(maxsize=12)
def?slow_func(x):
????time.sleep(2)??#?Simulate?long?computation
????return?x
slow_func(1)??#?...?waiting?for?2?sec?before?getting?result
slow_func(1)??#?already?cached?-?result?returned?instantaneously!
slow_func(3)??#?...?waiting?for?2?sec?before?getting?result
上面的函数使用 time.sleep 模拟了繁重的计算过程。当我们第一次使用参数 1 调用函数时,它等待了 2 秒钟后返回了结果。当再次调用时,结果已经被缓存起来,所以它跳过了函数体,直接返回结果。
使用局部变量
这和每个作用域中变量的查找速度有关。我之所以说「每个作用域」,是因为这不仅仅关乎局部变量或全局变量。事实上,就连函数中的局部变量、类级别的属性和全局导入函数这三者的查找速度都会有区别。函数中的局部变量最快,类级别属性(如 self.name)慢一些,全局导入函数(如 time.time)最慢。
你可以通过这种看似没有必要的代码组织方式来提高效率:
#??Example?#1
class?FastClass:
????def?do_stuff(self):
????????temp?=?self.value??#?this?speeds?up?lookup?in?loop
????????for?i?in?range(10000):
????????????...??#?Do?something?with?`temp`?here
#??Example?#2
import?random
def?fast_function():
????r?=?random.random
????for?i?in?range(10000):
????????print(r())??#?calling?`r()`?here,?is?faster?than?global?random.random()
使用函数
这也许有些反直觉,因为调用函数会让更多的东西入栈,进而在函数返回时为程序带来负担,但这其实和之前的策略相关。如果你只是把所有代码扔进一个文件而没有把它们放进函数,那么它会因为众多的全局变量而变慢。因此,你可以通过将所有代码封装在 main 函数中并调用它来实现加速,如下所示:
def?main():
????...??#?All?your?previously?global?code
main()
不要访问属性
另一个可能让程序变慢的东西是用来访问对象属性的点运算符(.)。这个运算符会引起程序使用__getattribute__进行字典查找,进而为程序带来不必要的开销。那么,我们怎么避免(或者限制)使用它呢?
#??Slow:
import?re
def?slow_func():
????for?i?in?range(10000):
????????re.findall(regex,?line)??#?Slow!
#??Fast:
from?re?import?findall
def?fast_func():
????for?i?in?range(10000):
????????findall(regex,?line)??#?Faster!
当心字符串
当在循环中使用取模运算符(%s)或 .format() 时,字符串操作会变得很慢。有没有更好的选择呢?根据 Raymond Hettinger 近期发布的推文,我们只需要使用 f-string 即可,它可读性更强,代码更加紧凑,并且速度更快!基于这一观点,如下从快到慢列出了你可以使用的一系列方法:
f'{s}?{t}'??#?Fast!
s?+?'??'?+?t?
'?'.join((s,?t))
'%s?%s'?%?(s,?t)?
'{}?{}'.format(s,?t)
Template('$s?$t').substitute(s=s,?t=t)??#?Slow!
生成器本质上并不会更快,因为它们的目的是惰性计算,以节省内存而非节省时间。然而,节省的内存会让程序运行更快。为什么呢?如果你有一个大型数据集,并且你没有使用生成器(迭代器),那么数据可能造成 CPU 的 L1 缓存溢出,进而导致访存速度显著变慢。
当涉及到效率时,非常重要的一点是 CPU 会将它正在处理的数据保存得离自己越近越好,也就是保存在缓存中。读者可以看一看 Raymond Hettingers 的演讲(https://www.youtube.com/watch?v=OSGv2VnC0go&t=8m17s),其中提到了这些问题。
总结
优化的第一要义就是「不要去做」。但如果你必须要做,我希望这些小技巧可以帮助到你。然而,优化代码时一定要谨慎,因为该操作可能最终造成代码可读性变差、可维护性变差,这些弊端可能超过代码优化所带来的好处。
参考链接:https://towardsdatascience.com/making-python-programs-blazingly-fast-c1cd79bd1b32
相关推荐
- 安全教育登录入口平台(安全教育登录入口平台官网)
-
122交通安全教育怎么登录:122交通网的注册方法是首先登录网址http://www.122.cn/,接着打开网页后,点击右上角的“个人登录”;其次进入邮箱注册,然后进入到注册页面,输入相关信息即可完...
- 大鱼吃小鱼经典版(大鱼吃小鱼经典版(经典版)官方版)
-
大鱼吃小鱼小鱼吃虾是于谦跟郭麒麟的《我的棒儿呢?》郭德纲说于思洋郭麒麟作诗的相声,最后郭麒麟做了一首,师傅躺在师母身上大鱼吃小鱼小鱼吃虾虾吃水水落石出师傅压师娘师娘压床床压地地动山摇。...
-
- 哪个软件可以免费pdf转ppt(免费的pdf转ppt软件哪个好)
-
要想将ppt免费转换为pdf的话,我们建议大家可以下一个那个wps,如果你是会员的话,可以注册为会员,这样的话,在wps里面的话,就可以免费将ppt呢转换为pdfpdf之后呢,我们就可以直接使用,不需要去直接不需要去另外保存,为什么格式转...
-
2026-02-04 09:03 off999
- 电信宽带测速官网入口(电信宽带测速官网入口app)
-
这个网站看看http://www.swok.cn/pcindex.jsp1.登录中国电信网上营业厅,宽带光纤,贴心服务,宽带测速2.下载第三方软件,如360等。进行在线测速进行宽带测速时,尽...
- 植物大战僵尸95版手机下载(植物大战僵尸95 版下载)
-
1可以在应用商店或者游戏平台上下载植物大战僵尸95版手机游戏。2下载教程:打开应用商店或者游戏平台,搜索“植物大战僵尸95版”,找到游戏后点击下载按钮,等待下载完成即可安装并开始游戏。3注意:确...
- 免费下载ppt成品的网站(ppt成品免费下载的网站有哪些)
-
1、Chuangkit(chuangkit.com)直达地址:chuangkit.com2、Woodo幻灯片(woodo.cn)直达链接:woodo.cn3、OfficePlus(officeplu...
- 2025世界杯赛程表(2025世界杯在哪个国家)
-
2022年卡塔尔世界杯赛程公布,全部比赛在卡塔尔境内8座球场举行,2022年,决赛阶段球队全部确定。揭幕战于当地时间11月20日19时进行,由东道主卡塔尔对阵厄瓜多尔,决赛于当地时间12月18日...
- 下载搜狐视频电视剧(搜狐电视剧下载安装)
-
搜狐视频APP下载好的视频想要导出到手机相册里方法如下1、打开手机搜狐视频软件,进入搜狐视频后我们点击右上角的“查找”,找到自已喜欢的视频。2、在“浏览器页面搜索”窗口中,输入要下载的视频的名称,然后...
- 永久免费听歌网站(丫丫音乐网)
-
可以到《我爱音乐网》《好听音乐网》《一听音乐网》《YYMP3音乐网》还可以到《九天音乐网》永久免费听歌软件有酷狗音乐和天猫精灵,以前要跳舞经常要下载舞曲,我从QQ上找不到舞曲下载就从酷狗音乐上找,大多...
- 音乐格式转换mp3软件(音乐格式转换器免费版)
-
有两种方法:方法一在手机上操作:1、进入手机中的文件管理。2、在其中选择“音乐”,将显示出手机中的全部音乐。3、点击“全选”,选中所有音乐文件。4、点击屏幕右下方的省略号图标,在弹出菜单中选择“...
- 电子书txt下载(免费的最全的小说阅读器)
-
1.Z-library里面收录了近千万本电子书籍,需求量大。2.苦瓜书盘没有广告,不需要账号注册,使用起来非常简单,直接搜索预览下载即可。3.鸠摩搜书整体风格简洁清晰,书籍资源丰富。4.亚马逊图书书籍...
- 最好免费观看高清电影(播放免费的最好看的电影)
-
在目前的网上选择中,IMDb(互联网电影数据库)被认为是最全的电影网站之一。这个网站提供了各种类型的电影和电视节目的海量信息,包括剧情介绍、演员表、评价、评论等。其还提供了有关电影制作背后的详细信息,...
- 孤单枪手2简体中文版(孤单枪手2简体中文版官方下载)
-
要将《孤胆枪手2》游戏的征兵秘籍切换为中文,您可以按照以下步骤进行操作:首先,打开游戏设置选项,通常可以在游戏主菜单或游戏内部找到。然后,寻找语言选项或界面选项,点击进入。在语言选项中,选择中文作为游...
欢迎 你 发表评论:
- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
