python中的map和filter避坑指南
off999 2025-05-26 18:13 102 浏览 0 评论
Pythonic的方式使用map和filter
列表迭代在python中是非常pythonic的使用方式
def inc(x):
return x+1
>>> list(map(inc,range(10)))
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
# pythonic way
>>> [inc(i) for i in range(10)]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]def is_even(x): return x%2==0
>>> list(filter(is_even, range(10)))
[0, 2, 4, 6, 8]
# pythonic way
>>> [i for i in range(10) if is_even(i)]
[0, 2, 4, 6, 8]列表迭代在python中针对迭代效率和性能是进行过定制化优化的使用方式,因此一般来说推荐这么写,不过在使用的过程中也难免踩到坑,本文希望一次性将使用注意事项讲清楚,避免采坑。
首先要明白在python中什么是值类型
在python中要想了解值类型,首先得明白以下两个:
- 什么是可变类型
- 什么是不可变类型
我们拿常见的几个类型来开场:
- string 是值类型吗?
是的,因为string是不可变类型。
- list 是值类型吗?
不是,因为list是可变类型。
- tuple是值类型吗?
是的,因为tuple是不可变类型
- iterator是值类型吗?
这个问题不好说,我拿代码来举例:
>>> a = iter((1,2,3))
>>> next(a)
1
>>> next(a)
2
>>> next(a)
3从上述示例我们看到每次返回结果会发生变化,那么他是可变的,那么他不是值类型。
上述介绍只是一个引子,因为了解什么是可变的,什么是不可变的,什么是值类型对于资深pythoner是非常有意义的。
接下来我们从几个常见的问题来开始下面的课程。
问题1:map和filter返回的是iterator
>>> res = map(inc, range(10))
# let's check if it worked
>>> list(res)
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
# let's filter all even integers from res
>>> list(filter(is_even, res))
[]如果您是一个有经验的pythonista,您可能知道哪里出错了,这是意料之中的。
以下是为什么这种是不符合预期的。如果我们使用列表推导式,就不会遇到这种情况。
>>> res=[inc(i) for i in range(10)]
# let's check if it worked
>>> res
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
# let's filter all even integers from res
>>> [i for i in res if is_even(i)]
[2, 4, 6, 8, 10]
# unless you directly mutate res
# you can do more things with res.我简化了一点,但是map和filter在调用list或tuple时返回一个迭代器。list (res)穷举迭代器,res变为空。
>>> res = map(inc, range(10))
# res returns an iterator here
>>> list(res)
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
# list(res) exhausts the iterator
# so you're filtering an empty iterator here
# so you get an empty list
>>> list(filter(is_even, res))
[]
你可以立即实现迭代器并存储结果到列表中。
res = list(map(inc, range(10)))
>>> list(res)
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
# works fine!
>>> list(filter(is_even, res))
[2, 4, 6, 8, 10]
但是如果这么做,就会失去了map和filter的惰性加载的特性,不方便做list(map…)。
问题2:map and filter 的懒加载模式
>>> filter(is_even, [1,2,3])
<filter object at 0x0000018B347B0EB0>这里,当你调用filter时,你是在创建一个filter对象,你不是在计算结果。你只在绝对需要的时候计算它,这是懒惰。这在函数式编程中很常见。这就是为什么这在python中是一个问题。
>>> a = [1,2,3,4]
>>> res = filter(is_even, a)
>>> a.append(10)
>>> a.append(12)你认为过滤的结果会是什么?如果你使用list(res),你会得到什么?需要你好好想想。
答案如下:
>>> list(res)
[2, 4, 10, 12]大多数人都能猜对答案,但这并不难。
>>> res = filter(is_even, a)我肯定是指过滤a的值,它是[1,2,3,4]。这会导致难以追踪的bug,更重要的是,这会使你的代码难以推理。
大多数函数式语言都具有不可变性是有原因的。只有当可以保证表达式的参数每次都具有相同的含义时,才能延迟表达式的求值。
在本例中,filter(is_even, a)的结果取决于迭代器的实现时间。它取决于时间。
>>> a = [1,2,3,4]
>>> res = filter(is_even,a)
>>> a.append(10)
>>> a.append(12)
>>> a.append(14)
>>> a.append(16)
>>> list(res)
[2, 4, 10, 12, 14, 16]这是完全相同的代码行,但结果改变了。这是另一种思考方式。
你未来的行为会影响你过去行为的结果。我们实质上是在改变过去,这使得对代码进行推理变得极为困难。
我将快速向您展示一个clojure示例。(别担心,它看起来很像python)
user=> (def a [1,2,3,4]) ; equivalent to a = [1,2,3,4]
#'user/a
user=> (def res (filter even? a)) ; even? = is_even
#'user/res
user=> (def a (concat a [10])) ; concat is similar to append
#'user/a
user=> (def a (concat a [12]))
#'user/a
user=> res
(2 4) ; isn't this what you expected?
user=> a ; proof that a is something else
(1 2 3 4 10 12)
Filter在clojure中是惰性的,但是你得到了正确的结果,即过滤[1,2,3,4]而不是[1,2,3,4,10,12]。
你无法改变过去。你可以看到为什么时间旅行可能是一个坏主意
只是为了提醒您,列表推导式解决了这些问题。
在用 map and filter的时候如何避免入坑
要解决这些问题,我们必须
返回一个值,而不是迭代器
消除惰性或确保可变性不会影响返回值。
修复第一个问题就像返回一个列表或元组一样简单。解决第二个问题更难。如果我们想要确保返回值不受可变性的影响,并试图有惰性,我们需要对输入可迭代对象做一个深度复制。
这是方法之一。
class filter:
def __init__(self,fn, iterable):
self.fn = fn
self.iterable = deepcopy(iterable)
self.res = None
def __iter__(self):
return [i for i in self.iterable if self.fn(i)]但懒惰不仅拖延了计算,还只在需要的时候计算结果。
user=> (take 10 (map inc (range)))
(1 2 3 4 5 6 7 8 9 10)由于map是惰性的,它只计算前10个元素。
filter实现中的deepcopy意味着我的实现不是完全懒惰的。这种实现的唯一优点是当过滤函数很昂贵时。
使用即时计算
我认为最实用的解决方案是即时地计算map和filter。
def map(fn, *iterables):
return [fn(*i) for i in zip(*iterables)]
def filter(fn, iterable):
return [i for i in iterable if fn(i)]这样做的好处是,它可以作为python默认map和filter的替换项,如果iterable是可哈希的,那么我们甚至可以向这些函数添加lru_cache。但列表是最常用的容器,而且它们是不可哈希的,所以可能没有那么大的好处?
那么在什么场景使用呢?
可能在一些罕见的情况下,用户可能想要迭代一个无限序列或一个巨大的序列,而懒惰是必要的。在这种情况下,我们可以定义一个lazymap和lazyfilter。在我看来,让默认情况变得迫切,并强迫用户在需要时显式地使用惰性版本更好。这将减少新手使用map和filter时的意外。
我们能做得比python默认的惰性实现更好吗
实际上是可以的
class lazymap:
def __init__(self,fn, *iterables):
self.fn = fn
self.iterables = iterables
def __iter__(self):
return (self.fn(*i) for i in zip(*self.iterables))
class lazyfilter:
def __init__(self,fn, iterable):
self.fn = fn
self.iterable = iterable
def __iter__(self):
return (i for i in self.iterable if self.fn(i))以下是为什么它更好。让我们来定义。
# taken from functionali
def take(n: int, iterable: Iterable) -> Tuple:
"""Returns the first n number of elements in iterable.
Returns an empty tuple if iterable is empty
>>> take(3, [1,2,3,4,5])
(1, 2, 3)
"""
it = iter(iterable)
accumulator = []
i = 1
while i <= n:
try:
accumulator.append(next(it))
i += 1
except StopIteration:
break
return tuple(accumulator)现在让我们看一个带有默认python实现的示例。
>>> res = map(inc, range(100))
>>> take(5, res)
(1, 2, 3, 4, 5)
>>> take(5, res)
(6, 7, 8, 9, 10)你不会得到相同的结果,即使它看起来是计算相同的表达式。
lazymap也是一样的。
>>> res = lazymap(inc, range(100))
>>> take(5, res)
(1, 2, 3, 4, 5)
>>> take(5, res)
(1, 2, 3, 4, 5)
>>> take(5, res)
(1, 2, 3, 4, 5)您总是会得到相同的结果,就像在clojure或任何其他函数式编程语言中一样。
user=> (def res (map inc (range 100)))
#'user/res
user=> (take 5 res)
(1 2 3 4 5)
user=> (take 5 res)
(1 2 3 4 5)相关推荐
- 电脑装了两个系统怎么切换(电脑安装2个系统怎么更换启动)
-
1.点击运行打开电脑点击左下角的开始菜单栏选项,右击鼠标在序列栏中选择运行打开。2.输入msconfig接着在运行的输入框中输入msconfig点击确定即可打开系统配置。3.点击引导打开系统配置的页面...
- linux系统哪个版本好用(最好linux系统版本)
-
个人比较推荐Debian这个发行版本。DebianGNU/Linux于1993年首次公布,至今已经有近30年历史了。当然其他版本比如openSUSE,Slackware,ArchLinux,Ubu...
- win10激活在哪里查看(win10激活时间在哪里看)
-
在Windows10中,您可以通过以下方法查看激活状态:方法1:使用“设置”应用1.点击屏幕左下角的“开始”按钮,然后点击“设置”(齿轮图标)。2.在设置窗口中,点击“系统”图标。3.在“系统...
- 官方win10dll文件修复工具(官方win7dll文件修复工具)
-
当电脑丢失dll文件时,可以采用以下几种方法进行一键修复:从回收站还原:如果是不小心误删了一些计算机文件,导致电脑出现异常的情况时,首先就可以去回收站找回dll文件,如果文件还在,就可以通过还原操作来...
- qq所有历史旧版本大全(qq历史版本一览表)
-
有2种方法。一种是:你是QQ会员。你可以把旧版打开,聊天记录上传。然后打开新的QQ,下载。第2种是:你在硬盘上装了QQ软件,然后你就点卸载(uninst),把原来的卸了。然后按原位置覆盖,装上06版。...
- 电脑显示器分辨率怎么调(显示分辨率无法调整)
-
1、以win7为例,首先右键点击桌面,在右键菜单中直接显示了屏幕分辨率的选项,用鼠标点击一下这个选项。2、在分辨率设置选项页面中,有一个分辨率的选项,点击一下这个选项,上面默认显示的数值是你现在的屏幕...
- 8系统(8系统点检控制包含什么)
-
WIndows8系统是微软目前最新的操作系统,Moto的图形界面设计,使很多已经习惯于早期windows系统的用户难以接受,Windows8是一个向平板和桌面系统妥协的产物,存在着相当多的利弊。...
- 电脑软件管家(电脑软件管家在哪里找到)
-
电脑管家有着最大的安全云库,全新的杀毒引擎,深度清理电脑垃圾,为电脑重回巅峰状态,更有账号宝专版,10倍提升QQ防盗号能力,是很好用的。就自己而言,在电脑上用的是腾讯电脑管家这个第三方系统安全软件,管...
- 迅雷种子搜索器(迅雷种子搜索器手机版下载)
-
迅雷种子搜索方法: 1.在开始菜单栏或者到文件的安装路径文件夹中找到P2P种子搜索器。&nb...
- 手机怎么解压文件(苹果手机怎么解压文件)
-
手机解压文件方法:1、首先,在手机中找到文件管理,打开文件管理。2、打开文件管理之后找到压缩包,然后打开。3、打开安装包之后,选择需要的文件,。4、接下来找到“解压至”,点击“解压至”。5、点击之后,...
- 虚拟机安装centos7(虚拟机安装centos7图形界面)
-
安装CentOS7在虚拟机中,您可以按照以下步骤操作:1.下载CentOS7的ISO映像文件。2.打开虚拟机软件(如VMware、VirtualBox等)并创建一个新的虚拟机。3.在虚拟机创...
- 电脑老是重启(电脑老是重启什么原因造成的)
-
电脑由于工作环境积尘与空气湿度过大,经常使主板的接插件部分受潮产生氧化;特别是内存条插座、PCI扩展槽、键盘鼠标接口、LOT接口、CMOS电池压盒、ATX电源插座等。一旦它们出现接触不良现象,很容易出...
- win8系统怎么重装系统(win8.1系统重装教程)
-
1、修改Cortana资源占用:按Windows按钮,输入regedit,打开注册表编辑器,找到以下路径:HKEY_LOCAL_MACHINE—SYSTEM—CurrentControlSet—Ser...
- 手机163邮箱app下载(163邮箱下载手机版官网 app)
-
163邮箱登录首页入口为http://mail.163.com/网易163免费邮箱--中文邮箱第一品牌.容量自动翻倍,支持50兆附件,免费开通手机号码邮箱赠送3G超大附件服务.支持各种客户端软件收发,...
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
python入门到脱坑 输入与输出—str()函数
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
失业程序员复习python笔记——条件与循环
-
慕ke 前端工程师2024「完整」
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
