Python生成器详解 | 投稿
off999 2024-12-10 19:17 13 浏览 0 评论
程派微信号:codingpy
本文为作者、kissg.me博主赵喧典授权编程派原创发布。文章比较长,大家可以收藏了慢慢看哈~~
引文
编程派前几天推送了一篇文章,叫“Python学习进阶路线(简版)”,生成器(generator)
赫然在列.可是我不太会.不会怎么办?学咯。于是上网看了不少教程,又看了官方文档,学到了不少知识。在此,权且做个学习笔记,也与大家分享一下。
正文
要理解generator
,我们先从迭代(iteration)
与迭代器(iterator)
讲起.当然,本文的重点是generator
,iteration
与iterator
的知识将点到即止。直接看generator
迭代是重复反馈过程的活动,其目的通常是为了接近并到达所需的目标或结果。每一次对过程的重复被称为一次“迭代”,而每一次迭代得到的结果会被用来作为下一次迭代的初始值。
以上是维基百科对迭代的定义。在python中,迭代通常是通过for ... in ...
来完成的,而且只要是可迭代对象(iterable)
,都能进行迭代。这里简单讲下iterable
与iterator
:
iterable
是实现了__iter__()
方法的对象.更确切的说,是container.__iter__()
方法,该方法返回的是的一个iterator
对象,因此iterable
是你可以从其获得iterator
的对象.使用iterable
时,将一次性返回所有结果,都存放在内存中,并且这些值都能重复使用.以上说法严重错误!对于iterable
,我们该关注的是,它是一个能一次返回一个成员的对象(iterable is an object capable of returning its members one at a time),一些iterable
将所有值都存储在内存中,比如list
,而另一些并不是这样,比如我们下面将讲到的iterator
.
iterator
是实现了iterator.__iter__()
和iterator.__next__()
方法的对象.iterator.__iter__()
方法返回的是iterator
对象本身.根据官方的说法,正是这个方法,实现了for ... in ...
语句.而iterator.__next__()
是iterator
区别于iterable
的关键了,它允许我们显式地获取一个元素.当调用next()
方法时,实际上产生了2个操作:
更新
iterator
状态,令其指向后一项,以便下一次调用返回当前结果
如果你学过C++
,它其实跟指针的概念很像(如果你还学过链表的话,或许能更好地理解)。
正是__next__()
,使得iterator
能在每次被调用时,返回一个单一的值(有些教程里,称为一边循环,一边计算,我觉得这个说法不是太准确。但如果这样的说法有助于你的理解,我建议你就这样记),从而极大的节省了内存资源。另一点需要格外注意的是,iterator
是消耗型的,即每一个值被使用过后,就消失了。因此,你可以将以上的操作2理解成pop
。对iterator
进行遍历之后,其就变成了一个空的容器了,但不等于None
哦。因此,若要重复使用iterator
,利用list()
方法将其结果保存起来是一个不错的选择。
我们通过代码来感受一下。
既然提到了for ... in ...
语句,我们再来简单讲下其工作原理吧,或许能帮助理解以上所讲的内容。
>>> x = [1, 2, 3]
>>> for i in x:
...
...
我们对一个iterable
用for ... in ...
进行迭代时,实际是先通过调用iter()
方法得到一个iterator
,假设叫做X。然后循环地调用X的next()
方法取得每一次的值,直到iterator为空,返回的StopIteration
作为循环结束的标志。for ... in ...
会自动处理StopIteration
异常,从而避免了抛出异常而使程序中断。如图所示
磨刀不误砍柴工,有了前面的知识,我们再来理解generator
与yield
将会事半功倍。
首先先理清几个概念:
generator
: A function which returns a generator iterator. It looks like a normal function except that it contains yield expressions for producing a series of values usable in a for-loop or that can be retrieved one at a time with the next() function.
generator iterator
: An object created by a generator funcion.
generator expression
: An expression that returns an iterator.
以上的定义均来自python官方文档。可见,我们常说的生成器
,就是带有yield
的函数,而generator iterator
则是generator function
的返回值,即一个generator
对象,而形如(elem for elem in [1, 2, 3])
的表达式,称为generator expression
,实际使用与generator
无异。
其实说白了,generator
就是iterator
的一种,以更优雅的方式实现的iterator
。官方的说法是:
Python’s generators provide a convenient way to implement the iterator protocol.
你完全可以像使用iterator
一样使用generator
,当然除了定义。定义一个iterator
,你需要分别实现__iter__()
方法和__next__()
方法,但generator
只需要一个小小的yield
(好吧,generator expression
的使用比较简单,就不展开讲了。)
前文讲到iterator
通过__next__()
方法实现了每次调用,返回一个单一值的功能。而yield
就是实现generator
的__next__()
方法的关键!先来看一个最简单的例子:
第一次调用next()
方法时,函数似乎执行到yield 1
,就暂停了。然后再次调用next()
时,函数从yield 1
之后开始执行的,并再次暂停。第三次调用next()
,从第二次暂停的地方开始执行。第四次,抛出StopIteration
异常。
事实上,generator
确实在遇到yield
之后暂停了,确切点说,是先返回了yield
表达式的值,再暂停的。当再次调用next()
时,从先前暂停的地方开始执行,直到遇到下一个yield
。这与上文介绍的对iterator
调用next()
方法,执行原理一般无二。
有些教程里说generator
保存的是算法,而我觉得用中断服务子程序
来描述generator
或许能更好理解,这样你就能将yield
理解成一个中断服务子程序的断点
,没错,是中断服务子程序的断点。我们每次对一个generator
对象调用next()
时,函数内部代码执行到”断点”yield
,然后返回这一部分的结果,并保存上下文环境,”中断”返回。
怎么样,是不是瞬间就明白了yield
的用法?
我们再来看另一段代码。
我正是看到这个形式的generator
,懵了,才想要深入学习generator
与yield
的。结合以上的知识,我再告诉你,generator
其实有第2种调用方法(恢复执行),即通过send(value)
方法将value
作为yield
表达式的当前值,你可以用该值再对其他变量进行赋值,这一段代码就很好理解了。当我们调用send(value)
方法时,generator
正由于yield
的缘故被暂停了。此时,send(value)
方法传入的值作为yield
表达式的值,函数中又将该值赋给了变量s
,然后print函数打印s
,循环再遇到yield
,暂停返回。
调用send(value)
时要注意,要确保,generator
是在yield
处被暂停了,如此才能向yield
表达式传值,否则将会报错(如上所示),可通过next()
方法或send(None)
使generator
执行到yield
。
再来看一段yield
更复杂的用法,或许能加深你对generator
的next()
与send(value)
的理解。
上述代码既有yield value
的形式,又有value = yield
形式,看起来有点复杂。但以yield
分离代码进行解读,就不太难了。第一次调用next()
方法,执行到yield value
表达式,保存上下文环境暂停返回1
。第二次调用send(value)
方法,从value = yield
开始,打印,再次遇到yield value
暂停返回。后续的调用se nd(value)
或next()
都不外如是。
但是,这里就引出了另一个问题,yield
作为一个暂停恢复的点,代码从yield
处恢复,又在下一个yield
处暂停。可见,在一次next()
(非首次)或send(value)
调用过程中,实际上存在2个yield
,一个作为恢复点的yield
与一个作为暂停点的yield
。因此,也就有2个yield
表达式。send(value)
方法是将值传给恢复点yield
;调用next()
表达式的值时,其恢复点yield
的值总是为None
,而将暂停点的yield
表达式的值返回。为方便记忆,你可以将此处的恢复点记作当前的(current),而将暂停点记作下一次的(next),这样就与next()
方法匹配起来啦。
generator
还实现了另外两个方法throw(type[, value[, traceback]])
与close()
。前者用于抛出异常,后者用于关闭generator
.不过这2个方法似乎很少被直接用到,本文就不再多说了,有兴趣的同学请看这里。
小结
可迭代对象(Iterable)是实现了
__iter__()
方法的对象,通过调用iter()
方法可以获得一个迭代器(Iterator)。迭代器(Iterator)是实现了
__iter__()
和__next__()
的对象。for ... in ...
的迭代,实际是将可迭代对象转换成迭代器,再重复调用next()
方法实现的。生成器(generator)是一个特殊的迭代器,它的实现更简单优雅
yield
是生成器实现__next__()
方法的关键。它作为生成器执行的暂停恢复点,可以对yield
表达式进行赋值,也可以将yield
表达式的值返回。
相关推荐
- 用Python编制生成4位数字字母混合验证码
-
我们登录一些网站、APP的时候经常会有验证码,这个为了防止有人不停的去试探密码,还有发送短信验证之前,输入验证码就可以减少误点,错误操作等等。可以提高安全性,我们可以生成数字,也可以生成字母,也可...
- Python电子发票管理工具4:前后端业务逻辑实现
-
用一系列文章介绍如何用python写一个发票管理小工具。在前面的文章中前端页面和后端框架已经实现,本文将介绍功能实现的代码。数据库操作使用sqlalchemy操作sqlite数据库。sqlalchem...
- 【代码抠图】4行Python代码帮你消除图片背景
-
在修图工具满天飞的年代其实仍然还有很多人不会扣图(比如我),在很多需要去除某些照片上面的背景的时候就会很难受,所以今天就给不会扣图的小伙伴们来带一个简单的代码扣图教程,只需要4行代码,不用再多了。准备...
- Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
Python3.14重磅更新!UUIDv6/v7/v8强势来袭,别再用uuid4()啦!为什么说UUID升级是2025年Python开发者的必学技能?在当今互联网应用中,UU...
- 殊途同归 python 第 4 节:有趣的键值对(字典)
-
字典数据的突出特点就是“键”和“值”,前文已经简单介绍过,本文来聊聊关于字典的几个高级玩法。1.函数打包后,通过键来调用globalf1,f2a={"k1":f1,"k2...
- 更有效地使用 Python Pandas 的 4 个技巧
-
一个简单而实用的指南照片由simonsun在Unsplash上拍摄Pandas是一个用于数据分析和操作任务的非常实用且功能强大的库。自2019年以来,我一直在使用Pandas,它始终能够为我...
- 4.python学习笔记-集合(python里面集合)
-
1.关于集合集合是一类元素无序不重复的数据结构,常用场景是元素去重和集合运算。python可以使用大括号{}或者set()函数创建集合,如果创建一个空集合必须用set()而不是{},因为{}是用来表示...
- python生成4种UUID(python随机生成uuid)
-
总结了一份python生成4种UUID的代码:UUID用4种uuid生成方法:uuid1:基于时间戳由MAC地址、当前时间戳、随机数字。保证全球范围内的唯一性。但是由于MAC地址使用会带来安全问题...
- 你不知道的4种方法:python方法绘制扇形
-
1说明:=====1.1是问答中的我的一个回答。1.1因为问答中没有代码块的,所以我改为这里写文章,然后链接过去。1.24种方法:turtle法、OpenCV法、pygame法和matplot...
- 30天学会Python编程:4. Python运算符与表达式
-
4.1运算符概述4.1.1运算符分类Python运算符可分为以下几大类:4.1.2运算符优先级表4-1Python运算符优先级(从高到低)运算符描述示例**指数2**3→8~+-按位取...
- 这3个高级Python函数,不能再被你忽略了
-
全文共1657字,预计学习时长3分钟Python其实也可以带来很多乐趣。重新审视一些一开始并不被人们熟知的内置函数并没有想象中那么难,但为什么要这么做呢?今天,本文就来仔细分析3个在日常工作中或多或少...
- beautifulSoup4,一个超实用的python库
-
一.前言我们在学习python爬虫的时候,数据提取是一个常见的任务。我们一般使用正则表达式,lxml等提取我们需要的数据,今天我们介绍一个新的库beautifulSoup4,使用它您可以从HTML和...
- AI指导:打造第一个Python应用(4)(python ai开发)
-
眼瞅着迈过几个里程碑,与目标越来越近。尽管过程中照旧因返工而心焦,而欣喜与急躁比例,是喜悦运大于焦虑。从初次熟悉智能大模型,尝试编程起步,不定期进行复盘反思,这是小助手指导编程的第四篇。复盘以为记。需...
- wxPython 4.2.0终于发布了(wxpython安装教程)
-
wxPython是Python语言的跨平台GUI工具包。使用wxPython,软件开发人员可以为他们的Python应用程序创建真正的本地用户界面,这些应用程序在Windows、Ma...
- 《Python学习手册(第4版)》PDF开放下载,建议收藏
-
书籍简介如果你想动手编写高效、高质量并且很容易与其他语言和工具集成的代码,本书将快速地帮助你利用Python提高效率。本书基于Python专家的流程培训课程编写,内容通俗易懂。本书包含很多注释的例子和...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python字典遍历 (54)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (60)
- python读取文件夹下所有文件 (59)
- java调用python脚本 (56)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)