百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

阿六详解 python 中的迭代操作和迭代器、生成器的区别

off999 2024-09-29 16:15 28 浏览 0 评论

前言

小伙伴们迭代器和生成器是 python 面试的时候,被问概率较高的一个知识点,很多小伙伴都不太分得清这两者的区别,今天就来给大家详细的讲解迭代器和生成器的区别。

一、可迭代对象

在讲解迭代器和生成器之前,我们得先说说可迭代对象,所谓的可迭代对象就是能够通过 for 循环迭代,逐一返回其成员项的对象称为可迭代对象, python 中可迭代对象包括

  • 1、所有序列类型 :如 list、 str 和 tuple、range
  • 2、非序列类型: dict、set、文件对象
  • 3、实现了 __iter__() 方法的任意对象
  • 4、实现了序列语义的 __getitem__() 方法的任意对象。

二、for 循环迭代到底干了啥?

1、 __iter__() 方法

__iter__() 在 python 中也被称作迭代协议,只要对象拥有 __iter__() 方法,那么该对象就实现了迭代协议,就可以进行迭代操作。

另外 __iter__() 方法的返回值,必须是一个迭代器(迭代器下章详细讲解)。

python 中的 list、str、tuple、dict、set 等类型都实现了 __iter__() (迭代协议),所以能够直接进行遍历。

当我们用 for 去遍历任何一个对象时,for 循环执行的时候,会先去调用对象的 __iter__(),根据 __iter__() 返回的迭代器,再进行迭代操作。

下面是我自己定义的一个实现 __iter__() 方法,可迭代对象的类

  class MyArray:
    """自定义的可迭代对象类"""
    def __iter__(self):
        return iter([11, 22, 33, 44])
  
if __name__ == '__main__':
    m = MyArray()
    for i in m:
        print(i)

执行结果:

  11
22
33
44

上面案例遍历自定义 MyArray 类的对象,可以看到遍历出来的是 __iter__() 返回迭代器中的数据

2、__getitem__() 方法

__getitem__() 是用来实现序列类型数据索引取值的魔术方法。python 中的 str、list、dict 等类型的数据均实现了该方法。

  li = [11,22,33]
dic = {'a':11,'b':22}
# 列表索引取值,本质上调用的是 li.__getitem__(1)方法去取值的。
li[1]

前面说到 for 循环遍历对象的时候,会先去调用对象的 __iter__() 方法,如果对象没有定义 __iter__() 方法,那么 for 在遍历的时候,就会从索引 0 开始,循环调用 __getitem__(),,把 __getitem__() 的返回值,作为遍历出来的数据,直到 __getitem__() 中抛出异常,则终止循环。

下面是通过 __getitem__() 方法实现的可迭代对象的类。

  class Mylist2:
    """自定义的序列类类"""
    li = ['a1', 'a2', 'a3', 'a4']
    def __getitem__(self, item):
        # iten是for循环内部传进来的索引值,从0开始
        return self.li[item]
  
if __name__ == '__main__':
    m2 = Mylist2()
    for i in m2:
        print(i)

执行结果:

  a1
a2
a3
a4

从上面的案例中我们可以看到我们在遍历 Mylist2 这个类的对象时,其实就是不断的调用对象的 __getitem__ 方法来获取遍历出来的值。

三、迭代器(Iterator)

理解了什么是可迭代对象和 for 循环迭代的机制之后,我们再来了解一下迭代器协议和迭代器。

2.1 迭代器协议:

  迭代器协议由一个`__iter__` 方法和__next__方法共同构成。实现了这两个方法的对象就实现了迭代器协议。
  • 1、对象实现了迭代协议的对象(实现了 __iter__ 方法)
  • 2、对象实现了 __next__ 方法,__next__ 方法在迭代完所有数据之后,会抛出 StopIteration 的错误信息。

2.2迭代器

  • 1、实现了迭代器协议的对象,就是一个迭代器
  • 2、所有的可迭代对象 都可以通过内置函数 iter()转换为迭代器:
  • 3、迭代器对象能够使用 内置函数 next 进行迭代操作,当所有数据迭代完毕后,再使用 next 迭代,会抛出异常 StopIteration。
  • 4、所有的迭代器都是可迭代对象,因为迭代器协议包含了迭代协议

# 将列表转换为一个迭代器

iter_li = iter([11,22,33,44])

# 通过next对迭代器进行迭代操作,每次可以迭代出来一个数据

s1 = next(iter_li)

print('s1:',s1)

s2 = next(iter_li)

print('s2:',s2)


# 上述代码运行结果为:

s1 :11

s2 :22

四、生成器

问题:什么是生成器?生成器有什么作用?

是一种特殊的迭代器,具备迭代器所有的特性,生成器内部不存储数据,只保存生成数据的计算规则,在存储大量数据的时候,能够节约内存的开销

python 中定义生成器,一共有两种方式,一种是生成器表达式,另一种是生成器函数。

4.1、生成器表达式

生成器表达式的语法其实就是把列表推导式的中括号改成小括号,如下:

  gen_ =(item for item in range(10))
print(gen_)

运行结果:

  <generator object <genexpr> at 0x00000000023A8DB0>

上面运行的结果是一个 generator object,就是一个生成器对象,而上面写的表达式,就叫做生成器表达式

4.2、生成器函数

在函数中使用 yeild 关键字可以定义一个生成器函数。只要当函数中有 yeild 这个关键字,那么就不能再把它看成一个简单的函数,调用函数不会直接执行函数内部的代码,而是直接返回的就是一个生成器对象

  def func():
    for i in item:
        yeild i

#调用函数   
gen_lsit = func()
print(type(gen_list))
#返回的是一个generator对象

#同样也可以使用next生成数据
next(gen_list)

五、生成器和迭代器的区别:

生成器属于迭代器的一种,如何区分迭代器和生成器?

  • 1、迭代器类型是 Iterator 类型,生成器是 Generator 类型。
  • 2、生成器内部不存储数据,只保存生成数据的计算规则
  • 3、生成器比迭代器多了 3 个方法 send 方法:在生成数据的同时,可以和生成器内部进行数据交互 close: 生成可以调用 close 方法进行关闭 throw: 可以在生成器内部上一次暂停的 yield 处引发一个指定的异常类型。生成器内部可以通过捕获的异常类型来做不同的处理
  def gen():
    for i in range(10):
        yield i

g = gen()
print(next(g))

print(g.send(10))

# close:关闭生成器
# g.close()

# throw :在生成器内部主动引发一个异常   参数:异常类型  异常信息
# g.throw(ValueError, "hello python")

好了今天就到这里了,喜欢的可以给我点赞加关注哟。

相关推荐

apisix动态修改路由的原理_动态路由协议rip的配置

ApacheAPISIX能够实现动态修改路由(DynamicRouting)的核心原理,是它将传统的静态Nginx配置彻底解耦,通过中心化配置存储(如etcd)+OpenRest...

使用 Docker 部署 OpenResty Manager 搭建可视化反向代理系统

在之前的文章中,xiaoz推荐过可视化Nginx反向代理工具NginxProxyManager,最近xiaoz还发现一款功能更加强大,界面更加漂亮的OpenRestyManager,完全可以替代...

OpenResty 入门指南:从基础到动态路由实战

一、引言1.1OpenResty简介OpenResty是一款基于Nginx的高性能Web平台,通过集成Lua脚本和丰富的模块,将Nginx从静态反向代理转变为可动态编程的应用平台...

OpenResty 的 Lua 动态能力_openresty 动态upstream

OpenResty的Lua动态能力是其最核心的优势,它将LuaJIT嵌入到Nginx的每一个请求处理阶段,使得开发者可以用Lua脚本动态控制请求的生命周期,而无需重新编译或rel...

LVS和Nginx_lvs和nginx的区别

LVS(LinuxVirtualServer)和Nginx都是常用的负载均衡解决方案,广泛应用于大型网站和分布式系统中,以提高系统的性能、可用性和可扩展性。一、基本概念1.LVS(Linux...

外网连接到内网服务器需要端口映射吗,如何操作?

外网访问内网服务器通常需要端口映射(或内网穿透),这是跨越公网与私网边界的关键技术。操作方式取决于网络环境,以下分场景详解。一、端口映射的核心原理内网服务器位于私有IP地址段(如192.168.x.x...

Nginx如何解决C10K问题(1万个并发连接)?

关注△mikechen△,十余年BAT架构经验倾囊相授!大家好,我是mikechen。Nginx是大型架构的必备中间件,下面我就全面来详解NginxC10k问题@mikechen文章来源:mikec...

炸场!Spring Boot 9 大内置过滤器实战手册:从坑到神

炸场!SpringBoot9大内置过滤器实战手册:从坑到神在Java开发圈摸爬滚打十年,见过太多团队重复造轮子——明明SpringBoot自带的过滤器就能解决的问题,偏偏要手写几十...

WordPress和Typecho xmlrpc漏洞_wordpress主题漏洞

一般大家都关注WordPress,毕竟用户量巨大,而国内的Typecho作为轻量级的博客系统就关注的人并不多。Typecho有很多借鉴WordPress的,包括兼容的xmlrpc接口,而WordPre...

Linux Shell 入门教程(六):重定向、管道与命令替换

在前几篇中,我们学习了函数、流程控制等Shell编程的基础内容。现在我们来探索更高级的功能:如何控制数据流向、将命令链接在一起、让命令间通信变得可能。一、输入输出重定向(>、>>...

Nginx的location匹配规则,90%的人都没完全搞懂,一张图让你秒懂

刚配完nginx网站就崩了?运维和开发都头疼的location匹配规则优先级,弄错顺序直接导致500错误。核心在于nginx处理location时顺序严格:先精确匹配=,然后前缀匹配^~,接着按顺序正...

liunx服务器查看故障命令有那些?_linux查看服务器性能命令

在Linux服务器上排查故障时,需要使用一系列命令来检查系统状态、日志文件、资源利用情况以及网络状况。以下是常用的故障排查命令,按照不同场景分类说明。1.系统资源相关命令1.1查看CPU使...

服务器被入侵的常见迹象有哪些?_服务器入侵可以被完全操纵吗

服务器被入侵可能会导致数据泄露、服务异常或完全失控。及时发现入侵迹象能够帮助你尽早采取措施,减少损失。以下是服务器被入侵的常见迹象以及相关的分析与处理建议。1.服务器被入侵的常见迹象1.1系统性能...

前端错误可观测最佳实践_前端错误提示

场景解析对于前端项目,生产环境的代码通常经过压缩、混淆和打包处理,当代码在运行过程中产生错误时,通常难以还原原始代码从而定位问题,对于深度混淆尤其如此,因此Mozilla自2011年开始发起并...

8个能让你的Kubernetes集群“瞬间崩溃”的配置错误

错误一:livenessProbe探针“自杀式”配置——30秒内让Pod重启20次现象:Pod状态在Running→Terminating→CrashLoopBackOff之间循环,重启间隔仅...

取消回复欢迎 发表评论: