python基础-迭代器和生成器

2019年5月14日 ⋅ 浏览量: 41   


迭代器

函数名的运用

函数名是一个变量, 但它是一个特殊的变量, 与括号配合可以执行函数的变量

函数名的内存地址

def func():   
    print("呵呵")
print(func)

结果: <function func at 0x1101e4ea0>

函数名可以赋值给其他变量

def func():   
    print("呵呵")
    print(func)
a = func    # 把函数当成一个值赋值给另一个变量

a()     # 函数调用 func()

函数名可以当做容器类的元素

def func1():   
    print("呵呵")
def func2():   
    print("呵呵")
def func3():   
    print("呵呵")
def func4():  
     print("呵呵")

lst = [func1, func2, func3]
for i in lst:  
     i()

函数名可以当做函数的参数

def func():   
    print("吃了么")
def func2(fn):   
    print("我是func2")   
    fn()    # 执行传递过来的fn   
    print("我是func2")
func2(func)     # 把函数func当成参数传递给func2的参数fn.

函数名可以作为函数的返回值

def func_1():   
    print("这里是函数1")   
    def func_2():       
        print("这里是函数2")   
    print("这里是函数1")   
    return func_2
fn = func_1()  
# 执行函数1.  函数1返回的是函数2, 这时fn指向的就是上面函数2
fn()    # 执行func_2函数

闭包

什么是闭包? 闭包就是内层函数, 对外层函数(非全局)的变量的引用. 叫闭包

def func1():
    name = "alex"
    def func2():
        print(name)
        # 闭包
    func2()
func1()
# 结果: alex

检测闭包

我们可以使用__closure__ 来检测函数是否是闭包. 使用函数名.__closure__返回cell就是 闭包. 返回None就不是闭包

def func1():
    name = "alex"
    def func2():
        print(name)
    func2()
    print(func2.__closure__)

func1()

结果:
alex
(<cell at 0x0000020077EFC378: str object at 0x00000200674DC340>,)

返回的结果不是None就是闭包

这样写没有问题,但是有个问题就是这个里边的函数只能先执行了func1才能执行func2,我想在外边调用怎么办呢?

我们可不可以将里边的函数名当做参数返回给调用者啊

def outer():   
    name = "alex"   
    # 内部函数   
    def inner():       
        print(name)   
    return inner
fn = outer()   # 访问外部函数, 获取到内部函数的函数地址
fn()    # 访问内部函数

这样就实现了外部访问,那如果多层嵌套呢?很简单,只需要一层一层的往外层返回就行了

def func1():  
    def func2(): 
        s = '嘿嘿'
        def func3():       
            print(s)      
        return func3 
    return func2
func1()()()

这样我们在外界可以访问内部函数. 那这个时候内部函数访问的时间和时机就不一定了, 因为在外部, 我可以选择在任意的时间去访问内部函数. 这 个时候. 想一想. 我们之前说过, 如果一个函数执行完毕. 则这个函数中的变量以及局部命名空间中的内容都将会被销毁. 在闭包中. 如果变量被销毁了. 那内部函数将不能正常执行. 所 以. python规定. 如果你在内部函数中访问了外层函数中的变量. 那么这个变量将不会消亡. 将会常驻在内存中. 也就是说. 使用闭包, 可以保证外层函数中的变量在内存中常驻. 这样做有什么好处呢? 非常大的好处. 闭包的作用就是让一个变量能够常驻内存,供后面的程序使用

迭代器

我们之前一直在用可迭代对象进行操作,那么到底什么是可迭代对象.我们现在就来讨论讨论可迭代对象.首先我们先回顾下我们

熟知的可迭代对象有哪些:

str list tuple dic set 那为什么我们称他们为可迭代对象呢?因为他们都遵循了可迭代协议,那什么又是可迭代协议呢.首先我们先看一段代码:

正确的代码:

s = 'abc'
for i in s:
    print(i)

结果:
a
b
c
错误的代码:
for i in 123:
    print(i)


结果
Traceback (most recent call last):
  File "D:/python_object/二分法.py", line 62, in <module>
    for i in 123:
TypeError: 'int' object is not iterable

注意看报错信息,报错信息中有这样一句话: 'int' object is not iterable 翻译过来就是整数类型对象是不可迭代的.

iterable表示可迭代的.表示可迭代协议 那么如何进行验证你的数据类型是否符合可迭代协议.我们可以通过dir函数来查看类中定义好的所有方法

a = 'abc'
print(dir(a))  # dir查看对象的方法和函数

# 在打印结果中寻找__iter__ 如果存在就表示当前的这个类型是个可迭代对象

我们刚刚测了字符串中是存在 __iter__ 的,那我们来看看 列表,元祖,字典.集合中是不是有存在__iter__

# 列表

lst = [1,2]
print(dir(lst))


# 元祖

tuple = (1,2)
print(dir(tuple))


# 字典

dic = {'a':1,'b':2}
print(dir(dic))



# 集合

se = {1,2,3,4,4}
print(dir(se))

是不是发现以上都有__iter__并且还很for循环啊,其实也可以这么说可以for循环的就有__iter__方法,包括range

print(dir(range))

这是查看一个对象是否是可迭代对象的第一种方法,我们还可以通过isinstence()函数来查看一个对象是什么类型的

l = [1,2,3]

l_iter = l.__iter__()

from collections import Iterable
from collections import Iterator

print(isinstance(l,Iterable)) #True             #查看是不是可迭代对象
print(isinstance(l,Iterator)) #False            #查看是不是迭代器
print(isinstance(l_iter,Iterator)) #True       
print(isinstance(l_iter,Iterable)) #True

通过上边的我们可以确定.如果对象中有__iter__函数,那么我们认为这个对象遵守了可迭代协议.就可以获取到相应的迭代器

.这里的__iter__是帮助我们获取到对象的迭代器.我们使用迭代器中的__next__()来获取到一个迭代器的元素,那么我们之前所讲的

for循环机制

for的工作原理到底是什么? 继续向下看:

s = "我爱北京天安⻔"

c = s.__iter__() # 获取迭代器
print(c.__next__()) # 使⽤迭代器进⾏迭代. 获取⼀个元素 我
print(c.__next__()) # 爱
print(c.__next__()) # 北
print(c.__next__()) # 京
print(c.__next__()) # 天
print(c.__next__()) # 安
print(c.__next__()) # ⻔
print(c.__next__()) # StopIteration

for循环是不是也可以,并且还不报错啊,其实上边就是for的机制,

我们使用while循环和迭代器来模拟for循环: 必须要会

lst = [6,5,4]

l = lst.__iter__()

while True:
    try:
        i = l.__next__()
        print(i)
    except StopIteration
        break

注意: 迭代器不能反复,只能向下执行,并且是一次性的.获取过了就不能在获取了

总结

​ Iterable: 可迭代对象. 内部包含__iter__()函数

​ Iterator: 迭代器. 内部包含__iter__() 同时包含__next__().

迭代器的特点:

​ 1. 节省内存.

​ 2. 惰性机制

​ 3. 不能反复, 只能向下执行.

我们可以把要迭代的内容当成子弹. 然后呢. 获取到迭代器__iter__(), 就把子弹都装在弹夹中. 然后发射就是__next__()把每一个子弹(元素)打出来. 也就是说, for循环的时候.一开始的 时候是__iter__()来获取迭代器. 后面每次获取元素都是通过__next__()来完成的. 当程序遇到 StopIteration将结束循环.

生成器

首先我们来看看什么是个生成器,生成器它的本质就是迭代器

在python中有以下几种方式来获取生成器

1.通过生成器函数

2.通过各种推到式来实现生成器

首先,我们先看一个很简单的函数:

def func():
    print(11)
    return 22
ret = func()
print(ret)

# 运行结果:
11
22

我们只需要修改一个地方就可以把函数变成生成器 就是将函数中的return换成yield就是生成器

定义生成器

def func():
    print(11)
    yield 22

func()

我们这样写没有任何的变化,这是为什么呢? 我们来看看函数名加括号获取到的是什么?

为什么不会执行呢??不是函数名加括号就是调用这个函数吗? 你想的没有问题,只是因为函数体中出现了yield

咱们可以理解为,生成器是基于函数的形式变成的.

我们func()这一步是在创建一个生成器,然后我们就可以赋值到别得变量中,然后进行使用了

def func():

    print(11)

    yield 22

ret = func()

print(ret)

# 运行结果:

<generator object func at 0x000001A575163888>

获取的这个生成器.如何使用呢???

回想下迭代器是怎么使用的,再想想生成器的本质就是迭代器.我们是不是就可以直接使用迭代器的方式直接使用生成器啦

def func():
     print("111")
     yield 222

gener = func() # 这个时候函数不会执⾏. ⽽是获取到⽣成器
ret = gener.__next__() # 这个时候函数才会执⾏. yield的作⽤和return⼀样. 也是返回数据
print(ret)

结果:
111
222

那么我们可以看到,yield和return的效果是一样的,但是还是有点区别

yield是分段来执行一个函数,yield可以出现多次

return是直接停止这个函数,return可以出现多次但是只会执行到第一个就结束了

def func():
    print("111")
    yield 222
    print("333")
    yield 444
gener = func()
ret = gener.__next__()
print(ret)
ret2 = gener.__next__()
print(ret2)
ret3 = gener.__next__()
# 最后⼀个yield执⾏完毕. 再次__next__()程序报错
print(ret3)

结果:
111
222
333
444

当程序运行完最后一个yield,那么后面继续运行__next__()程序会报错

好了生成器我们认识了,生成器有什么作用呢?

生成器的作用

我们来看一下这个需求,老男孩向楼下好适口的老板订购了10000个包子.好适口老板也实在一下就全部都做出来了  

def eat():
    lst = []
    for i in range(1,10000):
        lst.append('包子'+str(i))
    return lst
e = eat()
print(e)

这样做是没有问题,但是我们目前这么点人吃不完这么多,只能先放到一个地方,过会在吃的时候包子就凉了.这样也不太好

最后是老板能够咱们吃一个他做一个.这样我们就不用考虑没地方和包子凉的问题了,咱们实现一个吃一个做一个

def eat():

    for i in range(1,10000):

        yield '包子'+str(i)

e = eat()

print(e.__next__())

print(e.__next__())

print(e.__next__())

print(e.__next__())

print(e.__next__())

print(e.__next__())

上下的区别: 第一种是直接把包子都拿来,很占内存也就是很占咱们的位置,第二种使用生成器,想吃就拿一个.吃多少个包多少个.生成器是一个一个的,一直向下进行,不能向上.__next__()到哪,指针就指到哪儿.下一次继续就获取指针指向的值

对比显示:生成器的好处是节省内存

我们再来看一个和__next__类似的东西send()

send和__next__()一样都可以让生成器执行到下一个yield

def eat():
    for i in range(1,10000):
        a = yield '包子'+str(i)
        print('a is',a)

        b = yield '窝窝头'
        print('b is', b)
e = eat()
print(e.__next__())
print(e.send('大葱'))
print(e.send('大蒜'))

send是将括号中的内容传给了上一yield,然后yield接收的值就可以赋值给变量

send和__next__()区别:

send 和 next()都是让生成器向下走一次

send可以给上一个yield的位置传递值, 在第一次执行生成器的时候不能直接使用send(),但是可以使用send(None)

生成器可以for循环来循环获取内部元素:

def func():
    yield 1
    yield 2
    yield 3
    yield 4
    yield 5
f = func()
for i in f:
    print(i)

yield from

在python3中提供一种可以直接把可迭代对象中的每一个数据作为生成器的结果进行返回

def func():
    lst = ['卫龙','老冰棍','北冰洋','牛羊配']
    yield from lst
g = func()
for i in g:
    print(i)

小坑

有个小坑,yield from 是将列表中的每一个元素返回,所以 如果写两个yield from 并不会产生交替的效果

def func():
    lst1 = ['卫龙','老冰棍','北冰洋','牛羊配']
    lst2 = ['馒头','花卷','豆包','大饼']
    yield from lst1
    yield from lst2

g = func()
for i in g:
    print(i)

推导式

列表推导式

列表推导式,生成器表达式以及其他推导式,首先我们先看一下这样的代码,给出一个列表,通过循环,想列表中添加1~10:

li = []
for i in range(10):
    li.append(i)
print(li)

我们换成列表推导式是什么样的,来看看:

列表推导式的常⽤写法:

[结果 for 变量 in 可迭代对象]

ls = [i for i in range(10)]

print(ls)

列表推导式是通过⼀行来构建你要的列表, 列表推导式看起来代码简单. 但是出现错误之后很难排查.

例. 从python1期到python18期写入列表lst:

lst = ['python%s' % i for i in range(1,19)]
print(lst)

筛选模式

[结果 for 变量 in 可迭代对象 if 条件]

lst = [i for i in range(100) if i %2 == 0]
print(lst)

生成器推导式

生成器表达式和列表推导式的语法基本上一样的,只是把[]换成()

gen = (i for i in range(10))
print(gen)
# 结果: <generator object <genexpr> at 0x0000026046CAEBF8>

打印的结果就是一个生成器,我们可以使用for循环来循环这个生成器

gen = ("第%s次" % i for i in range(10))
for i in gen:
    print(i)

生成器表达式也可以进行筛选

# 获取1-100内能被3整除的数
gen = (i for i in range(1,100) if i % 3 == 0)
for num in gen:
    print(num)


# 100以内能被3整除的数的平⽅
gen = (i * i for i in range(100) if i % 3 == 0)
for num in gen:
    print(num)


# 寻找名字中带有两个e的人的名字
names = [['Tom', 'Billy', 'Jefferson', 'Andrew', 'Wesley', 'Steven', 'Joe'],
         ['Alice', 'Jill', 'Ana', 'Wendy', 'Jennifer', 'Sherry', 'Eva']]


# 不用推导式和表达式
result = []
for first in names:
    for name in first:
        if name.count("e") >= 2:
            result.append(name)
print(result)

# 推导式
gen = (name for first in names for name in first if name.count('e') >= 2)

for i in gen:
    print(i)

生成器表达式和列表推导式的区别:

1.列表推导式比较耗内存,一次性加载.生成器表达式几乎不占用内存.使用的时候才分配和使用内存

2.得到的值不一样,列表推导式得到的是一个列表.生成器表达式获取的是一个生成器

举个例子:

李大锤想吃鸡蛋就上街买了一篮子的鸡蛋放家里,吃的时候拿一个吃的时候拿一个,这样就是一个列表推导式,一次性拿够占地方.

王二麻子也想吃鸡蛋,他上街却买了一只母鸡回家.等他想吃的时候就让母鸡给下鸡蛋,这样就是一个生成器.需要就给你下鸡蛋

生成器的惰性机制: 生成器只有在访问的时候才取值,说白了.你找他要才给你值.不找他要.他是不会执行的.

def func():
    print(111)
    yield 222
g = func()  # 生成器g

g1 = (i for i in g) # 生成器g1. 但是g1的数据来源于g

g2 = (i for i in g1)    # 生成器g2. 来源g1

# list的底层有for循环,for就是一直执行__next__() 所以可以将生成器放到list中

print(list(g))   # 获取g中的数据. 这时func()才会被执行. 打印111.获取到222. g完毕.
print(list(g1))  # 获取g1中的数据. g1的数据来源是g. 但是g已经取完了. g1 也就没有数据了
print(list(g2))  # 和g1同理理

print(next(g))
print(next(g1))
print(next(g2))   # 可以用next来验证  其实list就是将内容迭代了转换成了列表

这是坑,一定要注意,生成器是要值的时候才能拿值,不然就没有啦

字典推导式

根据名字应该也能猜到,推到出来的是字典

lst1 = ['jay','jj','meet']
lst2 = ['周杰伦','林俊杰','郭宝元']
dic = {lst1[i]:lst2[i] for i in range(len(lst1))}
print(dic)

集合推导式

集合推导式可以帮我们直接生成一个集合,集合的特点;无序,不重复 所以集合推导式自带去重功能

lst = [1,2,3,-1,-3,-7,9]
s = {abs(i) for i in lst}
print(s)

总结:

​ 推导式有, 列表推导式, 字典推导式, 集合推导式, 没有元组推导式

​ 生成器表达式: (结果 for 变量量 in 可迭代对象 if 条件筛选)

​ 生成器表达式可以直接获取到⽣成器对象. ⽣成器对象可以直接进行for循环. ⽣成器具有惰性机制.

​ 集合推导式和字典推导式很是类似,记住一个小技巧能够快速区分那个是字典那个是集合

​ 字典推导式前面的结果是有个冒号,而集合的前面结果就是单纯的结果

微信打赏

作者: 以谁为师

最后更新: 2019年5月14日

原始链接: http://attacker.club/detail/118.html

转载本文请注明出处





    留言区:


    暂无评论