1. stringIO, CStringIO
StringIO的行为与file对象非常像,但它不是磁盘上文件,而是一个内存里的“文件”,我们可以将操作磁盘文件那样来操作StringIO。
1 2 3 4 5 6 7 8 9 10 |
>>> s = StringIO.StringIO("hello world") >>> s.write("abcdefgn") >>> s.write('加油中国') >>> s.seek(0) >>> print s.read() abcdefg 加油中国 >>> s.seek(-4, 2) >>> print s.read() 中国 |
我们看到了StringIO的行为,基本与file一致。StringIO提供了一个方法,可以方便的获取其中的数据:StringIO.getvalue()。
如果使用read方法获取其中的数据,必须通过seek先设置”文件指针”的位置。
Python标准模块中还提供了一个CStringIO模块,它的行为与StringIO基本一致,但运行效率方面比StringIO更好。
但使用cStringIO模块时,有几个注意点:
1. CStringIO.StringIO不能作为基类被继承;
2. 创建cStringIO.StringIO对象时,如果初始化函数提供了初始化数据,新生成的对象是只读的。所以下面的代码是错误的:
s = cStringIO.StringIO(“JGood/n”);
s.write(“OOOKKK”);
2. module
模块是按照逻辑上组织Python代码的方法,那么文件爱你是物理层上组织代码的方法。因此一个文件可以被看作一个独立的模块。一个模块也可以被看作一个文件。
模块的文件名就是模块的名字加上扩展名.py。每个模块都定义了自己独立的名字空间。
模块的搜索路径:sys.path列表。像该列表加入自己的新模块路径即可:sys.path.append(“/home/luffy/pycode”)
三个名字空间:内建名字空间(__builtins__),局部名字空间和全局名字空间。最先加载的是内建空间,随后加载模块的全局名字空间。局部空间的内容是随时变化的(全局空间是不变的)。获得局部空间和全局空间的符号:globals()和locals()。
1 2 3 4 |
>>> globals() {'a': 1, 'lam': <function <lambda> at 0x01A687F0>, '__builtins__': <module '__bu iltin__' (built-in)>, '__package__': None, 'x': 99, 'y': 10, '__name__': '__main __', 'primes': <function <lambda> at 0x01A68830>, '__doc__': None} |
Python的一个有用的特性是你可以在任何需要房子数据的地方获得一个名字空间。所以给函数添加属性可以(例如添加version和__doc__属性等):
1 2 3 4 5 6 7 8 9 10 11 12 |
>>> a =1 >>> def f(): ... a = 2 ... print a ... >>> f() 2 >>> f.a=3 >>> f() 2 >>> print f.a 3 |
可以看出,局部变量和同一名字空间下的变量是不一样的。
—–习惯的import顺序—–
Python标准库模块
Python三方模块
应用程序自定义模块
—–from-import语句—–
把模块的名称引入到当前域.
但是from module import *的操作会污染当前作用域的名字空间,要谨慎shiyo
—–import xxx as yyy语句—–
import Tkinter as tk
—–引入时执行模块—–
加载模块会直接导致这个模块被执行。也就是被导入模块的顶层代码将直接被执行。
一个模块只会被加载一次,无论他被引入多少次。这可以组织多重导入时代码被多次执行。
—–模块名称重复—–
1 2 3 4 5 6 7 8 9 10 |
#importee.py foo = 'abc' def show() print 'importee %s'%foo #importer.py from importee import foo, show show() #abc foo='efg' print 'importee %s'%foo #是当前名字空间下的foo show() #还是show所在importee中的名字空间下的foo |
C:Usersluffy>python importer.py
importee abc
importee efg
importee abc
这种引入方法是和不好的,所以推荐使用import和白完整的标识符名称。
__import__()函数
__import__(module_name[, globals[, locals]])
reload()函数
重新导入模块。重新导入的模块需要的直接模块名而非字符串。
3. Package
包是一个有层次的文件目录结构,它定义了一个由模块和子包组成的Python应用程序执行环境。用户解决下面问题:
为平坦的名称空间加入有层次的组织结构;
把有联系的模块结合在一起(子包);
解决有冲突的模块名称;
使用目录结构而不是一大堆混乱的文件。
初始化包需要有有一个__init__.py文件,__init__.py的文件将会被执行。否则导致一个ImportWarning信息。
sys.modules变量包含了一个由当前载入(完整&成功)到解释器的模块组成的字典。模块名作为键,它们的位置作为值。
4. lambda函数
lambda函数是一种快速定义单行的最小函数,是从 Lisp 借用来的,可以用在任何需要函数的地方。常常和map,reduce,filter等函数中使用,例如阶层:
print reduce(lambda x,y:x*y, range(1, 1001))
自定义排序方法:
list_people=[People(21,’male’),People(20,’famale’),People(34,’male’),People(19,’famale’)]
list_people.sort(lambda p1,p2:cmp(p1.age,p2.age))
其他简写:
>>> arrayA = [1,2,3,4,5,6,7]
>>> arrayB = [ number for number in arrayA if number % 2 ]
>>>people_who_want_to_watch_av_film = [person1, person2, person3, person4]
然后,我们检查他们的年龄,产生能够观看的人员的列表,并打印出来:
>>> people_who_can_watch_av_film = [‘Hi, %s %s, you can watch av!’ % (person[‘surname’], person[‘givename’]) for person in people_who_want_to_watch_av_film if person[‘age’] >= 18]
lambda工厂式:
1 2 3 4 5 6 7 8 |
>>> def make_incrementor(n): ... return lambda x: x + n ... >>> f = make_incrementor(42) >>> f(0) 42 >>> f(1) 43 |
删除之中的偶数
1 2 3 4 5 6 7 8 9 10 |
>>> map(lambda x:x if x%2 else None,[x for x in range(100)])[1::2] 求素数 >>> primes = lambda n:[x for x in range(1,n) if not [y for y inrange(2,int(x**0.5 +1)) if x % y == 0]] >>> primes(500) [1, 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97, 101, 103, 107, 109, 113, 127, 131, 137, 139, 149, 151, 157, 163, 167, 173, 179, 181, 191, 193, 197, 199, 211, 223, 227, 229, 233, 239, 241, 251, 257, 263, 269, 271, 277, 281, 283, 293, 307, 311, 313, 317, 331, 337, 347, 349, 353, 359, 367, 373, 379, 383, 389, 397, 401, 409, 419, 421, 431, 433, 439, 443, 449, 457, 461, 463, 467, 479, 487, 491, 499] |
5. class & magic method
(1). __init__ & __del__
1 2 3 4 5 6 7 |
class Simple: def __init__( self[, other_parameter]): pass def __del__( self): pass def func( self ): pass |
(2). __str__和__unicode__
__str__() is a Python “magic method” that defines what should be returned if you call str() on the object. Thus, you should always return a nice, human-readable string for the object’s __str__. Although this isn’t required, it’s strongly encouraged.
1 2 3 4 5 6 |
class Person(): def __init__(self, name): self.name = name def __str__(self): return 'name is %s' % self.name print Person('luffy') |
__unicode__(self)同理,调用buildin函数unicode(obj)时调用。
__repr__(self)同理,输出更详细的类型信息
(3). 私有机制
python对象没有权限控制,所有的变量都是外部可以调用的。但是程序员只有一些约定俗成的方法:私有变量加双下划线。如__name。
(4). __iter__
buildin函数iter
i1 = iter(itr, ‘c’)
这个意思是说,返回itr的iterator,而且在之后的迭代之中,迭代出来’c’就立马停止。对这个itr有什么要求呢?这个itr在这里必须是callable的,即要实现__call__函数
i1 = iter(itr)
这里itr必须实现__iter__函数,这个函数的返回值必须返回一个iterator对象
1 2 3 4 5 6 7 8 9 10 11 12 |
class Itr(object): def __init__(self): self.result = ['a', 'b', 'c', 'd'] self.i = iter(self.result) def __call__(self): res = next(self.i) print("__call__ called, which would return ", res) return res def __iter__(self): print("__iter__ called") return iter(self.result) itr = Itr() |
# i1必须是callable的,否则无法返回callable-iterator
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 |
i1 = iter(itr, 'c') print("i1 = ", i1) ('i1 = ', <callable-iterator object at 0x01ACE9D0>) # i2只需要类实现__iter__函数即可返回 i2 = iter(itr) #此时i2只是一个可迭代的list对象 __iter__ called print("i2 = ", i2) ('i2 = ', <listiterator object at 0x01ACEA30>) for i in i1: print(i) >>> for i in i1: ... print i ... ('__call__ called, which would return ', 'a') a ('__call__ called, which would return ', 'b') b ('__call__ called, which would return ', 'c') >>> for i in i2: ... print i ... a b c d |
(5). super()
调用父类的方法:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 |
>>> class A: ... def __init__(self): ... print 'enter A init1' ... print 'enter A init2' ... def __del__(self): ... print "leave A" ... >>> class B(A): ... def __init__(self): ... print "enter B init 1" ... #A.__init__(self) or super(A, self) ... print "enter B init 2" ... def __del__(self): ... print "leave B" ... >>> B() enter B init 1 enter B init 2 leave B <__main__.B instance at 0x01B16300> |
这里我们发现python的继承不会自动调用父类的构造器/析构器,必须亲自调用它。
1. super并不是一个函数,是一个类名,形如super(B, self)事实上调用了super类的初始化函数,产生了一个super对象;
2. super类的初始化函数并没有做什么特殊的操作,只是简单记录了类类型和具体实例;
3. super(B, self).func的调用并不是用于调用当前类的父类的func函数;
4. Python的多继承类是通过mro的方式来保证各个父类的函数被逐一调用,而且保证每个父类函数只调用一次(如果每个类都使用super);
5. 混用super类和非绑定的函数是一个危险行为,这可能导致应该调用的父类函数没有调用或者一个父类函数被调用多次。
(6). 函数的名称,doc_string
func_doc The function’s documentation string, or None if unavailable Writable
__doc__ Another way of spelling func_doc Writable
func_name The function’s name Writable
__name__ Another way of spelling func_name Writabl
(7). magic method
object.__lt__(self, other)
object.__le__(self, other)
object.__eq__(self, other)
object.__ne__(self, other)
object.__gt__(self, other)
object.__ge__(self, other)
object.__cmp__(self, other) #Called by comparison operations if rich comparison (see above) is not defined. Should return a negative integer if self
object.__hash__(self) #Called by built-in function hash()
If a class does not define a __cmp__() or __eq__() method it should not define a __hash__() operation either;
if it defines__cmp__() or __eq__() but not __hash__(), its instances will not be usable in hashed collections.
If a class defines mutable objects and implements a __cmp__() or __eq__() method, it should not implement __hash__(),
since hashable collection implementations require that a object’s hash value is immutable
(if the object’s hash value changes, it will be in the wrong hash bucket).