Python 魔术方法

2018/05/16 16:49 pm posted in  Python 黑魔法

魔术方法是 Python 类中那些定义名称类似 __XXX__ 的函数,使用 Python 的魔术方法的优势在于可以使用 Python 提供的内置方法,比如 len()str(),或者重载运算符,让自定义对象类型可以表现得像内置类型一样。

Python 语言参考手册中一共列出了 83 个特殊方法的名字,其中 47 个用于实现算术运算、位运算和比较操作,概览如下。

跟运算符无关的特殊方法:

跟运算符相关的特殊方法:

有一份文档详细的介绍了所有的魔术方法的使用方式,本文只整理了常用魔术方法以及常见的坑。 文档见: http://pycoders-weekly-chinese.readthedocs.io/en/latest/issue6/a-guide-to-pythons-magic-methods.html

构造与析构

Python 对象通过 __init__ 进行初始化,但是在执行 __init__ 之前,首先被执行的是 __new__ 函数。在初始化一个对象时,会先调用 __new__ 方法,该方法是一个类方法,执行完相关逻辑之后调用 __init__ 并将初始化参数传递给后者。

__del__ 函数是 Python 对象的析构函数,无论是垃圾回收还是手动删除,都是执行这个方法:

class Model(object):
    def __init__(self):
        print("Run: __init__")

    def __del__(self):
        print("Run: __del__")


if __name__ == "__main__":
    m = Model()
    del m

结果:

Run: __init__
Run: __del__

打印

在 Python 魔术方法中,有两个和打印有关,__repr____str__

如果在 Python 直接打印一个类,将会获得一个内存地址:

<__main__.Model object at 0x10408fda0>

如果在解释器中想获得一个更友好的显示,__repr__ 是一个非常好的选择。另外,在不把 object 当做字符串处理的场合,也是会使用该方法。

而在把 object 当做字符串处理或者转换为字符串的场合,比如 print(object)"{}".format(object)str(object) 等,__str__ 将会被使用。

class Model(object):
    def __init__(self):
        self.id = uuid.uuid4()
        self.content = "fluent python demo"

    def __str__(self):
        return self.content

    def __repr__(self):
        return "<Model: {}>".format(self.id)

一般在 __str__ 中展现更人性化的信息,可能直接返回给用户;而 __repr__ 更多为了在调试中使用方便(解释器中等)。

另外,如果 __str__ 没有定义,那么将会直接使用 __repr__ 方法,因此如果不需要太多差别,只定义后者即可。

数组与字典

如果需要定义一个类似列表的自定义类,为了支持通过下标访问,可以覆写 __getitem__

class Model(object):
    def __init__(self):
        self.content = [r for r in range(0, 3)]

    def __getitem__(self, item):
        return self.content[item]

该类从此支持了下标访问,并且还支持切片,排序等 Python 内置方法:

if __name__ == "__main__":
    m = Model()
    print(m[1:], sorted(m, reverse=True))

结果:

[1, 2] [2, 1, 0]

对于赋值操作,只需要覆写 __setitem__ 方法:

def __setitem__(self, key, value):
    self.content[key] = value

同理,对于将自定义对象进行类似字典的操作,可以这样实现:

class Model(object):
    def __init__(self):
        self.content = {
            "key": "value"
        }

    def __getitem__(self, item):
        return self.content[item]

    def __setitem__(self, key, value):
        self.content[key] = value

类成员变量

类成员方法 __getattr____getattribute____setattr__ 是三个方便且危险的方法,可以用来定义类成员属性,前两个是用来获取,最后一个是用来赋值。

前两个的区别是 __getattribute__ 会被首先调用,只有 __getattribute__ 找不到的时候,才会调用 __getattr__

因为本身的类属性操作也是基于这几个方法,因此在覆写时应该避免循环调用最后栈溢出。

总结

简单讲了几种常见的魔术方法,魔术方法可以使得自定义类型支持 Python 原生、内置方法,因而使得代码风格更加简洁和一致。但是,也容易写出难以调试的魔法代码,简洁(或者说 geek)和可维护性可能本身就是两个极端,在使用魔术方法时还需要考虑后继维护者是否能理解自己的行为。