One - One Code All

Blog Content

Python中字典合并的多种方法

Python   2017-01-21 10:15:22

两个字典如下:

    >>> d1 = {'name' : 'revotu', 'age' : 99}
    >>> d2 = {'age' : 24, 'sex' : 'male'}

合并后的结果如下(即,key相同时后面字典值覆盖前面字典):

    >>> d
    {'sex': 'male', 'name': 'revotu', 'age': 24}

首先,说明字典并不支持+加法运算:

    >>> d1 + d2
    Traceback (most recent call last):
      File "", line 1, in
    TypeError: unsupported operand type(s) for +: 'dict' and 'dict'
    >>>

现总结如下几种方法以及简要分析比较。

    多次更新
    下面是最简单的合并字典的方式:

    >>> d = {}
    >>> d.update(d1)
    >>> d.update(d2)

    首先创建一个空字典,并使用update方法向字典中添加元素。注意,先添加的是d1,以保证后面添加的d2重复键会覆盖d1。
    此方法满足了我们的要求,而且清晰明确,可是三行代码总感觉不够Pythonic。

    先复制,后更新
    先复制d1字典创建一个新字典,然后使用d2来更新前面创建的新字典。

    >>> d = d1.copy()
    >>> d.update(d2)

    对比方法一,这种复制d1的方法,更明显的表现出d1作为默认值。

    字典构造器
    还可以使用字典的构造器dict()复制字典,然后再更新:

    >>> d = dict(d1)
    >>> d.update(d2)

    与方法二很相似,但是没有方法二直接明了。

    关键字参数hack
    你可能见过下面这个巧妙的解决办法:

    >>> d = dict(d1 , **d2)

只有一行代码,看上去很酷,但是有一个问题,这种hack技巧只有在字典的键是字符串时才有效。

    看上去很cool,但是不通用,字典的键必须是字符串才可以用这种关键字参数方法。

    字典推导式
    可以用字典推导式解决此问题:

    >>> d = {k:v for d in [d1, d2] for k,v in d.items()}

    字典推导式方法满足要求,只是嵌套的字典推导式,不那么清晰,不易于理解。

    元素拼接
    我们从每个字典中获取一个元素列表,将列表拼接起来,然后再用拼接的列表构造字典:

    >>> d = dict(list(d1.items()) + list(d2.items()))

    而且,d2的元素在列表后面,所以在键重复时可以覆盖d1。如果在Python2中,items()方法本身返回的就是列表,无需用list()转成列表。

元素拼接在构造字典可以满足要求,只是看上去代码有些重复。

    元素并集
    在Python3中,字典返回的是视图对象,键的视图对象是一个类似集合的对象,如果字典中的值可以保证是唯一的可哈希的,此时items返回的视图对象也是一个类似集合的对象:
    >>> d = dict(d1.items() | d2.items())

    这种方法挺有意思,可是并不准确,因为集合是无序的,键重复时不能保证谁覆盖谁,而且字典中的值通常也是不可哈希的,当然也就不能返回一个类似集合的对象。

    chain items
    目前为止,我们讨论的解决方案中,最符合Python语言习惯而且只有一行代码实现的,是创建两个items的列表,然后拼接成字典。
    我们可以用itertools.chain来简化items拼接过程:
    >>> d = dict(chain(d1.items(), d2.items()))

    这种方案很不错,可能比另外创建两个不必要的列表更高效。

    ChainMap
    collections.ChainMap可以将多个字典或映射,在逻辑上将它们合并为一个单独的映射结构:

    >>> d = dict(ChainMap(d1, d2))

    这种方法也很pythonic,而且也是通用方法。

    字典拆分
    在Python3.5+中,可以使用一种全新的字典合并方式:
    >>> d = {**d1, **d2}

    这行代码很pythonic,如果是你的python版本是3.5+,用这种方法是很不错的选择。

总结

上面说了十种可以合并两个字典成一个新字典的方式,具体用哪个取决于你。
如果使用的是Python3.5+的版本,那么字典拆分这种新语法应该很适合你:

>>> d = {**d1, **d2}


上一篇:python里对浮点数变量判断是否相等equal,不可以直接用==
下一篇:Python判断字符串是否为字母或者数字(浮点数)

The minute you think of giving up, think of the reason why you held on so long.