Python中字典合并的多种方法

Blog Content

Python 2017-01-21 10:15:22

两个字典如下：

    >>> d1 = {'name' : 'revotu', 'age' : 99}
    >>> d2 = {'age' : 24, 'sex' : 'male'}

合并后的结果如下（即，key相同时后面字典值覆盖前面字典）：

    >>> d
    {'sex': 'male', 'name': 'revotu', 'age': 24}

首先，说明字典并不支持+加法运算：

    >>> d1 + d2
    Traceback (most recent call last):
      File "", line 1, in
    TypeError: unsupported operand type(s) for +: 'dict' and 'dict'
    >>>

现总结如下几种方法以及简要分析比较。

    多次更新
    下面是最简单的合并字典的方式：

    >>> d = {}
    >>> d.update(d1)
    >>> d.update(d2)

    首先创建一个空字典，并使用update方法向字典中添加元素。注意，先添加的是d1，以保证后面添加的d2重复键会覆盖d1。
    此方法满足了我们的要求，而且清晰明确，可是三行代码总感觉不够Pythonic。

    先复制，后更新
    先复制d1字典创建一个新字典，然后使用d2来更新前面创建的新字典。

    >>> d = d1.copy()
    >>> d.update(d2)

    对比方法一，这种复制d1的方法，更明显的表现出d1作为默认值。

    字典构造器
    还可以使用字典的构造器dict()复制字典，然后再更新：

    >>> d = dict(d1)
    >>> d.update(d2)

    与方法二很相似，但是没有方法二直接明了。

    关键字参数hack
    你可能见过下面这个巧妙的解决办法：

    >>> d = dict(d1 , **d2)

只有一行代码，看上去很酷，但是有一个问题，这种hack技巧只有在字典的键是字符串时才有效。

    看上去很cool，但是不通用，字典的键必须是字符串才可以用这种关键字参数方法。

    字典推导式
    可以用字典推导式解决此问题：

    >>> d = {k:v for d in [d1, d2] for k,v in d.items()}

    字典推导式方法满足要求，只是嵌套的字典推导式，不那么清晰，不易于理解。

    元素拼接
    我们从每个字典中获取一个元素列表，将列表拼接起来，然后再用拼接的列表构造字典：

    >>> d = dict(list(d1.items()) + list(d2.items()))

    而且，d2的元素在列表后面，所以在键重复时可以覆盖d1。如果在Python2中，items()方法本身返回的就是列表，无需用list()转成列表。

元素拼接在构造字典可以满足要求，只是看上去代码有些重复。

    元素并集
    在Python3中，字典返回的是视图对象，键的视图对象是一个类似集合的对象，如果字典中的值可以保证是唯一的可哈希的，此时items返回的视图对象也是一个类似集合的对象：
    >>> d = dict(d1.items() | d2.items())

    这种方法挺有意思，可是并不准确，因为集合是无序的，键重复时不能保证谁覆盖谁，而且字典中的值通常也是不可哈希的，当然也就不能返回一个类似集合的对象。

    chain items
    目前为止，我们讨论的解决方案中，最符合Python语言习惯而且只有一行代码实现的，是创建两个items的列表，然后拼接成字典。
    我们可以用itertools.chain来简化items拼接过程：
    >>> d = dict(chain(d1.items(), d2.items()))

    这种方案很不错，可能比另外创建两个不必要的列表更高效。

    ChainMap
    collections.ChainMap可以将多个字典或映射，在逻辑上将它们合并为一个单独的映射结构：

    >>> d = dict(ChainMap(d1, d2))

    这种方法也很pythonic，而且也是通用方法。

    字典拆分
    在Python3.5+中，可以使用一种全新的字典合并方式：
    >>> d = {**d1, **d2}

    这行代码很pythonic，如果是你的python版本是3.5+，用这种方法是很不错的选择。

总结

上面说了十种可以合并两个字典成一个新字典的方式，具体用哪个取决于你。
如果使用的是Python3.5+的版本，那么字典拆分这种新语法应该很适合你：

>>> d = {**d1, **d2}

上一篇：python里对浮点数变量判断是否相等equal，不可以直接用==
下一篇：Python判断字符串是否为字母或者数字(浮点数)

One - One Code All

Blog Content

Python中字典合并的多种方法

The minute you think of giving up, think of the reason why you held on so long.