1.20 合并多个字典或映射

问题

现在有多个字典或者映射,你想将它们从逻辑上合并为一个单一的映射后执行某些操作,比如查找值或者检查某些键是否存在。

解决方案

假如你有如下两个字典:

  1. a = {'x': 1, 'z': 3 }
  2. b = {'y': 2, 'z': 4 }

现在假设你必须在两个字典中执行查找操作(比如先从 a 中找,如果找不到再在 b 中找)。一个非常简单的解决方案就是使用 collections 模块中的 ChainMap 类。比如:

  1. from collections import ChainMap
  2. c = ChainMap(a,b)
  3. print(c['x']) # Outputs 1 (from a)
  4. print(c['y']) # Outputs 2 (from b)
  5. print(c['z']) # Outputs 3 (from a)

讨论

一个 ChainMap 接受多个字典并将它们在逻辑上变为一个字典。然后,这些字典并不是真的合并在一起了, ChainMap 类只是在内部创建了一个容纳这些字典的列表并重新定义了一些常见的字典操作来遍历这个列表。大部分字典操作都是可以正常使用的,比如:

  1. >>> len(c)
  2. 3
  3. >>> list(c.keys())
  4. ['x', 'y', 'z']
  5. >>> list(c.values())
  6. [1, 2, 3]
  7. >>>

如果出现重复键,那么第一次出现的映射值会被返回。因此,例子程序中的 c['z'] 总是会返回字典 a 中对应的值,而不是 b 中对应的值。

对于字典的更新或删除操作总是影响的是列表中第一个字典。比如:

  1. >>> c['z'] = 10
  2. >>> c['w'] = 40
  3. >>> del c['x']
  4. >>> a
  5. {'w': 40, 'z': 10}
  6. >>> del c['y']
  7. Traceback (most recent call last):
  8. ...
  9. KeyError: "Key not found in the first mapping: 'y'"
  10. >>>

ChainMap 对于编程语言中的作用范围变量(比如 globals , locals 等)是非常有用的。事实上,有一些方法可以使它变得简单:

  1. >>> values = ChainMap()
  2. >>> values['x'] = 1
  3. >>> # Add a new mapping
  4. >>> values = values.new_child()
  5. >>> values['x'] = 2
  6. >>> # Add a new mapping
  7. >>> values = values.new_child()
  8. >>> values['x'] = 3
  9. >>> values
  10. ChainMap({'x': 3}, {'x': 2}, {'x': 1})
  11. >>> values['x']
  12. 3
  13. >>> # Discard last mapping
  14. >>> values = values.parents
  15. >>> values['x']
  16. 2
  17. >>> # Discard last mapping
  18. >>> values = values.parents
  19. >>> values['x']
  20. 1
  21. >>> values
  22. ChainMap({'x': 1})
  23. >>>

作为 ChainMap 的替代,你可能会考虑使用 update() 方法将两个字典合并。比如:

  1. >>> a = {'x': 1, 'z': 3 }
  2. >>> b = {'y': 2, 'z': 4 }
  3. >>> merged = dict(b)
  4. >>> merged.update(a)
  5. >>> merged['x']
  6. 1
  7. >>> merged['y']
  8. 2
  9. >>> merged['z']
  10. 3
  11. >>>

这样也能行得通,但是它需要你创建一个完全不同的字典对象(或者是破坏现有字典结构)。同时,如果原字典做了更新,这种改变不会反应到新的合并字典中去。比如:

  1. >>> a['x'] = 13
  2. >>> merged['x']
  3. 1

ChainMap 使用原来的字典,它自己不创建新的字典。所以它并不会产生上面所说的结果,比如:

  1. >>> a = {'x': 1, 'z': 3 }
  2. >>> b = {'y': 2, 'z': 4 }
  3. >>> merged = ChainMap(a, b)
  4. >>> merged['x']
  5. 1
  6. >>> a['x'] = 42
  7. >>> merged['x'] # Notice change to merged dicts
  8. 42
  9. >>>

原文:

http://python3-cookbook.readthedocs.io/zh_CN/latest/c01/p20_combine_multiple_map_to_single_map.html