分区故障域感知

ENTERPRISE

了解故障域

概述

故障域是网络的一部分(例如数据中心的机架或整个数据中心),该部分容易在关键设备或系统出现故障时遭到损坏。故障域中的所有实例都有类似的故障和延迟特性。相同故障域中的实例都受到域内故障事件的影响。在多个故障域中放置实例可降低故障影响所有实例的风险。

DC/OS 现在支持树立故障域感知。利用故障域感知使服务高度可用,并能在需要时增加容量。

DC/OS 目前支持 Mesos 的 2 级分层故障域:分区和分域。

分区故障域

分区故障域提供中度故障隔离,因为他们共用同一分域。然而,同一分域内分区之间的网络延迟较低(通常 < 10ms)。

对于本地部署而言,一个分区就是一个实体数据中心机架。

对于公共云部署而言,分区就是大多数云提供商规定的“可用区”概念。

如果您的目标是高可用性,且/或您的服务具有延迟敏感性,请将您的实例放在同一个分域,并将它们均衡分配到各个分区。

分域故障域

分域故障域提供最高故障隔离,尽管分域间网络延迟较高。

对于本地部署而言,一个分域可能是一个数据中心。

对于公共云部署而言,大多数云提供商都会提出“分域”概念。

可以根据可用容量在特定分域部署实例。