健康检查

我们可以在集群级别为网关开启健康检查。

开启健康检查后,edge-admin 会按照配置,向 edge-node 发起检查请求, 如果不符合预期,则认为该 node 不健康。

注意:需要 edge-admin 到 edge-node 的网络是通畅的,才可以开启健康检查,否则会因为网络不通,node 节点会被 admin 认为是不健康。

开启网关集群健康检查

我们首先点击进入网关节点页面,里面列出了已经存在的网关集群:

健康检查 - 图1

我们点击一个网关集群的 编辑按钮,可以看到有一个健康检查的开关

健康检查 - 图2

开启健康检查之后,我们进一步配置健康检查的参数:

Edge 支持三种健康检查模式:

  1. tcp
  2. http
  3. https

意味着 edge admin 会向 edge node 发送

  1. tcp connection
  2. http 请求
  3. https 请求

对于 tcp 检查模式,只需要 tcp 连接成功,就认为 node 是健康的。 对于 http/https 模式,还可以配置期望的期望的响应状态码,或者响应体需要包含的字符串模式。

健康检查 - 图3

点击保存,就会开启健康检查。

健康检查 - 图4

当某个网关节点连续检查不健康的次数达到配置的阈值, Edge 会自动将该节点标记为 “离线” 状态((此时在界面上,节点 IP 前的绿色指示灯会变成红色)。 意味着:该节点会自动从 DNS 和 集群内缓存服务中剔除。

健康检查 - 图5

我们还可以查看健康检查的具体日志:

健康检查 - 图6

这里可以每个 node 节点最近的检查成功/失败次数,以及失败的原因。

健康检查 - 图7