告警消息 —— 工作负载级别

告警消息记录了在工作负载级别的告警策略中,所有已发出的满足告警规则的告警信息。在 告警策略 —— 工作负载级别 这篇文档中,演示了创建一个工作负载级别的告警策略并发送邮件通知,同时所有平台发出的告警消息都已经记录在了告警消息列表中,管理员可以进一步查看告警详情、监控指标、告警策略、最近通知和处理意见等详细信息。

前提条件

已创建了告警策略并收到了告警消息,若还未创建请参考 告警策略 —— 工作负载级别

查看告警消息

  • 以项目普通用户 project-regular 账号登录 KubeSphere,进入示例项目 demo-namespace,选择 「监控告警」→ 「告警消息」,

  • 点击 「告警消息」,在告警消息列表中查看全部的告警消息。由于我们在告警策略的示例中设置的监控对象为 reviews-v1 和 details-v1,并且这两个示例工作负载的内存用量都大于告警的阈值 20 MiB,因此在告警消息列表中看到了 2 条与监控目标对应的告警消息。

告警消息 - 工作负载级别 - 图1

  • 点击其中一条告警消息进入详情页,在告警详情中查看被监控工作负载的内存用量,可以看到在最近一段时间内监控对象的内存用量持续高于设定的阈值 20 MiB,因此触发了告警。告警消息 - 工作负载级别 - 图2

查看告警策略

切换到 「告警策略」 查看本条告警消息对应的告警策略,可以看到该工作负载告警策略的触发规则正是在上一篇工作负载告警策略示例中设定的。

告警消息 - 工作负载级别 - 图3

查看最近通知

点击 「最近通知」 即可看到当前的通知人已收到了 3 条告警通知,因为当前监控工作负载的告警指标 (内存用量) 连续 2 次超过了阈值,通知规则设置的是 每 5 分钟警告一次,最多重发 3 次

告警消息 - 工作负载级别 - 图4

验证邮件通知

登录通知邮箱即可看到 KubeSphere 的邮件服务器给通知人发送的告警消息。示例邮箱先后一共收到了 6 封邮件,这是因为告警目标设置的 2 个工作负载 (部署) 内存利用率都 连续 2 次 超过了阈值 20 MiB,并且告警的通知规则设置的是 每 5 分钟警告一次,最多重发 3 次

添加处理意见

点击 「处理意见」 可以对当前告警进行处理,添加意见信息。例如,由于当前告警工作负载的内存用量高于阈值,所以我们可以在处理意见的窗口中添加一条信息:需要对该部署提高默认的最大内存使用的配额

告警消息 - 工作负载级别 - 图5