在 V2.3.0 版本 OCP 完成告警通道配置后,可对告警订阅进行设置。

操作步骤

  1. 登录 OCP。
  2. 单击左导航栏告警>告警订阅告警订阅.jpg
  3. 在默认的订阅列表界面可查看已订阅信息,并可对已有订阅信息进行查看、编辑、删除操作。
  4. 单击新建订阅,可进入新建订阅界面。

image.png

  • 订阅集群下拉列表中选择需要订阅的目标集群 。
  • 勾选告警项组,这里告警项组是 OCP 默认配置的不同角色关注的告警项集合,一般系统管理员或数据库管理员选择dba即可。OCP 有 4 个初始化分组,系统内建分组可以编辑,无法删除。

分组名称

分组描述

dba

数据库管理员关注的告警项

dev

开发者关注的告警项

oms

OMS应用管理员关注的告警项

backup

备份恢复管理员关注的告警项

  • 告警方式列表中针对不同的告警登记,选择不同的告警通道即可,推荐停服、严重两个级别勾选默认、短信、电话通道,其他级别只勾选钉钉短信通道即可。

不同告警等级列表如下:

级别英文含义中文含义颜色告警级别说明
1Down停服完全不可用,需要立即介入修复,如 OB服务启动失败,此类告警建议勾选全部告警通道,保证所有关注者道都能收到。
2Critical严重系统可用性下降,需要紧急修复,避免完全不可用, 如 机器内存使用率大于90%持续3分钟,此类告警建议勾选钉钉、短信通道,保证管理者用户能收到消息。
3Alert警告系统仍然可用,但是即将达到不可用状态,需要采取措施防止可用性下降, 如 OB租户连接数大于上限的80%,此类告警建议勾选钉钉或短信,引起订阅者关注即可。
4Caution注意

根据趋势判断,系统关键性能指标正在下降,但是还没达到触发警告的程度,此时可以通过排查发现潜在的问题,避免警告产生(保留类型,目前尚未有匹配的告警项),此类告警建议勾选钉钉即可。

5Info提醒绿

操作提醒,本质上不是告警,通常是管理员执行重要操作,如 管理员执行集群下线操作,此类告警一般勾选默认/钉钉通道即可。

  1. 选择完成后单击确定按钮,即订阅成功。
  2. 完成订阅后,可以在告警订阅**>个人接受设置**中,对不同告警通道的告警接受频率进行设置。

个人设置.jpg

  • 接受告警通知:此开关为消息接受总开关,关闭后订阅者将接收不到任何通道的告警消息,一般用作告警异常时暂时关闭告警接受消息来使用。
  • 接受恢复通知:默认 OCP 告警项发出告警后,当触发告警条件解除后,会默认发送一条告警恢复通知,关闭此开关后,订阅者将不会受到告警恢复通知;
  • 多个通道接受限制:可通过下拉列表中的不超过选项,配置每小时/每天接受告警次数,如某些提醒类告警发送频繁,可对此级别告警项告警通道进行限制配置。