本文介绍创建告警策略后,告警触发、执行和恢复的详细流程。
例如,用户在告警策略中配置的告警触发条件为:
如下图所示,原始值以30s为上报周期,告警检测每分钟执行一次,告警检测时取过去1min的原始值应用max、avg、min聚合计算得到相应的最大值、平均值及最小值。
例如12:06的平均值由12:05:30和12:06:00两个点求平均得到,最大值、最小值计算方式以此类推。
告警流程详情如下:
触发条件 | 计算指标 | 告警检测时间 | 告警恢复 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
12:04 | 12:05 | 12:06 | 12:07 | 12:08 | 12:09 | 12:10 | 12:11 | ··· | 12:15 | |||
磁盘读写带宽持续1个周期,最大值大于58MiB/s | 最大值 | 未超过阈值 | 超过阈值,触发告警 | 指标一直高于阈值,告警未恢复 | ||||||||
磁盘读写带宽持续1个周期,平均值大于58MiB/s | 平均值 | 未超过阈值 | 超过阈值,触发告警 | 低于阈值 | 连续5个周期没有告警,告警恢复 | 12:15按照配置方式进发送恢复通知 | ||||||
磁盘读写带宽持续1个周期,最小值大于58MiB/s | 最小值 | 未超过阈值 | 未触发告警 |
例如,用户在告警策略中配置的告警触发条件为:
如下图所示,原始值以30s为上报周期,告警每分钟检测一次,告警检测时取当前周期(过去1min)的原始值应用avg聚合计算得到平均值,再与前一个周期的平均值计算环比。
告警流程详情如下:
触发条件 | 计算指标 | 告警检测时间 | 告警恢复 | ||||||
---|---|---|---|---|---|---|---|---|---|
12:04 | 12:05 | 12:06 | 12:07 | 12:08 | ... | 12:12 | |||
磁盘读写带宽平均值持续3个周期,环比上升/下降10%。 | 平均值环比 | 指标满足告警阈值,但未满足连续3个周期,不触发告警 | 指标满足告警阈值,且满足连续3个周期,触发告警 | 不满足告警阈值 | 连续五个周期未触发告警,告警恢复 | 按照配置方式发送恢复通知 |
环比 = (第n个周期 - 第n-1个周期)/第n-1个周期
n-1个周期的数据 | n个周期的数据 | 说明 |
---|---|---|
0 | 不为0 | 环比变化无限大,大于任何阈值设定。本周期触发条件。 |
无上报 | 无上报或上报任意值 | 无法计算环比。本周期未达到触发条件。 |
无上报或上报任意值 | 无上报 | 无法计算环比。本周期未达到触发条件。 |
n | 0 | 环比=-1=-100%。本周期未达到触发条件。 |
0 | 0 | 环比无变化。本周期未达到触发条件。 |
同比昨天 = (当前相同周期 - 昨天相同周期)/昨天相同周期
同比上周 = (当前相同周期 - 上周相同周期)/上周相同周期
昨天相同周期/上周相同周期/上一周期的数据 | 当前周期的数据 | 说明 |
---|---|---|
0 | 不为0 | 同比变化无限大,大于任何阈值设定。本周期触发条件。 |
无上报 | 无上报或上报任意值 | 无法计算同比。本周期未达到触发条件。 |
无上报或上报任意值 | 无上报 | 无法计算同比。本周期未达到触发条件。 |
n | 0 | 同比=-1=-100%。本周期未达到触发条件。 |
0 | 0 | 同比无变化。本周期未达到触发条件。 |