云拨测告警基于多维度、多指标、智能基线对拨测任务进行实时异常检测,提供多种告警规则配置,您可以灵活调整、组合设置告警规则,通过云拨测告警管理,实现告警信息多渠道通知,确保及时发现并修复线上故障。
前提条件
- 已创建拨测任务,并且 任务状态 为 运行中。具体操作,请参考创建拨测任务。
- 已配置告警通知对象和通知方式。具体操作,请参考报警通知对象。
操作步骤
登录云拨测控制台。
在左侧菜单栏选择 告警管理 > 告警列表。在 告警列表 页面单击 创建告警。
在 创建告警 页面,配置告警参数。
基本信息
参数 | 描述 |
---|
告警名称 | 您创建的告警的名称。支持 UTF-8 编码,不能超过 256 个字符。 |
任务类型 | 告警所关联的拨测任务类型。 |
任务选择 | 您可以选择任务或任务组。 - 任务:从下拉菜单中选择一个任务。
- 任务组:从下拉菜单中选择一个任务组。同一个告警只能关联使用相同拨测方式的任务。因此,您需要在 拨测方式 中选择任务所使用的拨测方式作为筛选条件。
|
拨测方式 | 任务所使用的拨测方式。只有您把 任务选择 设置为 任务组 时,该参数才会出现。 |
告警规则
参数 | 描述 |
---|
告警类型 | - 自定义告警:您通过 告警条件 参数设置告警条件。
- 智能告警:云拨测自动设置动态告警条件。
|
数据过滤 | 筛选出符合条件的拨测数据进行告警检测。
例如,当您需要针对特定省份的运营商设置告警阈值时,可以通过数据过滤来实现。单击 添加过滤,选择 客户端省份 包含 "山西",且 客户端运营商 包含 "中国移动"。 说明 如果创建任务后立即创建告警,在进行数据过滤时维度值下拉框可能为空。这是因为此时拨测任务还没有产生数据。您可以选择手动输入所需的维度值。 |
数据分组 | 通过设置分组,聚合告警数据进行告警。
例如,当您需要每个省份每个运营商分别进行告警检测,可以选择按 客户端省份 和 客户端运营商 来分组。当触发告警时,系统会分别检测"山西-中国移动"和"山东-中国移动"的数据,分别进行告警。 |
告警条件 | 仅在 告警类型 设置为 自定义告警 时,该参数才会出现。 - 当满足 任一 或 所有 监控指标判断条件时,将会触发告警:
- 任一:只要满足了任意一个监控指标判断条件,就会触发告警。
- 所有:只有满足了所有监控指标判断条件时,才会触发告警。
- 监控指标:触发告警的监控指标。您可以在下拉菜单中选择监控指标。一次最多只能选择 5 个。选择完成后,您可以分别设置对应指标 普通告警 和 严重告警 的阈值。请参见告警监控指标了解健康指标的具体定义。
说明 - 普通告警的阈值不能大于严重告警的阈值。
- 支持自定义设置指标普通告警和严重告警的阈值比较方式。可选的比较方式包括:
- 大于(>)
- 大于等于(>=)
- 小于(<)
- 小于等于(<=)
|
监控指标 | 触发告警的监控指标。仅支持 可用率。参见 告警监控指标了解健康指标的具体定义。
仅在 告警类型 设置为 智能告警 时,该参数才会出现。 |
监控周期 | 选择一个监控周期,并设置触发告警的监控周期检查策略。 |
数据查询窗口 | 选择用于数据查询的监控周期的数量。例如,当查询窗口为 5 时,将查询最近 5 个监控周期数据并取平均值。
仅在 告警类型 设置为 自定义告警 时,该参数才会出现。 |
告警规则预览 | 根据您设置的监控指标和监控周期自动生成的预览信息。
仅在 告警类型 设置为 自定义告警 时,该参数才会出现。 |
通知规则
参数 | 描述 |
---|
联系人 | 云拨测告警支持发送告警通知到指定联系人。 - 选择联系人:
- 从下拉列表选择告警通知接收联系人。
- 在列表中可以看到当前联系人可用的接收告警方式(邮箱或短信),如果需要修改联系人相关信息,可以单击其后的修改按钮。
- 单击 创建联系人 可以新建联系人,具体操作,请参考创建联系人。
- 严重告警渠道:支持 邮件 或 短信。
- 普通告警渠道:支持 邮件 或 短信。
|
团队 | 云拨测告警支持发送告警通知到团队。 - 选择团队:
- 从下拉列表选择告警通知接收的团队。
- 在列表中可以看到当前团队可用的接收告警方式(飞书、钉钉或企业微信),如果需要修改团队相关信息,可以单击其后的修改按钮。
- 单击 创建团队 可以创建新的团队。具体操作,请参考创建团队。
- 通知方式:严重告警与普通告警为统一方式,支持 飞书 、钉钉 和 企业微信。
|
系统集成 | 云拨测告警支持发送告警通知到自定义对接系统。 - 从下拉列表选择告警通知接收的系统。
- 在列表中可以看到当前系统的回调URL,如果需要修改系统相关信息,可以单击其后的修改按钮。
- 单击 创建系统 可以创建新的系统集成。具体操作,请参考系统集成。
- 通知方式:严重告警与普通告警为统一通知方式。
|
聚合通知 | 开启后,如果 1 分钟内触发多次告警,云拨测把 1 分钟内的全部告警通知聚合为 2 条告警通知。 - 第 1 条通知是该分钟内产生的第 1 个告警的明细。该通知的告警等级为该告警的等级。
- 第 2 条通知是该分钟内产生的所有告警的汇总。该通知的告警等级为普通告警。
|
通知降频 | 开启后,如果一个告警连续重复触发,告警通知间隔会逐步递增至 5 分钟、10 分钟、30 分钟、1 小时、3 小时、6 小时、12 小时、24 小时。
例如,告警通知间隔为 30 秒,则第二次触发时通知间隔增加至 5 分钟,第三次 10 分钟,第四次 30 分钟。 |
通知时间 | 发送告警通知的时间范围。 |
参数配置完成后,单击 创建告警。您可以在 告警列表 页面看到您创建的告警,状态为 已启用。