You need to enable JavaScript to run this app.
导航
创建告警策略
最近更新时间:2024.11.29 10:46:36首次发布时间:2021.07.09 13:29:13

如果您需要监控某一云产品资源的数据状态,则可以创建云监控告警策略。当被监控的云产品资源数据达到告警的触发条件时,系统会通过您指定的方式推送告警通知,便于您及时发现存在异常数据的资源。

使用限制

通用限制

  • 通过 手动选择 选择告警对象时,如果选择 全部 资源,无数量限制。
  • 通过 手动选择 选择告警对象时,如果选择 部分 资源,有以下数量限制:
    • 1 个告警策略的告警对象里,同一种资源类型最多添加 2000 个资源。
    • 1 个告警策略的告警对象里,所有资源类型总共最多 5000 个。
  • 通过 资源名称项目标签 选择告警对象时,最多匹配 2000 个资源。

支持通过 项目 选择告警对象的云产品

产品名称

Namespace

NAT网关

VCM_NAT

负载均衡

VCM_CLB

公网IP

VCM_EIP

共享带宽包

VCM_BandwidthPackage

中转路由器

VCM_TransitRouter

中转路由器带宽包

VCM_TransitRouterBandwidthPackage

云数据库 MySQL 版

VCM_RDS_MySQL

缓存数据库 Redis 版-社区版

VCM_Redis

云服务器

VCM_ECS

弹性块存储

VCM_EBS

云企业网

VCM_CEN

应用型负载均衡

VCM_ALB

对象存储

VCM_TOS

云数据库 PostgreSQL 版

VCM_RDS_PostgreSQL

文档数据库 MongoDB 版-副本集

VCM_MongoDB_Replica

文档数据库 MongoDB 版-分片集

VCM_MongoDB_Sharded_Cluster

支持通过 标签 选择告警对象的云产品

产品名称

Namespace

NAT网关

VCM_NAT

负载均衡

VCM_CLB

公网IP

VCM_EIP

共享带宽包

VCM_BandwidthPackage

云企业网

VCM_CEN

专线连接-专线网关

VCM_DirectConnectGateway

专线连接-虚拟接口

VCM_DirectConnectVIF

缓存数据库 Redis 版社区版

VCM_Redis

云服务器

VCM_ECS

弹性块存储

VCM_EBS

云数据库 MySQL 版

VCM_RDS_MySQL

应用型负载均衡

VCM_ALB

对象存储

VCM_TOS

云数据库 PostgreSQL 版

VCM_RDS_PostgreSQL

文档数据库 MongoDB 版-副本集

VCM_MongoDB_Replica

文档数据库 MongoDB 版-分片集

VCM_MongoDB_Sharded_Cluster

前提条件

创建告警策略

  1. 登录 云监控控制台
  2. 在左侧导航栏,选择 告警中心 > 告警策略
  3. 告警策略 页面,单击 创建告警策略
  4. 创建告警策略 页面,完成以下配置,然后单击 确定
    • 基本信息

      配置项

      说明

      名称

      自定义告警策略名称,用于标识告警策略。

      • 长度限制在1~128字符之间
      • 不能以数字、中划线、特殊字符开头
      • 支持特殊符号

      注意

      名称中使用某些字符可能会导致告警短信下发失败,详情请参见 模板审核规范

      描述

      自定义告警策略的说明性信息。

    • 告警对象
      Image

      配置项

      说明

      资源类型

      指定被监控的云产品类型。支持的云产品类型请以控制台实际信息为准。

      选择方式

      • 手动选择:手动选择资源。
      • 对象分组:根据对象分组锁定资源。具体操作,请参见 创建对象分组
      • 资源名称:根据资源名称锁定资源。
      • 项目:根据项目锁定资源。具体操作,请参见 项目管理
      • 标签:根据标签锁定资源。具体操作,请参见 管理标签和资源

      地域

      选择方式 配置为 手动选择资源名称项目标签 时,您可以选择被监控资源所属的地域。

      维度

      指定被监控的云产品的资源维度。

      对象分组

      选择方式 配置为 对象分组 时,您可以选择已创建的对象分组,

      资源

      选择方式 配置为 手动选择 时,您可以配置告警策略作用的资源范围,即仅在该资源范围内进行监控。

      注意

      • 如果选择 全部 资源,无数量限制。
      • 如果选择 部分 资源,有以下数量限制:
        • 1 个告警策略的告警对象里,同一种资源类型最多添加 2000 个资源。
        • 1 个告警策略的告警对象里,所有资源类型总共最多 5000 个。
      • 全部:表示对当前账号下,符合指定资源类型、地域以及维度的所有资源配置告警策略。
        选择后,符合条件的新建资源也会自动匹配该告警策略。
      • 部分:您需要手动选择一个或多个资源。
        选择后,表示仅对该部分资源配置告警策略。

      资源名称

      选择方式 配置为 资源名称 时,您可以配置告警策略作用的资源范围,即仅在该资源范围内进行监控。

      注意

      • 支持添加多项匹配规则,最多支持添加 10 个匹配规则。
      • 资源名称不能超过 100 个字符。
      • 支持配置匹配规则间的关系为 任意满足全部满足
      • 选择部分资源时,支持根据资源名称进行资源匹配,包括 前缀匹配后缀匹配包含不包含等于不等于
        • 匹配关系 配置为 包含不包含前缀匹配 或者 后缀匹配 时,支持输入 1 个资源名称。
        • 匹配关系 配置为 等于 或者 不等于 时,支持选择多个资源,且需要配置 地域

      项目

      选择方式 配置为 项目 时,您可以设置告警策略作用的资源范围,即仅在该资源范围内进行监控。

      标签

      选择方式 配置为 标签 时,您可以设置告警策略作用的资源范围,即仅在该资源范围内进行监控。

      注意

      • 支持添加多项匹配规则,最多支持添加 10 个匹配规则。
      • 标签值不能超过 50 个字符。
      • 支持的云产品列表,请参见 支持通过 标签 选择告警对象的云产品
      • 支持配置匹配规则间的关系为 任意满足全部满足
      • 支持选择标签键,然后在标签键对应的资源中进行资源匹配,包括 前缀匹配后缀匹配包含不包含等于不等于存在
        • 匹配关系 配置为 存在 时,包含标签键对应的所有标签值,不支持输入。
        • 匹配关系 配置为 等于 或者 不等于 时,支持选择多个标签值。
        • 匹配关系 配置为 包含不包含前缀匹配 或者 后缀匹配 时,支持输入 1 个标签值。

      说明

      云产品类型不同,可选择的地域、维度等信息也不完全相同。请您以控制台实际信息为准。

    • 告警规则
      Image

      配置项

      说明

      使用预置触发条件

      控制台按照告警维度预先配置的触发条件,便于您快速填写告警策略。包含指标类型和触发条件。

      • 勾选 使用预置触发条件,自动填充指标类型和触发条件,支持修改、删除和增加。
      • 如果 维度 没有配置预置触发条件,则无法勾选 使用预置触发条件

      指标类型

      选择指标类型,支持选择 单指标多指标。如果您需要监控资源的多个指标,可直接配置多指标类型。

      触发条件

      配置告警的监控指标、持续周期、统计类型、比较关系以及阈值。当被监控的资源指标达到触发条件时,系统会推送告警通知。

      • 如果 指标类型 配置为 单指标,则仅支持配置一个触发条件。
      • 如果 指标类型 配置为 多指标,则支持配置一个或多个触发条件。

        说明

        多指标的触发条件:

        • 支持配置满足 全部 条件后触发或满足 任意 条件后触发。
        • 触发条件至少配置 1 条,至多配置 10 条。
        • 不支持重复配置相同的触发条件。
        • 一条规则同时触发阈值告警或无数据告警,则会分别发送两条通知。
        例如,触发条件为 磁盘使用率平均值 > 60%,持续 120 个周期(1 周期=1 分钟),表示系统以 1 分钟为周期检测资源指标,如果某资源连续 120 分钟磁盘使用率的平均值大于 60 %,则触发告警。
      • 持续周期 支持配置为 持续 1 个周期、持续 3 个周期、持续 5 个周期、持续 10 个周期、持续 15 个周期、持续 30 个周期、持续 60 个周期、持续 120 个周期。
      • 比较关系 支持配置为 >、>=、<、<=、!=、=、环比上周期上涨、环比上周期下降、环比上周期上涨或下降、同比昨天同一时段上涨、同比昨天同一时段下降、同比昨天同一时段上涨或下降、同比上周同一时段上涨、同比上周同一时段下降、同比上周同一时段上涨或下降。

      告警级别

      标识告警的严重程度。支持配置 严重警告通知

      生效时间

      配置告警策略的生效时间。告警策略只在生效时间内监控资源的数据是否达到触发条件。

      告警发送周期

      触发告警策略后,如果被监控的资源仍然持续触发告警,为避免打扰,系统会周期性发送告警通知。

      • 支持配置为 5 分钟、10 分钟、15 分钟、30 分钟、60 分钟、3 小时、6 小时、12 小时、24 小时。
      • 默认为 5 分钟。

      发送聚合策略

      • 规则:告警规则中的任意资源在告警发送周期内持续超过告警阈值,在告警发送周期内只发送 1 次告警通知。

      Image

      • 规则和资源:告警规则中的不同资源在告警发送周期内持续超过告警阈值,在告警发送周期内均会分别发送告警通知;如果监控指标在告警发送周期后仍未恢复正常,则云监控再次发送告警通知。

      Image

      告警恢复通知

      告警恢复后向用户发送 1 条恢复通知,默认为打开。

      注意

      • 阈值告警场景中,资源连续 5 分钟不产生告警,视为恢复。
      • 无数据告警场景中,资源连续 5 分钟有数据上报,视为恢复。
      • 发送聚合策略选择 规则 时,所有资源的告警都恢复后,发送 1 条告警恢复通知。
      • 发送聚合策略选择 规则和资源 时,每个资源的告警恢复后,都会发送 1 条告警恢复通知。

      无数据告警

      资源连续指定n个周期,无数据上报,则会触发无数据告警。

      注意

      • 支持配置 3~20 个周期,默认为 10 个周期。
      • 不是所有的云产品指标都支持无数据告警。目前只有告警对象里 维度实例,且资源只涉及一个层级的云产品指标可以配置无数据告警,以控制台显示为准。
      • 一条规则同时触发阈值告警和无数据告警,则会分别发送 2 条通知。
      • 资源被删除不发送无数据告警通知。
        例如,告警对象中配置了全部资源。资源 A被删除,连续 n 个周期没有上报数据,不发送无数据告警。
  • 告警方式
    Image

    配置项

    说明

    告警渠道

    选择一个或多个渠道。支持 邮箱电话短信 以及 告警回调
    其中,电话和短信通知的接收限制,请参见 使用限制

    告警联系组

    告警渠道 选择 邮箱电话 或者 短信 中的一个或多个渠道时,页面将展示 告警联系组

    • 必须配置至少 1 个联系组作为告警通知的接收方。
    • 最多配置 5 个联系组作为告警通知的接收方。

    告警回调

    告警渠道 选择 告警回调 时,页面将展示 告警回调 文本框。

    • 必须指定一个公网可用的 URL。
      • 支持选择已创建的回调地址,最多选择 8 个。
      • 支持填写回调地址,只能填写 1 个。
    • 云监控通过 HTTP 协议或 HTTPS 协议的 POST 请求推送告警通知到您指定的 URL 地址,请将 IP 地址 221.194.189 0/24 加入防火墙的白名单。当您接收到告警通知后,可以根据通知内容做进一步处理。
    • 关于告警回调的更多信息,请参见 告警回调使用说明
    • 告警回调支持关联飞书、钉钉、企业微信中的群机器人,以实现自动推送告警通知。具体操作,请参见 通过飞书群接收告警通知通过钉钉群接收告警通知通过微信群接收告警通知

后续步骤

您可以查看并管理创建完成的告警策略。具体操作,请参见 查看告警策略