如果您需要监控某一云产品资源的数据状态,则可以创建云监控告警策略。当被监控的云产品资源数据达到告警的触发条件时,系统会通过您指定的方式推送告警通知,便于您及时发现存在异常数据的资源。
使用限制
通用限制
- 通过 手动选择 选择告警对象时,如果选择 全部 资源,无数量限制。
- 通过 手动选择 选择告警对象时,如果选择 部分 资源,有以下数量限制:
- 1 个告警策略的告警对象里,同一种资源类型最多添加 2000 个资源。
- 1 个告警策略的告警对象里,所有资源类型总共最多 5000 个。
- 通过 资源名称、项目 和 标签 选择告警对象时,最多匹配 2000 个资源。
支持通过 项目 选择告警对象的云产品
产品名称 | Namespace |
---|
NAT网关 | VCM_NAT |
负载均衡 | VCM_CLB |
公网IP | VCM_EIP |
共享带宽包 | VCM_BandwidthPackage |
中转路由器 | VCM_TransitRouter |
中转路由器带宽包 | VCM_TransitRouterBandwidthPackage |
云数据库 MySQL 版 | VCM_RDS_MySQL |
缓存数据库 Redis 版-社区版 | VCM_Redis |
云服务器 | VCM_ECS |
弹性块存储 | VCM_EBS |
云企业网 | VCM_CEN |
应用型负载均衡 | VCM_ALB |
对象存储 | VCM_TOS |
云数据库 PostgreSQL 版 | VCM_RDS_PostgreSQL |
文档数据库 MongoDB 版-副本集 | VCM_MongoDB_Replica |
文档数据库 MongoDB 版-分片集 | VCM_MongoDB_Sharded_Cluster |
支持通过 标签 选择告警对象的云产品
产品名称 | Namespace |
---|
NAT网关 | VCM_NAT |
负载均衡 | VCM_CLB |
公网IP | VCM_EIP |
共享带宽包 | VCM_BandwidthPackage |
云企业网 | VCM_CEN |
专线连接-专线网关 | VCM_DirectConnectGateway |
专线连接-虚拟接口 | VCM_DirectConnectVIF |
缓存数据库 Redis 版社区版 | VCM_Redis |
云服务器 | VCM_ECS |
弹性块存储 | VCM_EBS |
云数据库 MySQL 版 | VCM_RDS_MySQL |
应用型负载均衡 | VCM_ALB |
对象存储 | VCM_TOS |
云数据库 PostgreSQL 版 | VCM_RDS_PostgreSQL |
文档数据库 MongoDB 版-副本集 | VCM_MongoDB_Replica |
文档数据库 MongoDB 版-分片集 | VCM_MongoDB_Sharded_Cluster |
前提条件
创建告警策略
- 登录 云监控控制台。
- 在左侧导航栏,选择 告警中心 > 告警策略。
- 在 告警策略 页面,单击 创建告警策略。
- 在 创建告警策略 页面,完成以下配置,然后单击 确定。
基本信息
配置项 | 说明 |
---|
名称 | 自定义告警策略名称,用于标识告警策略。 - 长度限制在1~128字符之间
- 不能以数字、中划线、特殊字符开头
- 支持特殊符号
注意 名称中使用某些字符可能会导致告警短信下发失败,详情请参见 模板审核规范。 |
描述 | 自定义告警策略的说明性信息。 |
告警对象
配置项 | 说明 |
---|
资源类型 | 指定被监控的云产品类型。支持的云产品类型请以控制台实际信息为准。 |
选择方式 | - 手动选择:手动选择资源。
- 对象分组:根据对象分组锁定资源。具体操作,请参见 创建对象分组。
- 资源名称:根据资源名称锁定资源。
- 项目:根据项目锁定资源。具体操作,请参见 项目管理。
- 标签:根据标签锁定资源。具体操作,请参见 管理标签和资源。
|
地域 | 当 选择方式 配置为 手动选择、资源名称、项目 和 标签 时,您可以选择被监控资源所属的地域。 |
维度 | 指定被监控的云产品的资源维度。 |
对象分组 | 当 选择方式 配置为 对象分组 时,您可以选择已创建的对象分组, |
资源 | 当 选择方式 配置为 手动选择 时,您可以配置告警策略作用的资源范围,即仅在该资源范围内进行监控。 注意 - 如果选择 全部 资源,无数量限制。
- 如果选择 部分 资源,有以下数量限制:
- 1 个告警策略的告警对象里,同一种资源类型最多添加 2000 个资源。
- 1 个告警策略的告警对象里,所有资源类型总共最多 5000 个。
- 全部:表示对当前账号下,符合指定资源类型、地域以及维度的所有资源配置告警策略。
选择后,符合条件的新建资源也会自动匹配该告警策略。 - 部分:您需要手动选择一个或多个资源。
选择后,表示仅对该部分资源配置告警策略。
|
资源名称 | 当 选择方式 配置为 资源名称 时,您可以配置告警策略作用的资源范围,即仅在该资源范围内进行监控。 注意 - 支持添加多项匹配规则,最多支持添加 10 个匹配规则。
- 资源名称不能超过 100 个字符。
- 支持配置匹配规则间的关系为 任意满足 和 全部满足。
- 选择部分资源时,支持根据资源名称进行资源匹配,包括 前缀匹配、后缀匹配、包含、不包含、等于、不等于。
- 当 匹配关系 配置为 包含、不包含、前缀匹配 或者 后缀匹配 时,支持输入 1 个资源名称。
- 当 匹配关系 配置为 等于 或者 不等于 时,支持选择多个资源,且需要配置 地域。
|
项目 | 当 选择方式 配置为 项目 时,您可以设置告警策略作用的资源范围,即仅在该资源范围内进行监控。 |
标签 | 当 选择方式 配置为 标签 时,您可以设置告警策略作用的资源范围,即仅在该资源范围内进行监控。 注意 - 支持添加多项匹配规则,最多支持添加 10 个匹配规则。
- 标签值不能超过 50 个字符。
- 支持的云产品列表,请参见 支持通过 标签 选择告警对象的云产品。
- 支持配置匹配规则间的关系为 任意满足 和 全部满足。
- 支持选择标签键,然后在标签键对应的资源中进行资源匹配,包括 前缀匹配、后缀匹配、包含、不包含、等于、不等于、存在。
- 当 匹配关系 配置为 存在 时,包含标签键对应的所有标签值,不支持输入。
- 当 匹配关系 配置为 等于 或者 不等于 时,支持选择多个标签值。
- 当 匹配关系 配置为 包含、不包含、前缀匹配 或者 后缀匹配 时,支持输入 1 个标签值。
|
说明
云产品类型不同,可选择的地域、维度等信息也不完全相同。请您以控制台实际信息为准。
告警规则
配置项 | 说明 |
---|
使用预置触发条件 | 控制台按照告警维度预先配置的触发条件,便于您快速填写告警策略。包含指标类型和触发条件。 - 勾选 使用预置触发条件,自动填充指标类型和触发条件,支持修改、删除和增加。
- 如果 维度 没有配置预置触发条件,则无法勾选 使用预置触发条件。
|
指标类型 | 选择指标类型,支持选择 单指标 或 多指标。如果您需要监控资源的多个指标,可直接配置多指标类型。 |
触发条件 | 配置告警的监控指标、持续周期、统计类型、比较关系以及阈值。当被监控的资源指标达到触发条件时,系统会推送告警通知。 - 如果 指标类型 配置为 单指标,则仅支持配置一个触发条件。
- 如果 指标类型 配置为 多指标,则支持配置一个或多个触发条件。
说明 多指标的触发条件: - 支持配置满足 全部 条件后触发或满足 任意 条件后触发。
- 触发条件至少配置 1 条,至多配置 10 条。
- 不支持重复配置相同的触发条件。
- 一条规则同时触发阈值告警或无数据告警,则会分别发送两条通知。
例如,触发条件为 磁盘使用率平均值 > 60%,持续 120 个周期(1 周期=1 分钟),表示系统以 1 分钟为周期检测资源指标,如果某资源连续 120 分钟磁盘使用率的平均值大于 60 %,则触发告警。 - 持续周期 支持配置为 持续 1 个周期、持续 3 个周期、持续 5 个周期、持续 10 个周期、持续 15 个周期、持续 30 个周期、持续 60 个周期、持续 120 个周期。
- 比较关系 支持配置为 >、>=、<、<=、!=、=、环比上周期上涨、环比上周期下降、环比上周期上涨或下降、同比昨天同一时段上涨、同比昨天同一时段下降、同比昨天同一时段上涨或下降、同比上周同一时段上涨、同比上周同一时段下降、同比上周同一时段上涨或下降。
|
告警级别 | 标识告警的严重程度。支持配置 严重、警告、通知。 |
生效时间 | 配置告警策略的生效时间。告警策略只在生效时间内监控资源的数据是否达到触发条件。 |
告警发送周期 | 触发告警策略后,如果被监控的资源仍然持续触发告警,为避免打扰,系统会周期性发送告警通知。 - 支持配置为 5 分钟、10 分钟、15 分钟、30 分钟、60 分钟、3 小时、6 小时、12 小时、24 小时。
- 默认为 5 分钟。
|
发送聚合策略 | - 规则:告警规则中的任意资源在告警发送周期内持续超过告警阈值,在告警发送周期内只发送 1 次告警通知。
- 规则和资源:告警规则中的不同资源在告警发送周期内持续超过告警阈值,在告警发送周期内均会分别发送告警通知;如果监控指标在告警发送周期后仍未恢复正常,则云监控再次发送告警通知。
|
告警恢复通知 | 告警恢复后向用户发送 1 条恢复通知,默认为打开。 注意 - 阈值告警场景中,资源连续 5 分钟不产生告警,视为恢复。
- 无数据告警场景中,资源连续 5 分钟有数据上报,视为恢复。
- 发送聚合策略选择 规则 时,所有资源的告警都恢复后,发送 1 条告警恢复通知。
- 发送聚合策略选择 规则和资源 时,每个资源的告警恢复后,都会发送 1 条告警恢复通知。
|
无数据告警 | 资源连续指定n个周期,无数据上报,则会触发无数据告警。 注意 - 支持配置 3~20 个周期,默认为 10 个周期。
- 不是所有的云产品指标都支持无数据告警。目前只有告警对象里 维度 为 实例,且资源只涉及一个层级的云产品指标可以配置无数据告警,以控制台显示为准。
- 一条规则同时触发阈值告警和无数据告警,则会分别发送 2 条通知。
- 资源被删除不发送无数据告警通知。
例如,告警对象中配置了全部资源。资源 A被删除,连续 n 个周期没有上报数据,不发送无数据告警。
|
告警方式
配置项 | 说明 |
---|
告警渠道 | 选择一个或多个渠道。支持 邮箱、电话、短信 以及 告警回调。
其中,电话和短信通知的接收限制,请参见 使用限制。 |
告警联系组 | 当 告警渠道 选择 邮箱、电话 或者 短信 中的一个或多个渠道时,页面将展示 告警联系组。 - 必须配置至少 1 个联系组作为告警通知的接收方。
- 最多配置 5 个联系组作为告警通知的接收方。
|
告警回调 | 当 告警渠道 选择 告警回调 时,页面将展示 告警回调 文本框。 - 必须指定一个公网可用的 URL。
- 支持选择已创建的回调地址,最多选择 8 个。
- 支持填写回调地址,只能填写 1 个。
- 云监控通过 HTTP 协议或 HTTPS 协议的 POST 请求推送告警通知到您指定的 URL 地址,请将 IP 地址 221.194.189 0/24 加入防火墙的白名单。当您接收到告警通知后,可以根据通知内容做进一步处理。
- 关于告警回调的更多信息,请参见 告警回调使用说明。
- 告警回调支持关联飞书、钉钉、企业微信中的群机器人,以实现自动推送告警通知。具体操作,请参见 通过飞书群接收告警通知、通过钉钉群接收告警通知、通过微信群接收告警通知。
|
后续步骤
您可以查看并管理创建完成的告警策略。具体操作,请参见 查看告警策略。