消息队列 RabbitMQ版支持配置云监控告警规则,帮助您实时关注实例的运行状态。本文档介绍典型场景下的告警规则配置示例,建议参考这些推荐的告警策略,配置监控指标的告警规则。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 | 通知 |
示例如下:
处理建议
触发告警后,建议观察实例的磁盘使用率是否持续处于高位。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 | 警告 |
示例如下:
处理建议
触发告警后,建议观察实例的内存使用率是否持续处于高位。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 | 警告 |
示例如下:
处理建议
触发告警后,建议及时升级实例规格,降低 CPU 使用率。如果已经是最高规格,则推荐扩容存储空间。详细操作请参考升级实例规格。处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 | 警告 |
示例如下:
处理建议
触发告警后,您可以先查看监控,判断实例的连接数是否持续维持高位状态。如果只是偶现的峰值,建议持续观察。如果实例连接数长时间维持在高位,则建议通过以下方式排查。
处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 | 警告 |
示例如下:
处理建议
触发告警后,建议清理冗余或可删除的队列。如不存在可删除队列,且仍然需要持续创建新的队列,则建议及时扩容实例的计算规格,以此增加可用队列数量。升级实例规格的方式请参考升级实例规格。
处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 | 警告 |
示例如下:
处理建议
触发告警后,说明实例目前的水位已经快达到该实例规格的上限,如果继续上涨可能会影响业务的稳定性,建议升级实例规格,升级实例规格的方式请参考升级实例规格。
处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 | 警告 |
示例如下:
处理建议
触发告警后,说明有生产者发布消息到 exchange 时,没有匹配的队列,即消息无法被路由到任何队列,交换机会直接丢弃或者将未被路由的消息返回给生产者,导致消息发送不成功,建议检查生产者配置。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 | 通知 |
示例如下:
处理建议
触发告警后,建议观察实例的磁盘使用率是否持续处于高位。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 | 严重 |
示例如下:
处理建议
触发告警后,表示实例中存在意外掉线的故障节点,建议联系客户经理协助排查故障。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 节点 |
触发条件 |
|
告警级别 | 警告 |
示例如下:
处理建议
触发告警后,建议观察节点的磁盘使用率是否持续处于高位,并检查消费逻辑。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 | 警告 |
示例如下:
处理建议
触发告警后,建议及时升级实例规格,降低内存使用率。如果已经是最高规格,则推荐扩容存储空间。详细操作请参考升级实例规格。处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 节点 |
触发条件 |
|
告警级别 | 严重 |
示例如下:
处理建议
触发告警表示实例单节点的可用内存使用率达到 100% (相当于实际物理内存达到 40%),后端服务会自动暂停数据写入,建议及时升级实例规格,降低内存使用率。如果已经是最高规格,则推荐扩容存储空间。详细操作请参考升级实例规格。处理后建议持续观测该指标,确认是否达到了预期效果。