消息队列 Kafka版支持配置云监控告警规则,帮助您实时关注实例的运行状态。本文档介绍典型场景下的告警规则配置示例,建议参考这些推荐的告警策略,配置监控指标的告警规则。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 1 |
|
告警级别 | 通知 |
示例如下:
处理建议
触发告警后,您可以通过以下方式处理。处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
指标类型 | 多指标 |
触发条件 1 |
|
触发条件 2 |
|
告警级别 | 通知 |
示例如下:
处理建议
触发告警后,您可以通过以下方式处理。处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 | 警告 |
示例如下:
处理建议
触发告警后,您可以通过以下方式处理。处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 | 警告 |
示例如下:
处理建议
触发告警后,您可以通过以下方式处理。处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 | 严重 |
示例如下:
处理建议
触发告警后,建议检查客户端的参数配置,并设置合理的客户端参数。处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 | 警告 |
示例如下:
处理建议
触发告警后,建议及时查看业务端的消费逻辑,判断是否有影响消费速度的原因存在。处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 | 警告 |
示例如下:
处理建议
触发告警后,您可以通过以下方式处理。处理后建议持续观测该指标,确认是否达到了预期效果。
batch.size
小,或设置了同步生产方式。告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 | 警告 |
示例如下:
处理建议
触发告警后,您可以通过以下方式处理。处理后建议持续观测该指标,确认是否达到了预期效果。
说明
每个 Kafka 实例的 IP 连接数上限为 20000,推荐设置 IP 连接数超过 90% 的告警。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 | 通知 |
示例如下:
处理建议
触发告警后,建议根据业务需求合理设置 IP 连接数。处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 |
|
示例如下:
处理建议
触发告警后,您可以通过以下方式处理。处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 |
|
示例如下:
处理建议
触发告警后,您可以通过以下方式处理。处理后建议持续观测该指标,确认是否达到了预期效果。
一般来说,当实例的节点在线率小于 100%,都应该排查原因。
但是在日常运维中,存在因为实例升级触发滚动重启的情况,此时实例的可用性并不会下降。因此,如果需要为节点在线率配置告警规则,建议配置为节点在线率低于 90% 时,触发告警。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 实例 |
触发条件 |
|
告警级别 | 严重 |
示例如下:
处理建议
出现节点在线率低于 90% 的告警时,建议先观察实例和业务情况。如果节点在线率长时间未恢复,请联系技术支持或提交工单。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 节点 |
触发条件 |
|
告警级别 | 通知 |
示例如下:
处理建议
触发告警后,您可以通过以下方式处理。处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 节点 |
触发条件 |
|
告警级别 | 严重 |
示例如下:
处理建议
触发告警后,建议检查客户端的参数配置,并设置合理的客户端参数。处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 节点 |
触发条件 |
|
告警级别 | 警告 |
示例如下:
处理建议
触发告警后,建议及时查看业务端的消费逻辑,判断是否有影响消费速度的原因存在。处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 节点 |
触发条件 |
|
告警级别 | 警告 |
示例如下:
处理建议
触发告警后,您可以通过以下方式处理。处理后建议持续观测该指标,确认是否达到了预期效果。
batch.size
小,或设置了同步生产方式。告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 节点 |
触发条件 |
|
告警级别 | 警告 |
示例如下:
处理建议
触发告警后,您可以通过以下方式处理。处理后建议持续观测该指标,确认是否达到了预期效果。
说明
每个 Kafka 实例的 IP 连接数上限为 20000,推荐设置 IP 连接数超过 90% 的告警。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 节点 |
触发条件 |
|
告警级别 | 通知 |
示例如下:
处理建议
触发告警后,建议根据业务需求合理设置 IP 连接数。处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 分区 |
触发条件 |
|
告警级别 | 警告 |
示例如下:
处理建议
触发告警后,您可以通过以下方式处理。处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 消费组 |
触发条件 |
|
告警级别 | 通知 |
示例如下:
处理建议
触发告警后,您可以通过以下方式处理。处理后建议持续观测该指标,确认是否达到了预期效果。
告警规则配置
告警规则的核心配置如下。创建告警规则的操作步骤请参考设置告警规则。
配置 | 取值 |
---|---|
维度 | 消费组 |
触发条件 |
|
告警级别 | 警告 |
示例如下:
处理建议
重均衡在消费者加入或者退出的时候触发,频繁的重均衡可能是由于消费者消费异常频繁重启导致,请查看消费者状态是否正常。
若在业务初始化或者重启过程中出现,可忽略该异常告警。