本文介绍如何通过 TLS 的仪表盘和告警能力,实现对 Kafka 协议消费堆积情况的实时监控和告警。
已创建 Kafka 协议消费日志任务。具体操作,请参考通过 Kafka 协议消费日志。
启动 Kafka 消费组后,由于 Kafka Client 配置、客户端消费线程性能、客户端数据处理线程性能、Topic 分区数等因素的限制,可能导致消费的数据量低于上传的数据量(通过 Log Connector、Kafka 协议上传等多个途径上传的数据),从而产生数据堆积。正常情况下,由于客户端轮询数据存在时间间隔,一定程度的堆积是正常的。但是如果堆积持续上涨,则说明消费能力不足。当消费的延迟超过 Topic 的存储时长时,就会丢失数据,这种情况需要通过客户端参数调优、客户端扩容、分区扩容等手段来提高客户端消费能力,具体请参考 Consumer Configs。
日志服务提供了 Kafka 监控看板,用于展示消费延迟和消费速度变化趋势,并支持为图表配置告警,以便您及时发现和处理消费延迟和消费速度的相关问题。
$1.MaxPartitionLag > 100000 || $1.TotalLag > 500000
。其中 MaxPartitionLag
和 TotalLag
的取值请结合实际业务进行评估。