You need to enable JavaScript to run this app.
导航
巡检概述
最近更新时间:2024.08.19 10:54:30首次发布时间:2024.08.15 14:57:46

消息队列 RocketMQ版支持风险巡检,为您提供集群、Topic、Group 等维度的巡检能力。开启风险巡检功能后,系统将周期性执行一系列预置巡检规则,能够检测出实例中潜在的风险项并给出处理建议,能够帮助用户处理潜在的运维风险。

背景信息

消息队列 RocketMQ版已经提供了实例、Topic、Group 等多维度的监控指标,可以通过监控数据的变化来定位和排查问题,但是覆盖范围有限。使用风险巡检功能可以覆盖很多无法通过 Metrics 来定位和排查的问题,比如以下巡检项:

  • 检查 topic 的 queue 是否在所有的 broker 中均衡分布
  • 检查 group 是否订阅一致

使用风险巡检功能,将自动检测实例配置是否合理。对于不合适、不合理的配置,系统将给出调优或修改建议,能够提前发现风险并快速解决,极大地降低了业务运维成本。

功能概览

  • 启停风险巡检:风险巡检功能默认未启动,如果需要执行巡检规则,检测实例的健康状况,您可以开启风险巡检。更多信息,请参见启停风险巡检
  • 巡检规则:开启风险巡检功能后,系统将按照巡检周期定时执行巡检规则。在触发周期巡检前,您可以选择手动执行巡检规则。更多信息,请参见巡检规则
  • 风险治理:系统执行巡检后,能够检测出实例中潜在的风险项,通过风险等级、关联资源、风险描述和处理建议等信息帮助用户提前识别和修复实例的潜在问题。更多信息,请参见风险治理