You need to enable JavaScript to run this app.
导航
风险治理
最近更新时间:2024.08.19 10:35:46首次发布时间:2024.08.19 10:35:46

开启风险巡检功能后,系统将周期性执行一系列预置巡检规则,能够检测出实例中潜在的风险项并给出风险处理建议。在风险治理页面,您可以通过风险等级、关联资源、风险描述和处理建议等信息去修改实例问题。

名词解释

风险项

风险项是巡检过程中发现的相同异常事件的集合体,通过风险等级、关联资源、风险描述和处理建议等信息帮助用户提前识别和修复实例的潜在问题。
风险项和处理建议对应关系如下:

类型

风险项

描述

风险等级

处理建议

集群

queueInsufficient

实例 Queue 资源不足。

中风险

  1. 删除无效的 Topic。
  2. 对实例升配。

Topic

queueBalance

实例 Queue 分布不均衡。

低风险

  1. 扩容 Queue, 会自动将 Queue Rebalance 到其他 Broker。
  2. 联系管理员对 Queue 进行重均衡。

Group

subscribeConsistency

实例 Group 组订阅不一致。

说明

5.x 版本实例不支持该巡检规则。

高风险

  1. 检查消费者实例是否存在其他订阅

关联资源

风险项是巡检过程中发现的相同异常事件的集合体,一个风险项可能关联了多个资源。您需要单独为每个资源处理存在的风险。

风险等级

风险等级是对风险项紧急程度的层级划分。目前支持以下三种风险等级:

风险等级

描述

处理时效

高风险

出现高风险项会影响实例的收发消息核心链路,导致服务不可用。

立即处理

中风险

出现中风险项暂时不会影响实例的收发消息核心链路,但持续未处理可能导致其他异常。

尽快处理

低风险

低风险项是一些非最佳配置的状态,暂时不会影响业务,但仍然建议处理。

建议处理

风险状态

风险状态是风险项是否被运维人员修复完成的标识。
系统根据巡检周期执行巡检,返回实例潜在的风险项,风险项需要由运维人员进行标记和处理。

  • 未处理:运维人员尚未对风险项进行处理。
  • 已处理:运维人员已经知晓风险原因,并确认已经处理修复。

风险项处理

  1. 登录消息队列 RocketMQ版控制台
  2. 在顶部菜单栏中选择地域。
  3. 实例列表页面单击实例名称。
  4. 在实例详情页面,单击风险巡检页签。
  5. 风险治理页签下,根据风险等级处理状态筛选风险项。
  6. 单击目标风险项前面的+按钮,即可查看风险描述和处理建议。
    图片
  7. 根据风险项的处理建议,修复每一个关联资源的风险问题。
  8. 处理完成后,修改风险项后方的状态,设置为已处理
    图片