开启风险巡检功能后,系统将周期性执行一系列预置巡检规则,能够检测出实例中潜在的风险项并给出风险处理建议。在风险治理页面,您可以通过风险等级、关联资源、风险描述和处理建议等信息去修改实例问题。
风险项是巡检过程中发现的相同异常事件的集合体,通过风险等级、关联资源、风险描述和处理建议等信息帮助用户提前识别和修复实例的潜在问题。
风险项和处理建议对应关系如下:
类型 | 风险项 | 描述 | 风险等级 | 处理建议 |
---|---|---|---|---|
集群 | queueInsufficient | 实例 Queue 资源不足。 | 中风险 |
|
Topic | queueBalance | 实例 Queue 分布不均衡。 | 低风险 |
|
Group | subscribeConsistency | 实例 Group 组订阅不一致。 说明 5.x 版本实例不支持该巡检规则。 | 高风险 |
|
风险项是巡检过程中发现的相同异常事件的集合体,一个风险项可能关联了多个资源。您需要单独为每个资源处理存在的风险。
风险等级是对风险项紧急程度的层级划分。目前支持以下三种风险等级:
风险等级 | 描述 | 处理时效 |
---|---|---|
高风险 | 出现高风险项会影响实例的收发消息核心链路,导致服务不可用。 | 立即处理 |
中风险 | 出现中风险项暂时不会影响实例的收发消息核心链路,但持续未处理可能导致其他异常。 | 尽快处理 |
低风险 | 低风险项是一些非最佳配置的状态,暂时不会影响业务,但仍然建议处理。 | 建议处理 |
风险状态是风险项是否被运维人员修复完成的标识。
系统根据巡检周期执行巡检,返回实例潜在的风险项,风险项需要由运维人员进行标记和处理。
+
按钮,即可查看风险描述和处理建议。