You need to enable JavaScript to run this app.
导航
配置告警策略
最近更新时间:2024.06.28 18:54:07首次发布时间:2022.08.22 17:05:48

云原生消息引擎已经接入云监控服务,您可以在云监控平台按照 RequestQPS、Consumer Group、Topic 维度配置告警策略,用于及时识别资源异常状态并发送告警通知,提升运维效率。
本文为您介绍在云监控平台如何配置告警策略,以及云原生消息引擎支持的 Metric 详情。

Metric介绍

下表介绍云原生消息引擎支持的监控指标。

维度

指标名

MetricName

单位

ConsumerGroup

单个Topic的消费条数

inf_bmq_group_offset

Count

ConsumerGroup

单个Topic的lag

inf_bmq_lag_size

Count

ConsumerGroup

Consumer Group消费消息条数

inf_bmq_proxy_fetchMessage

Count

ConsumerGroup

Consumer Group消费消息流量

inf_bmq_proxy_bytes_out

Bytes/Second(IEC)

Topic

单分区生产流量

inf_bmq_proxy_bytes_in

Bytes/Second

Topic

单分区消费流量

inf_bmq_proxy_bytes_out

Bytes/Second

RequestQPS

生产请求QPS

inf_bmq_produce_ProducerStatsPerTopicPartition_Count

Count/Second

RequestQPS

消费请求QPS

inf_bmq_proxy_fetchRequest

Count/Second

RequestQPS

生产请求条数

inf_bmq_server_io_MessagesInPerSec_Count

Count/Second

RequestQPS

消费消息条数

inf_bmq_proxy_fetchMessage

Count/Second

RequestQPS

生产消息流量

inf_bmq_proxy_bytes_in

Bytes/Second

RequestQPS

消费消息流量

inf_bmq_proxy_bytes_out

Bytes/Second

前提条件

  • 您在前往云监控服务侧创建告警策略前,需要先明确资源对象,请提前获取实例、Topic、Consumer Group 的名称。
  • 在创建告警策略时,选择邮箱电话或者短信作为通知方式时,需要提前创建告警联系人和联系组,请参见创建告警联系人和联系组

创建告警策略

  1. 登录云原生消息引擎控制台,在顶部菜单栏选择目标地域。

  2. 在顶部菜单栏,选择目标项目和地域。

  3. 在左侧导航栏选择 BMQ 实例,单击目标实例名称,进入实例详情页面。

  4. 在实例详情页面选择云监控页签,然后单击右上角的创建告警策略
    系统自动跳转到云监控创建告警策略的页面,请继续根据后续步骤配置告警策略。

  5. 创建告警策略页面的基本信息区域,设置告警策略名称和描述。
    图片

  6. 告警对象区域,选择资源类型为中间件 > 云原生消息引擎,然后根据实际情况选择地域、维度和资源。
    图片

    参数

    说明

    资源类型

    选择中间件 > 云原生消息引擎

    地域

    选择 BMQ 实例所在地域。

    维度

    创建告警策略的维度,不同维度能设置的策略不相同。
    支持的维度包含 RequestQPSConsumerGroupTopic,各个维度支持的指标请参见Metric介绍

    资源

    确定设置告警策略的资源范围,支持以下两种设置方式:

    • 全部:表示对当前账号下所有资源设置告警策略。同时,符合条件的新建资源也会自动匹配该告警策略。
    • 部分:需手动选择一个或多个资源,表示仅对该部分资源设置告警策略。

    为云原生消息引擎设置告警策略,支持以下三类资源:

    • 实例:即云原生消息引擎侧的实例,请根据名称选择目标实例。
    • ConsumerGroup:选择实例中的目标 Group。
    • Topic:选择实例中的目标 Topic。
  7. 告警规则区域,选择指标类型,设置告警规则触发条件,告警级别、策略生效时间、告警发送周期等。
    图片

    参数

    说明

    使用预置触发条件

    按照告警维度预先配置的触发条件,便于您快速填写告警策略。但云原生消息引擎的三个维度均没有预置触发条件,无需关注该参数。

    指标类型

    支持选择单指标多指标。如果您需要监控的实例的多个指标,可直接配置多指标类型。

    触发条件

    设置告警的监控指标、持续周期、统计类型、比较关系以及阈值。当被监控的资源指标达到触发条件时,系统会推送告警通知。

    • 如果指标类型设置为单指标,则仅支持设置一个触发条件。
    • 如果指标类型设置为多指标,则支持设置一个或多个触发条件。

    告警级别

    用于标识告警的严重程度。支持设置严重警告通知

    生效时间

    告警策略的生效时间。告警策略只在生效时间内监控资源的数据是否达到触发条件。

    告警发送周期

    触发告警策略后,如果被监控的资源仍然持续触发告警,则系统会周期性发送告警通知。

    告警恢复通知

    告警恢复后向用户发送一条恢复通知,默认为打开。
    邮件、电话、短信、告警回调(飞书、钉钉、企业微信)有告警恢复通知,其他API告警回调无告警恢复通知。

  8. 告警方式区域,选择告警通知方式和告警通知组。
    图片

    参数

    说明

    告警渠道

    选择一个或多个渠道。支持邮箱电话短信以及告警回调

    告警联系组

    告警渠道选择邮箱电话或者短信中的一个或多个渠道时,您必须设置一个或多个联系组作为告警通知的接收方。

    告警回调

    当选择告警回调时,页面将展示告警回调文本框,您必须指定可用的 URL。
    后续如果触发告警,则系统会把告警的详细信息通过 POST 请求发送至该 URL,便于您进行深入的数据分析。

  9. 告警策略配置完成后,单击页面右下角的确定
    告警策略创建成功后,即自动启动。