报警任务从用户分析、性能指标、JS错误指标、静态资源指标、请求指标、复合指标等多个维度配置报警策略,同时支持灵活复杂的自定义配置规则,满足您对各项指标的检测。
概念 | 说明 |
---|---|
SLA | 服务等级协议(Service Level Agreement)。 |
SLO | 服务等级目标(Service Level Objectives)。在报警任务中,SLO指的是报警指标配置的阈值。 |
SLI | 服务等级指标(Service Level Indicators)。在报警任务中,SLI指的是报警指标的实际统计值。 |
预算 |
|
预算消耗比例 |
|
尖刺 | 因为一些偶然原因导致SLI波动产生的报警。 |
单击目标应用下的Webpro端监控。
在控制台左上角选择全部功能 > 报警管理。
在报警任务页面,单击新建报警任务。
参数说明:
配置区域 | 配置项 | 说明 |
---|---|---|
报警基本信息 | 报警任务名称 | 自定义名称,用于标识报警任务。 |
报警级别 | 支持Warning、Fatal两个级别。
| |
报警说明 | 描述该报警任务的目的以及发生报警后的处理方案或其他信息。 | |
制定报警策略 | 报警类型 | 不同的报警类型对应不同报警指标。 |
任务执行间隔 | 任务执行间隔指后端轮询服务的运行频率,比如配置5分钟的间隔,那么每5分钟都会检测一次最近一段时间内的指标值是否满足报警阈值。 | |
多策略关系 | 当配置多个策略关系时,可以配置策略之间的关系。
| |
报警指标 |
| |
报警生效时间 | 生效时间默认为全天00:00~23:59。如果所选指标在一天内的波动很大,不同时间范围的报警阈值不同,可通过设置报警生效时间避免过多干扰。 | |
报警优化 |
更多概念说明,请参见基本概念。 | |
配置通知受众 | 报警方式 | 支持通过飞书、邮件、企业微信、钉钉、报警回调进行报警。 |
飞书webhook | 输入飞书webhook。当报警方式选择飞书时,此项必填。 | |
飞书需要@的人 | 按照User ID或者Open ID配置报警通知的飞书用户。当报警方式选择飞书时,此项选填。 注意
| |
邮件通知组 | 配置邮件通知的接收组。当报警方式选择邮件时,此项必填。 | |
企业微信webhook | 输入企业微信webhook。当报警方式选择企业微信时,此项必填。 | |
企业微信需要@的人 | 按照手机号或者User ID配置报警通知的企业微信用户。当报警方式选择企业微信时,此项选填。 注意 通知的个人必须和群机器人在一个群里。 | |
钉钉webhook | 输入钉钉webhook。当报警方式选择钉钉时,此项必填。 | |
钉钉需要@的人 | 按照手机号或者User ID配置报警通知的钉钉用户。当报警方式选择钉钉时,此项选填。 注意 通知的个人必须和群机器人在一个群里。 | |
报警回调webhook | 输入报警回调webhook。当报警方式选择报警回调时,此项必填。 |
报警任务新建完成后,在各通知平台上查看报警信息。以下是飞书webhook的示例报警信息。
报警策略 | 报警信息 |
---|---|
单策略,无分组,无归因 |
|
单策略,有分组,无归因 |
|
单策略,无分组,有归因 |
|
多策略,有分组,有归因 | 导致报警的策略的每个分组、每个归因结果都附有相应的链接。 |
request body中以JSON格式包含回调信息,具体字段:
字段 | 类型 | 示例值 | 说明 |
---|---|---|---|
title | string | APMPlus报警 | 报警任务的名称。 |
content | object | - | 报警任务触发后回调的内容。
|
字段 | 类型 | 示例值 | 说明 |
---|---|---|---|
alarm_param | object | - | 报警任务里配置的参数。具体请参见alarm_param数据结构。 |
alarm_result | object | - | 报警返回结果。具体请参见alarm_result数据结构。 |
字段 | 类型 | 示例值 | 说明 |
---|---|---|---|
aid | string |
| 应用ID。 |
alarm_level | string |
| 报警级别。
|
alarm_period | array | - | 报警生效的时间。该时间范围外的报警不通知。 |
category | string | - | 报警类别。 |
category_label | string | - | 报警类别的标签。 |
desc | string | - | 报警说明。 |
id | int |
| 报警任务ID。 |
interval_seconds | string |
| 报警任务执行间隔。
|
is_avoid_spike | boolean |
| 报警优化,是否过滤尖刺报警。 |
is_close | int |
| 是否关闭报警。
|
name | string |
| 报警任务的名称。 |
notify_config | array | - | 报警任务的通知配置。 |
os | string |
| 服务的类型。 |
site_type | string | - | web站点的类型。 |
strategy_list | array | - | 报警策略列表。 |
strategy_op | string |
| 报警多策略关系。
|
字段 | 类型 | 示例值 | 说明 |
---|---|---|---|
group_result_list | array | - | 报警返回列表。 |
is_alarm | boolean |
| 是否报警任务触发的报警。 |
is_attributable | boolean |
| 是否归因。 |
title | string |
| 报警返回的标题。 |
字段 | 类型 | 示例值 | 说明 |
---|---|---|---|
alarm_tag_list | array |
| 报警取值。 |
alarm_value | object | - | 报警指标和取值。不同的报警类型里不同的报警取值,包括阈值、当前值、样本量、用户数、时间窗口等等。 |
attribution_results | object | - | 归因结果。 |
group_value | string | - | 分组结果。 |
is_alarm | boolean |
| 是否触发报警。 |
is_spike | boolean |
| 是否屏蔽尖刺。默认为false。当开启报警优化或尖刺过滤,并且出现尖刺时,为true。 |
报警任务列表展示了已添加的报警任务,包括任务名称、创建人、报警级别、报警方式、报警规则摘要、指标类型、最近更新时间、最近一个月报警次数、监控状态。
报警详情页面展示了报警情况概览和报警列表。