You need to enable JavaScript to run this app.
导航
运维监控概述
最近更新时间:2024.12.11 10:54:12首次发布时间:2023.08.30 21:20:09

运维监控为您提供多云CDN资源(包含加速域名、拨测任务)相关数据及事件的统一监控,以及基于指标阈值和事件的告警、告警根因诊断服务。

功能简介

通过启用运维监控,您可以在多云CDN为加速域名及拨测任务创建自定义告警策略。这些告警策略可以基于指标阈值,也可基于事件。

  • 基于阈值的告警策略可以追踪一个或多个特定的数据指标,并在指标满足设定的条件时触发告警和通知。
  • 基于事件的告警策略专用于追踪特定的事件,当这个事件产生时,会触发告警和通知。

支持的数据指标

基于阈值的告警策略支持以下监控对象及对应的数据指标:

  • 加速域名:
    访问带宽、访问流量、访问请求数、访问QPS、回源带宽、回源流量、回源请求数、回源QPS、访问状态码2xx占比、访问状态码3xx占比、访问状态码4xx占比、访问状态码5xx占比、回源状态码2xx占比、回源状态码3xx占比、回源状态码4xx占比、回源状态码5xx占比、流量命中率、请求数命中率、(加速域名所关联的 TLS/SSL 证书)证书有效期

  • 拨测任务:不同类型拨测任务支持的监控指标不同。

    • HTTP(S) 拨测的监控指标包括:
      可用率、平均下载速度、整体性能、SSL时延、建连时间、首包时间、重定向时间
    • DNS 拨测的监控指标包括:
      可用率、DNS时延
    • Ping 拨测的监控指标包括:
      可用率、Ping时延、Ping丢包率、Ping可用率
    • TCP 拨测的监控指标包括:
      可用率、TCP总用时、TCP连接用时、TCP发送用时、TCP响应用时、TCP接收用时

关于加速域名监控指标的详细介绍,请参见监控指标说明
关于拨测任务监控指标的详细介绍,请参见拨测分析 - 监控指标说明

支持的事件类型

基于事件的告警策略可以监控以下事件类型:

  • 内容管理任务执行失败。
    具体包括以下情况:
    • 任务提交失败:表示多云CDN未能向云服务商成功提交刷新或预热请求。原因可能包括参数配置不符合云服务商系统要求、超出任务配额等。
    • 执行结果失败:云服务商响应了刷新或预热请求,但任务执行未能成功。需要通过云服务商的响应信息来判断失败的具体原因。
    • 云服务商执行超时:云服务商响应了刷新或预热请求,但长期无法查询到任务执行结果。刷新任务提交后 15 分钟未能查询到结果,或预热任务提交后 4 小时未能查询到结果,均视为执行超时。

告警通知与分析

您可以开启告警通知,以便及时了解业务异常。支持的通知方式包括邮件、短信、电话、群聊机器人。

无论您是否开启告警通知,多云CDN都为您保留了告警记录。您可以在多云CDN控制台查看这些记录。针对基于特定数据指标的告警,多云CDN还提供了告警的根因诊断,允许您对产生告警时的数据进行关联性分析,以便发现导致数据异常的根本问题。

启用运维监控

运维监控功能默认未开启。您必须先启用运维监控,然后才能使用该功能。

注意

启用运维监控表示您同意多云CDN从云服务商获取并存储您的加速域名相关数据,以基于存储的数据向您提供服务。

操作步骤

  1. 登录多云CDN控制台

  2. 在左侧导航栏,选择 运维监控 > 告警应急

  3. 运维监控 对话框,单击 立即体验

  4. 创建告警策略 面板,完成告警策略的配置,然后单击 确定

    alt

    告警策略的 基本信息告警规则 都已自动填充,您无需修改。您可以根据需要修改 告警通知 的配置。

    告警通知 区域的 开启通知 开关默认已打开。您需要设置 通知对象 的相关配置。您也可以关闭 开启通知 开关,那么您将只可以在多云CDN控制台查看告警记录,而不会收到通知。

    通知对象 包含 联系组(通过邮件、短信或电话接收通知)和 通知机器人(通过飞书机器人、钉钉机器人、企业微信机器人、WPS协作机器人接收通知)。

    • 如果选择联系组作为通知对象,您需要先创建联系组。相关操作,请参见创建联系组

    • 如果选择通知机器人作为通知对象,您需要先创建 webhook。相关操作,请参见创建 webhook

后续操作

成功创建告警策略后,您可以单击 策略管理 标签页,管理已创建的告警策略。您也可以继续添加告警策略。相关操作,请参见创建告警策略

当告警策略被触发时,您可以前往 监控告警 标签页,查看告警详情和告警的根因诊断结果。相关操作,请参见查看告警