You need to enable JavaScript to run this app.
导航
监控指标说明
最近更新时间:2025.03.26 12:02:10首次发布时间:2023.08.30 21:27:18
我的收藏
有用
有用
无用
无用

本文介绍了多云CDN支持的监控对象与指标,以及监控数据的采集方式与限制。

监控对象

多云CDN能够监控以下对象的相关数据:

  • 加速域名:指在多云CDN管理的加速域名,包括内置CDN加速域名与第三方云产品加速域名。
  • 拨测任务:指在多云CDN创建的拨测任务,包括可用性策略拨测、自定义拨测和多云拨测任务。
查询加速域名查询拨测任务

多云管理 > 域名管理 页面可查看所有加速域名。
alt

应用中心 > 快捷拨测 页面可查看所有拨测任务。
alt

监控指标

不同监控对象支持不同的监控指标。本章节分别罗列了适用于加速域名的所有监控指标适用于拨测任务的所有监控指标

指标用途

您可以基于监控指标创建 指标阈值 类型的告警策略。在告警策略中,可针对特定指标设置判断条件;当指标数值满足判定条件,就会触发告警。判断条件是根据“阈值”指定的。

例如,针对“访问带宽”指标可设置如下判断条件:连续2个数据点(每1分钟一个数据点)的值大于 100Mbps。其中 100(Mbps)就是阈值。

alt

更多信息,请参见创建告警策略

加速域名监控指标

指标释义支持动态阈值[1]支持根因分析[2]
访问带宽单位时间内从 CDN[3] 向客户端传输数据的速率。单位:bps。
访问流量CDN 向客户端传输的数据总量。单位:bytes。
访问请求数客户端向 CDN 发起的 HTTP 和 HTTPS 请求总数。单位:个。
访问QPSCDN 每秒处理的客户端请求数量。单位:个/秒。
访问状态码2xx占比状态码为 2xx(包含 200 或 206 等)的客户端请求占所有客户端请求的比例。单位:%。
访问状态码3xx占比状态码为 3xx(包含 301 或 302 等)的客户端请求占所有客户端请求的比例。单位:%。
访问状态码4xx占比状态码为 4xx(包含 401、402、403、404、405、429 或 499 等)的客户端请求占所有客户端请求的比例。单位:%。
访问状态码5xx占比状态码为 5xx(包含 500、501、502、503 或 504 等)的客户端请求占所有客户端请求的比例。单位:%。
访问状态码2xx(具体)占比状态码为 200、206 的客户端请求占所有客户端请求的比例。单位:%。
访问状态码3xx(具体)占比状态码为 301、302 的客户端请求占所有客户端请求的比例。单位:%。
访问状态码4xx(具体)占比状态码为 401、402、403、404、405、429、499 的客户端请求占所有客户端请求的比例。单位:%。
访问状态码5xx(具体)占比状态码为 500、501、502、503、504 的客户端请求占所有客户端请求的比例。单位:%。
流量命中率CDN 直接响应客户端的缓存流量(字节数)占总访问流量(客户端请求的字节数)的比例。单位:%。
请求数命中率命中了 CDN 缓存的客户端请求占所有客户端请求的比例。单位:%。
回源带宽单位时间内从源站向 CDN 传输数据的速率。单位:bps。
回源流量源站向 CDN 传输的数据总量。单位:bytes。
回源请求数CDN 向源站发起的 HTTP 和 HTTPS 请求总数。单位:个。
回源QPS源站每秒处理的回源请求数量。单位:个/秒。
回源状态码2xx占比状态码为 2xx(包含 200、206 等)的回源请求占所有回源请求的比例。单位:%。
回源状态码3xx占比状态码为 3xx 类型(包含 301、302 等)的回源请求占所有回源请求的比例。单位:%。
回源状态码4xx占比状态码为 4xx 类型(包含 401、402、403、404、405、429、499 等)的回源请求占所有回源请求的比例。单位:%。
回源状态码5xx占比状态码为 5xx 类型(包含 500、501、502、503、504 等)的回源请求占所有回源请求的比例。单位:%。
回源状态码2xx(具体)占比状态码为 200 或 206 的回源请求占所有回源请求的比例。单位:%。
回源状态码3xx(具体)占比状态码为 301 或 302 的回源请求占所有回源请求的比例。单位:%。
回源状态码4xx(具体)占比状态码为 401、402、403、404、405、429 或 499 的回源请求占所有回源请求的比例。单位:%。
回源状态码5xx(具体)占比状态码为 500、501、502、503 或 504 的回源请求占所有回源请求的比例。单位:%。
证书有效期SSL/TLS 证书有效期剩余天数。单位:天。

拨测任务监控指标

说明

所有拨测任务指标均不支持动态阈值[1]和根因分析[2]

指标释义
HTTP/HTTPS 拨测(适用于可用性策略拨测、多云拨测和自定义 HTTP/HTTPS 拨测任务)
整体性能从拨测节点发起 HTTP/HTTPS 请求开始,到完整接收服务器返回的响应体所消耗的总时间。单位:ms。
DNS时延从拨测节点发起 DNS 查询请求开始,到拨测节点收到 DNS 服务器返回的解析结果的时间间隔。单位:ms。
SSL时延从 TCP 连接建立完成后,拨测节点发送 TLS ClientHello 报文开始,到成功完成加密握手(包括证书验证、密钥交换、加密套件协商等步骤)的总耗时。单位:ms。
建连时间从拨测节点发送首个 TCP SYN 报文开始,到成功完成三次握手(收到服务器的 SYN-ACK 并回复 ACK)的总耗时。单位:ms。
首包时间在完成 TCP 握手(若为 HTTPS 则包含 TLS 协商)后,从拨测节点发送完 HTTP 请求报文到接收到服务器返回的第一个响应数据包所经历的时间。单位:ms。
重定向时间拨测节点接收到 HTTP 3xx 重定向响应后,向新 URL 发起请求并成功接收首个响应数据包的总耗时。(若存在多次跳转则为各次耗时的累加值)。单位:ms。
平均下载速度下载阶段的数据传输速率。单位:KB/s。

可用率

统计周期内目标地址的 HTTP 或 HTTPS 协议可达性百分比。计算方式如下:成功探测次数/总探测次数 * 100%。

判断一次 HTTP/HTTPS 探测是否成功:

  • 默认情况,若 HTTP 状态码在 200~399 范围内,则此次探测成功。
  • 通过修改拨测任务 高级配置 中的 断言配置 参数,可以自定义 HTTP/HTTPS 探测是否成功的判断依据。更多信息,请参见 HTTP/HTTPS 高级配置
DNS 拨测(适用于自定义 DNS 拨测任务)
DNS时延从拨测节点发起 DNS 查询请求开始,到拨测节点收到 DNS 服务器返回的解析结果的时间间隔。单位:ms。

可用率

统计周期内获得有效响应的 DNS 探测次数占总探测次数的百分比。计算方式如下:获得有效响应的探测次数/总探测次数 * 100%。

判断一次 DNS 探测是否获得有效响应:若响应消息的 ANSWER 不为空,则此次探测获得了有效响应。

Ping 拨测(适用于自定义 Ping 拨测任务)
Ping时延(针对一次 Ping)拨测节点发送网络包到目标地址并接收到响应包的平均往返时间(RTT,Round-Trip Time)。单位:ms。
Ping丢包率(针对一次 Ping)未收到响应的网络包数量占发送总包数的百分比,计算公式为:(发送包数 - 接收包数) / 发送包数 * 100%。
Ping可用率(针对一次 Ping)收到响应的网络包数量占发送总包数的百分比,计算公式为:接收包数 / 发送包数 * 100%。

可用率

统计周期内目标地址的 Ping 可达性百分比。计算方式如下:成功探测次数/总探测次数 * 100%。

判断一次 Ping 探测是否成功:若 Ping 丢包率为 0,则此次探测成功。

TCP 拨测(适用于自定义 TCP 拨测任务)
TCP总用时从发起 TCP 连接请求(发送 SYN 包)开始,到完成数据发送、接收及连接正常关闭(FIN-ACK 流程)的全过程总耗时。单位:ms。
TCP连接用时完成 TCP 三次握手的时间跨度,即从拨测节点发送首个 SYN 包开始,到成功接收服务器的 SYN-ACK 包并回复最终 ACK 包的时间。单位:ms。
TCP发送用时从拨测节点发送最后一个 TCP 报文段(承载完整应用层请求,如 HTTP 请求)到接收到该报文段对应的 TCP ACK 确认的时间。单位:ms。
TCP接收用时从拨测节点发送完请求到完整接收服务器返回的所有响应数据的时间。
TCP响应用时从拨测节点完成请求数据发送到接收到服务器返回的第一个响应数据包的时间。

可用率

统计周期内目标地址的 TCP 协议可达性百分比。计算方式如下:成功探测次数/总探测次数 * 100%。

判断一次 TCP 探测是否成功:若成功建立 TCP 连接,则此次探测成功。

注:

[1] 阈值有两种类型:静态阈值和动态阈值。所有指标都支持静态阈值,只有部分指标支持动态阈值。

  • 静态阈值:需要您手动设定一个值。
  • 动态阈值:无需手动设定阈值,由多云CDN根据智能算法自动判断数据是否异常(基本原理是参考历史数据得出常规数值范围,根据实际值偏离常规数值范围的程度来判断数据是否异常)。

[2] 根因分析是多云CDN提供的一个故障分析工具,目前只适用于部分指标。根因分析允许您对告警期间收集的所有关联数据进行自动分析,定位导致告警的原因。更多信息,请参见告警详情信息

[3] “CDN”是一种简化的说法,实际也可能是动态加速或其他加速产品,取决于接入多云CDN的第三方云产品。

数据采集

采集方式

不同监控对象的数据采集方式不同。

监控对象数据采集方式

加速域名

多云CDN调用云服务商的相关接口获取原始数据。

  • 多云CDN默认请求1分钟粒度数据(每1分钟一个数据点),并存储获得的1分钟粒度数据作为原始数据。
  • 部分云服务商不支持1分钟粒度数据。
    这种情况下,多云CDN请求5分钟粒度数据(每5分钟一个数据点)。对于获得的5分钟粒度数据,多云CDN进行“切割”处理获得1分钟粒度数据,并存储1分钟粒度数据作为原始数据。

    示例:数据“切割”处理
    假设获得 00:00 时刻的5分钟粒度流量为50,那么经处理后存储的1分钟粒度数据为[10,10,10,10,10],分别对应 00:00、00:01、00:02、00:03、00:04 时刻的流量。

拨测任务

多云CDN默认存储探测响应数据作为原始数据。拨测任务的“拨测频率”决定了探测响应数据的粒度。

例如,“拨测频率”为5分钟(每5分钟发起一轮探测),则会获得5分钟粒度的探测响应数据(每5分钟一个数据点)。

云产品不支持特定监控指标的情况

由于部分第三方云产品不支持特定的加速域名监控指标,多云CDN无法获得相应数据。针对这种情形,您在创建告警策略时需要留意。如果告警策略引用了多云CDN无法获得数据的指标,那么该告警策略不会生效。

示例:
假设您的域名从七牛云 CDN 同步多云CDN。由于七牛云 CDN 不支持任何回源统计指标(查阅下表可知),如果您为域名创建基于“回源带宽”的告警策略,那么该告警策略不会生效。

下表罗列了不完全支持所有加速域名监控指标的云产品,以及它们不支持的指标。

说明

对于表格中没有出现的云产品,它们支持所有加速域名监控指标。这意味着,只有当您使用了下表出现的第三方云产品时,您需要留意哪些指标不被支持。

指标 \ 云产品腾讯云 CDN腾讯云 ECDN腾讯云 EdgeOne七牛云 CDNAkamai AMD和DSA、AWS CloudFront 和 Google Cloud Media CDNAzure CDNCloudflare CDN中国移动 CDN
  • 访问带宽
  • 访问流量
  • 访问请求数
  • 访问QPS
  • 访问状态码2xx、3xx、4xx、5xx占比

  • 访问状态码2xx(具体)、3xx(具体)、4xx(具体)、5xx(具体)占比

  • 流量命中率
  • 请求数命中率

  • 回源带宽
  • 回源流量
  • 回源请求数
  • 回源QPS
  • 回源状态码2xx、3xx、4xx、5xx占比

  • 回源状态码2xx(具体)、3xx(具体)、4xx(具体)、5xx(具体)占比

  • 证书有效期

云产品不支持1分钟粒度数据的情况

针对部分第三方云产品不支持1分钟粒度的加速域名监控数据,多云CDN获取相应的5分钟粒度数据并处理后转存为1分钟粒度数据。这将导致您在查询相应1分钟粒度数据时,存在失真的可能。(查询5分钟及更大粒度的数据时,不存在失真。)

“不支持1分钟粒度数据”的情形包括:

  • 以下第三方云产品完全不支持1分钟粒度数据(适用于所有加速域名监控指标):

    • 网宿科技 CDN
    • 华为云 CDN
    • 七牛云 CDN
    • 中国移动 CDN
  • 针对个别指标,第三方云产品不支持1分钟粒度数据。具体包括:

    • 阿里云 CDN 不支持1分钟粒度的“回源请求数”