本文介绍了多云CDN支持的监控对象与指标,以及监控数据的采集方式与限制。
多云CDN能够监控以下对象的相关数据:
查询加速域名 | 查询拨测任务 |
---|---|
在 多云管理 > 域名管理 页面可查看所有加速域名。 | 在 应用中心 > 快捷拨测 页面可查看所有拨测任务。 |
不同监控对象支持不同的监控指标。本章节分别罗列了适用于加速域名的所有监控指标和适用于拨测任务的所有监控指标。
您可以基于监控指标创建 指标阈值 类型的告警策略。在告警策略中,可针对特定指标设置判断条件;当指标数值满足判定条件,就会触发告警。判断条件是根据“阈值”指定的。
例如,针对“访问带宽”指标可设置如下判断条件:连续2个数据点(每1分钟一个数据点)的值大于 100Mbps。其中 100(Mbps)就是阈值。
更多信息,请参见创建告警策略。
指标 | 释义 | 支持动态阈值[1] | 支持根因分析[2] |
---|---|---|---|
访问带宽 | 单位时间内从 CDN[3] 向客户端传输数据的速率。单位:bps。 | ❌ | ❌ |
访问流量 | CDN 向客户端传输的数据总量。单位:bytes。 | ❌ | ❌ |
访问请求数 | 客户端向 CDN 发起的 HTTP 和 HTTPS 请求总数。单位:个。 | ❌ | ❌ |
访问QPS | CDN 每秒处理的客户端请求数量。单位:个/秒。 | ❌ | ❌ |
访问状态码2xx占比 | 状态码为 2xx(包含 200 或 206 等)的客户端请求占所有客户端请求的比例。单位:%。 | ✅ | ❌ |
访问状态码3xx占比 | 状态码为 3xx(包含 301 或 302 等)的客户端请求占所有客户端请求的比例。单位:%。 | ✅ | ❌ |
访问状态码4xx占比 | 状态码为 4xx(包含 401、402、403、404、405、429 或 499 等)的客户端请求占所有客户端请求的比例。单位:%。 | ✅ | ✅ |
访问状态码5xx占比 | 状态码为 5xx(包含 500、501、502、503 或 504 等)的客户端请求占所有客户端请求的比例。单位:%。 | ✅ | ✅ |
访问状态码2xx(具体)占比 | 状态码为 200、206 的客户端请求占所有客户端请求的比例。单位:%。 | ✅ | ❌ |
访问状态码3xx(具体)占比 | 状态码为 301、302 的客户端请求占所有客户端请求的比例。单位:%。 | ✅ | ❌ |
访问状态码4xx(具体)占比 | 状态码为 401、402、403、404、405、429、499 的客户端请求占所有客户端请求的比例。单位:%。 | ✅ | ✅ |
访问状态码5xx(具体)占比 | 状态码为 500、501、502、503、504 的客户端请求占所有客户端请求的比例。单位:%。 | ✅ | ✅ |
流量命中率 | CDN 直接响应客户端的缓存流量(字节数)占总访问流量(客户端请求的字节数)的比例。单位:%。 | ✅ | ❌ |
请求数命中率 | 命中了 CDN 缓存的客户端请求占所有客户端请求的比例。单位:%。 | ✅ | ❌ |
回源带宽 | 单位时间内从源站向 CDN 传输数据的速率。单位:bps。 | ❌ | ❌ |
回源流量 | 源站向 CDN 传输的数据总量。单位:bytes。 | ❌ | ❌ |
回源请求数 | CDN 向源站发起的 HTTP 和 HTTPS 请求总数。单位:个。 | ❌ | ❌ |
回源QPS | 源站每秒处理的回源请求数量。单位:个/秒。 | ❌ | ❌ |
回源状态码2xx占比 | 状态码为 2xx(包含 200、206 等)的回源请求占所有回源请求的比例。单位:%。 | ✅ | ❌ |
回源状态码3xx占比 | 状态码为 3xx 类型(包含 301、302 等)的回源请求占所有回源请求的比例。单位:%。 | ✅ | ❌ |
回源状态码4xx占比 | 状态码为 4xx 类型(包含 401、402、403、404、405、429、499 等)的回源请求占所有回源请求的比例。单位:%。 | ✅ | ✅ |
回源状态码5xx占比 | 状态码为 5xx 类型(包含 500、501、502、503、504 等)的回源请求占所有回源请求的比例。单位:%。 | ✅ | ✅ |
回源状态码2xx(具体)占比 | 状态码为 200 或 206 的回源请求占所有回源请求的比例。单位:%。 | ✅ | ❌ |
回源状态码3xx(具体)占比 | 状态码为 301 或 302 的回源请求占所有回源请求的比例。单位:%。 | ✅ | ❌ |
回源状态码4xx(具体)占比 | 状态码为 401、402、403、404、405、429 或 499 的回源请求占所有回源请求的比例。单位:%。 | ✅ | ✅ |
回源状态码5xx(具体)占比 | 状态码为 500、501、502、503 或 504 的回源请求占所有回源请求的比例。单位:%。 | ✅ | ✅ |
证书有效期 | SSL/TLS 证书有效期剩余天数。单位:天。 | ❌ | ❌ |
指标 | 释义 |
---|---|
❏ HTTP/HTTPS 拨测(适用于可用性策略拨测、多云拨测和自定义 HTTP/HTTPS 拨测任务) | |
整体性能 | 从拨测节点发起 HTTP/HTTPS 请求开始,到完整接收服务器返回的响应体所消耗的总时间。单位:ms。 |
DNS时延 | 从拨测节点发起 DNS 查询请求开始,到拨测节点收到 DNS 服务器返回的解析结果的时间间隔。单位:ms。 |
SSL时延 | 从 TCP 连接建立完成后,拨测节点发送 TLS ClientHello 报文开始,到成功完成加密握手(包括证书验证、密钥交换、加密套件协商等步骤)的总耗时。单位:ms。 |
建连时间 | 从拨测节点发送首个 TCP SYN 报文开始,到成功完成三次握手(收到服务器的 SYN-ACK 并回复 ACK)的总耗时。单位:ms。 |
首包时间 | 在完成 TCP 握手(若为 HTTPS 则包含 TLS 协商)后,从拨测节点发送完 HTTP 请求报文到接收到服务器返回的第一个响应数据包所经历的时间。单位:ms。 |
重定向时间 | 拨测节点接收到 HTTP 3xx 重定向响应后,向新 URL 发起请求并成功接收首个响应数据包的总耗时。(若存在多次跳转则为各次耗时的累加值)。单位:ms。 |
平均下载速度 | 下载阶段的数据传输速率。单位:KB/s。 |
可用率 | 统计周期内目标地址的 HTTP 或 HTTPS 协议可达性百分比。计算方式如下:成功探测次数/总探测次数 * 100%。
|
❏ DNS 拨测(适用于自定义 DNS 拨测任务) | |
DNS时延 | 从拨测节点发起 DNS 查询请求开始,到拨测节点收到 DNS 服务器返回的解析结果的时间间隔。单位:ms。 |
可用率 | 统计周期内获得有效响应的 DNS 探测次数占总探测次数的百分比。计算方式如下:获得有效响应的探测次数/总探测次数 * 100%。
|
❏ Ping 拨测(适用于自定义 Ping 拨测任务) | |
Ping时延 | (针对一次 Ping)拨测节点发送网络包到目标地址并接收到响应包的平均往返时间(RTT,Round-Trip Time)。单位:ms。 |
Ping丢包率 | (针对一次 Ping)未收到响应的网络包数量占发送总包数的百分比,计算公式为:(发送包数 - 接收包数) / 发送包数 * 100%。 |
Ping可用率 | (针对一次 Ping)收到响应的网络包数量占发送总包数的百分比,计算公式为:接收包数 / 发送包数 * 100%。 |
可用率 | 统计周期内目标地址的 Ping 可达性百分比。计算方式如下:成功探测次数/总探测次数 * 100%。
|
❏ TCP 拨测(适用于自定义 TCP 拨测任务) | |
TCP总用时 | 从发起 TCP 连接请求(发送 SYN 包)开始,到完成数据发送、接收及连接正常关闭(FIN-ACK 流程)的全过程总耗时。单位:ms。 |
TCP连接用时 | 完成 TCP 三次握手的时间跨度,即从拨测节点发送首个 SYN 包开始,到成功接收服务器的 SYN-ACK 包并回复最终 ACK 包的时间。单位:ms。 |
TCP发送用时 | 从拨测节点发送最后一个 TCP 报文段(承载完整应用层请求,如 HTTP 请求)到接收到该报文段对应的 TCP ACK 确认的时间。单位:ms。 |
TCP接收用时 | 从拨测节点发送完请求到完整接收服务器返回的所有响应数据的时间。 |
TCP响应用时 | 从拨测节点完成请求数据发送到接收到服务器返回的第一个响应数据包的时间。 |
可用率 | 统计周期内目标地址的 TCP 协议可达性百分比。计算方式如下:成功探测次数/总探测次数 * 100%。
|
注:
[1] 阈值有两种类型:静态阈值和动态阈值。所有指标都支持静态阈值,只有部分指标支持动态阈值。
[2] 根因分析是多云CDN提供的一个故障分析工具,目前只适用于部分指标。根因分析允许您对告警期间收集的所有关联数据进行自动分析,定位导致告警的原因。更多信息,请参见告警详情信息。
[3] “CDN”是一种简化的说法,实际也可能是动态加速或其他加速产品,取决于接入多云CDN的第三方云产品。
不同监控对象的数据采集方式不同。
监控对象 | 数据采集方式 |
---|---|
加速域名 | 多云CDN调用云服务商的相关接口获取原始数据。
|
拨测任务 | 多云CDN默认存储探测响应数据作为原始数据。拨测任务的“拨测频率”决定了探测响应数据的粒度。
|
由于部分第三方云产品不支持特定的加速域名监控指标,多云CDN无法获得相应数据。针对这种情形,您在创建告警策略时需要留意。如果告警策略引用了多云CDN无法获得数据的指标,那么该告警策略不会生效。
示例:
假设您的域名从七牛云 CDN 同步多云CDN。由于七牛云 CDN 不支持任何回源统计指标(查阅下表可知),如果您为域名创建基于“回源带宽”的告警策略,那么该告警策略不会生效。
下表罗列了不完全支持所有加速域名监控指标的云产品,以及它们不支持的指标。
说明
对于表格中没有出现的云产品,它们支持所有加速域名监控指标。这意味着,只有当您使用了下表出现的第三方云产品时,您需要留意哪些指标不被支持。
指标 \ 云产品 | 腾讯云 CDN | 腾讯云 ECDN | 腾讯云 EdgeOne | 七牛云 CDN | Akamai AMD和DSA、AWS CloudFront 和 Google Cloud Media CDN | Azure CDN | Cloudflare CDN | 中国移动 CDN |
---|---|---|---|---|---|---|---|---|
| ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ✅ | ✅ |
| ❌ | ❌ | ❌ | ✅ | ❌ | ❌ | ✅ | ✅ |
| ✅ | ✅ | ❌ | ❌ | ❌ | ❌ | ✅ | ✅ |
| ✅ | ❌ | ❌ | ❌ | ❌ | ❌ | ✅ | ✅ |
| ❌ | ❌ | ❌ | ❌ | ❌ | ❌ | ✅ | ✅ |
| ✅ | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
针对部分第三方云产品不支持1分钟粒度的加速域名监控数据,多云CDN获取相应的5分钟粒度数据并处理后转存为1分钟粒度数据。这将导致您在查询相应1分钟粒度数据时,存在失真的可能。(查询5分钟及更大粒度的数据时,不存在失真。)
“不支持1分钟粒度数据”的情形包括:
以下第三方云产品完全不支持1分钟粒度数据(适用于所有加速域名监控指标):
针对个别指标,第三方云产品不支持1分钟粒度数据。具体包括: