You need to enable JavaScript to run this app.
导航
统计分析问题
最近更新时间:2024.06.13 14:33:59首次发布时间:2023.11.01 21:28:50

如何将统计的流量换算成带宽

CDN 的带宽数据是基于流量数据计算的,例如:

  • 某 5 分钟内产生的流量为 6 GB ,则其对应的带宽 = (6*8)/ (60*5)= 0.16 Gbps。60*5 表示 300 秒。

  • 带宽的进制为:1Gbps = 1000 Mbps、1Mbps = 1000 Kbps、1Kbps = 1000 bps。

  • 流量的进制为:1GB = 1000 MB、1MB = 1000 KB、1KB = 1000 B。

实时监控和账单中的数据与访问日志中记录的数据不一致

实时监控的数据和账单中的用量数据是 CDN 在数据传输层统计的。访问日志中的数据是 CDN 在应用层统计的。

先做个比喻。您用快递寄送一件物品,快递费是根据物品重量加上包装材料的重量来计算的。如果包裹在途中丢失,您可能还要承担重新寄送包裹带来的损失。假设您要寄送的物品是 900 克,包装后达到 1.1 公斤。由于包裹在途中丢失,您不得不重新寄送包裹。最终您支付的费用涵盖了两个 1.1 公斤包裹的快递费和重新寄送物品本身的价值。

在这个比喻中,您是在应用层,关注的是物品的重量。快递公司在数据传输层,除了物品重量外,还关注物品的包装和包裹的送达。

CDN 统计指标数据的方式

以流量为例,CDN 在数据传输层统计的数据由以下两部份组成:

  • 请求文件的大小。该流量与 CDN 日志中记录的文件大小相同。
  • TCP/IP 包头以及 TCP 重传所产生的流量。该流量大约是基于 CDN 日志而统计的流量的 10%。

TCP/IP 包头

  • HTTP 请求基于 TCP/IP 协议。每个传输的 TCP 包大小是 46~1,500 个字节,包括表示 TCP 协议的 20 字节包头以及表示 IP 协议的 20 字节包头。
  • 每个传输的 TCP 包是在一个以太网帧中传输的。当前以太网帧格式采用的是 Ethernet Ⅱ 格式。格式是:前导码 (8byte) | 目的 MAC (6byte) | 源 MAC (6byte) | 类型 (2byte) | 数据 (46~1500byte) | FCS (4byte)。因此,每个以太网帧的头部会额外增加 26 个字节,一个以太网帧最大是 1,526 个字节。
  • 因此,在一个以太网帧中,各种头部的大小总共为 20 + 20 + 26 = 66 个字节。由于这些头部是操作系统内核层的协议栈添加的,因此 CDN 无法在应用层获取到这 66 个字节。在不考虑 TCP 重传、TCP 三次握手、TCP 四次挥手过程中的包头,这些头部所产生的流量大约是基于 CDN 日志而统计的流量的 4.52%。计算公式是:[66*(日志流量/1460)]/日志流量 = 66/1460 = 4.52% 。

TCP 重传

  • 在 TCP 包的传输过程中,如果因为网络抖动等原因导致 3%-10% 的 TCP 包丢失,服务器会重传丢失的包。由于重传也是由操作系统内核层的协议栈进行的,CDN 无法在应用层识别这些重传的 TCP 包。重传的 TCP 包所产生的流量大约是基于 CDN 日志而统计的流量的 3%-7%。

流量命中率是如何计算的

缓存的命中率包括请求命中率和流量命中率:

  • 请求命中率 =(边缘节点收到的请求数 - 回源请求数)/ 边缘节点收到的请求数

  • 流量命中率 =(边缘节点向用户传输的流量 - 回源请求产生的流量) / 边缘节点向用户传输的流量

平均响应时间和下载速度是如何计算的

平均响应时间

  • 如果指定的时间粒度是 1 分钟或 5 分钟,每个统计时间段的平均响应时间按以下方式计算:

    • 指定时间范围内所有用户请求的响应时间总和 / 请求数响应时间的单位是毫秒。
  • 如果指定的时间粒度是 1 小时或 1 天,每个统计时间段的平均响应时间按以下方式计算:

    1. 以 5 分钟粒度计算并得到一系列平均响应时间的数据。

    2. 计算这些数据的平均值。

下载速度

  • 如果指定的时间粒度是 1 分钟或 5 分钟,每个统计时间段的平均下载速度按以下方式计算:

    1. 计算每个用户请求的下载速度。
      单个请求的下载速度 = 单个请求的响应文件大小/响应时间。速度的单位是 Bps。

    2. 计算这些下载速度的平均值。

  • 如果指定的时间粒度是 1 小时或 1 天,每个统计时间段的平均下载速度按以下方式统计:

    1. 以 5 分钟粒度计算并得到一系列平均下载速度的数据。

    2. 计算这些数据的平均值。

状态码统计会统计所有产生的状态码吗

不会。目前,CDN 统计的是 2xx、3xx、4xx、5xx 的状态码。

查询监控数据时,加速区域和访问区域这两个筛选条件有什么区别

这两个区域的范围和定义是不同的,前者的范围更大,粒度更粗。

  • 加速区域:也称为计费区域,表示响应用户请求的边缘节点所归属的区域。例如,中国内地,亚太一区,亚太二区,欧洲等。

  • 访问区域:表示用户请求的来源 IP 所归属的地域。例如,中国-上海。

预热的流量会包含在回源流量中吗

不包含。