You need to enable JavaScript to run this app.
导航
基本概念
最近更新时间:2024.07.10 17:58:00首次发布时间:2023.06.06 10:27:33

在创建工作区前,您首先需要了解与工作区相关的基本概念,方便您基于实际需求,选择合理规格的工作区。

数据存储天数

数据存储天数,即采集到的指标在托管 Prometheus 工作区中的保存时间。主要包括:15 天和 30 天。从该指标被采集并保存在工作区开始算起,在该时间段内,您可以随时查询该数据。但超过该时间后,该数据将会被删除,无法再查询。

因此,您需要根据数据保存的时间需求,合理选择数据需要保存的时间。下图展示了数据存储天数为 30 天的工作区内,数据入库、可查询和删除的时间轴。
alt

最大活跃时序数

最大活跃时序数是评估数据规模最重要的参考因素。您需要基于监控的对象(Kubernetes 集群、应用等)估算合理的所需最大活跃时序数。

时间序列

时间序列,简称为 时序,是 Prometheus 数据的基本组成。一个时间序列由 指标名称(metrics name) 和一组 标签集(labelset) 命名,并按照时间戳进行排列。

  • 每个时间序列都有一个名称。例如:
    • node_cpu_seconds_total - 节点 CPU 的使用时间
    • node_filesystem_free_bytes - 文件系统挂载点上的可用空间
    • kube_pod_status_ready - 集群中所有处于 Ready 状态的 Pod
  • 每个时间序列可以有多个 label="value" 标签。例如:
    • node_cpu_seconds_total{cluster="ccdxxx",host_ip="10.10.128.2"}
    • kube_pod_status_ready{namespace="default"}
  • 如果两个时间序列的名称或者标签的键值有任何一个不同,那么就被定义为不同的时间序列。例如下面的示例就为 3 个时间序列:
    • kube_pod_status_ready
    • kube_pod_status_ready{namespace="default"}
    • kube_pod_status_ready{namespace="volcano-metrics"}

说明

时间序列的更多细节,请参见 Prometheus 时序数据格式

活跃时序

如果一个时间序列在指定时间(1 小时)内被抓取到新数据,那么它被称为活跃时间序列。

活跃时序数与工作区的写入能力有直接相关。如果您的最大活跃时序数超过了工作区的配额,会导致所采集的到数据被丢弃。因此,您需要根据实际情况,合理估算最大活跃时序数。