在创建工作区前,您首先需要了解与工作区相关的基本概念,方便您基于实际需求,选择合理规格的工作区。
数据存储天数,即采集到的指标在托管 Prometheus 工作区中的保存时间。主要包括:15 天和 30 天。从该指标被采集并保存在工作区开始算起,在该时间段内,您可以随时查询该数据。但超过该时间后,该数据将会被删除,无法再查询。
因此,您需要根据数据保存的时间需求,合理选择数据需要保存的时间。下图展示了数据存储天数为 30 天的工作区内,数据入库、可查询和删除的时间轴。
最大活跃时序数是评估数据规模最重要的参考因素。您需要基于监控的对象(Kubernetes 集群、应用等)估算合理的所需最大活跃时序数。
时间序列,简称为 时序,是 Prometheus 数据的基本组成。一个时间序列由 指标名称(metrics name) 和一组 标签集(labelset) 命名,并按照时间戳进行排列。
node_cpu_seconds_total
- 节点 CPU 的使用时间node_filesystem_free_bytes
- 文件系统挂载点上的可用空间kube_pod_status_ready
- 集群中所有处于 Ready 状态的 Podlabel="value"
标签。例如:
node_cpu_seconds_total{cluster="ccdxxx",host_ip="10.10.128.2"}
kube_pod_status_ready{namespace="default"}
kube_pod_status_ready
kube_pod_status_ready{namespace="default"}
kube_pod_status_ready{namespace="volcano-metrics"}
说明
时间序列的更多细节,请参见 Prometheus 时序数据格式。
如果一个时间序列在指定时间(1 小时)内被抓取到新数据,那么它被称为活跃时间序列。
活跃时序数与工作区的写入能力有直接相关。如果您的最大活跃时序数超过了工作区的配额,会导致所采集的到数据被丢弃。因此,您需要根据实际情况,合理估算最大活跃时序数。