本文主要描述配置 VCI 实例磁盘使用率监控与告警的方法。
用户的 VCI 实例(VCI Pod)在使用 EBS 云盘(弹性块存储)时,可能会出现随着业务运行时长增加,磁盘空间被打满的情况。为防止磁盘空间不足对用户业务带来影响,VCI 支持配置 VCI Pod 磁盘使用率的监控、告警策略,帮助用户提前关注相关风险。
由于 VCI Pod 运行在虚拟节点上,并不存在真实物理节点,因此磁盘与 Pod 相关而不是与节点相关。监控 VCI Pod 的磁盘时,需要配置 Pod 级别的磁盘监控和告警才能感知 VCI Pod 磁盘水位情况。VCI 支持通过托管 Prometheus 服务(VMP)或云监控来配置 VCI Pod 磁盘使用率的监控及告警。
使用 VMP 配置 VCI Pod 的磁盘使用率监控和告警前,需要对接服务。详细操作,请参见 使用托管 Prometheus 监控 VCI。
当前 VCI 已支持的磁盘相关监控指标,请参见 通过虚拟节点获取 VCI 监控指标 中的 存储卷 表格内容。
说明
由于 EBS 云盘可以作为 VCI Pod 的系统盘和数据盘,可以通过 Label:volume_type
的 Value 来区分:
system
:系统盘的 Label Value。data
:数据盘的 Label Value。对接 VMP 后,可在 VMP 控制台查询 VCI Pod 磁盘使用率的监控指标。详细的操作,请参见 指标查询。
vci-3vvac********
的 VCI Pod 的系统盘使用率为例,查询语句如下:kubelet_volume_stats_used_bytes{vci_instance_id="vci-3vvac********",volume_type="system"}/kubelet_volume_stats_capacity_bytes{vci_instance_id="vci-3vvac********",volume_type="system"} * 100
对接 VMP 后,可在 VMP 控制台配置告警规则并通过查询语句和触发策略。详细的操作,请参见 创建告警规则。
vci-3vvac********
的 VCI Pod 的系统盘使用率为例,VCI 相关 查询语句 如下:sum((kubelet_volume_stats_used_bytes{vci_instance_id="vci-3vvac********"}/kubelet_volume_stats_capacity_bytes{vci_instance_id="vci-3vvac********"}) * 100) by (vci_instance_id, volume_type)
使用云监控监控和查看 VCI Pod 的磁盘使用率监控和告警前,需要对接服务。详细操作,请参见 接入云监控。
当前 VCI 支持通过云监控服务进行监控的磁盘相关指标为:存储卷声明 inode 使用率、存储卷声明容量使用率。更多信息,请参见 存储卷声明。
注意
云监控仅支持监控 VCI Pod 的数据盘,不支持监控系统盘。
对接云监控服务后,可在云监控控制台查询 VCI Pod 磁盘使用率的监控指标。详细的操作,请参见 查看容器服务监控数据。
对接云监控服务后,可在云监控控制台配置 VCI Pod 磁盘使用率的告警策略、触发条件等。详细的操作,请参见 查看容器服务监控数据。