You need to enable JavaScript to run this app.
导航
配置 VCI 磁盘使用率监控与告警
最近更新时间:2024.09.30 15:50:43首次发布时间:2024.09.30 15:50:43

本文主要描述配置 VCI 实例磁盘使用率监控与告警的方法。

背景信息

用户的 VCI 实例(VCI Pod)在使用 EBS 云盘(弹性块存储)时,可能会出现随着业务运行时长增加,磁盘空间被打满的情况。为防止磁盘空间不足对用户业务带来影响,VCI 支持配置 VCI Pod 磁盘使用率的监控、告警策略,帮助用户提前关注相关风险。

由于 VCI Pod 运行在虚拟节点上,并不存在真实物理节点,因此磁盘与 Pod 相关而不是与节点相关。监控 VCI Pod 的磁盘时,需要配置 Pod 级别的磁盘监控和告警才能感知 VCI Pod 磁盘水位情况。VCI 支持通过托管 Prometheus 服务(VMP)或云监控来配置 VCI Pod 磁盘使用率的监控及告警。

使用托管 Prometheus 服务

对接服务

使用 VMP 配置 VCI Pod 的磁盘使用率监控和告警前,需要对接服务。详细操作,请参见 使用托管 Prometheus 监控 VCI

当前 VCI 已支持的磁盘相关监控指标,请参见 通过虚拟节点获取 VCI 监控指标 中的 存储卷 表格内容。

说明

由于 EBS 云盘可以作为 VCI Pod 的系统盘和数据盘,可以通过 Label:volume_type的 Value 来区分:

  • system:系统盘的 Label Value。
  • data:数据盘的 Label Value。

监控

对接 VMP 后,可在 VMP 控制台查询 VCI Pod 磁盘使用率的监控指标。详细的操作,请参见 指标查询

  1. 登录 托管 Prometheus 控制台
  2. 在顶部导航栏,选择目标地域。
  3. 单击左侧导航栏的 Explore,进入 Explore 页面。
  4. 在右上角的配置项中,配置需要查询指标的 工作区查询时间段 和 数据刷新方式
  5. 使用 PromQL 查询语句查询 VCI Pod 磁盘相关指标。
    以查询 ID 为vci-3vvac********的 VCI Pod 的系统盘使用率为例,查询语句如下:
    kubelet_volume_stats_used_bytes{vci_instance_id="vci-3vvac********",volume_type="system"}/kubelet_volume_stats_capacity_bytes{vci_instance_id="vci-3vvac********",volume_type="system"} * 100 
    
  6. 单击 查询,即可查询相关的指标,并显示指标大盘。
    返回结果如下图所示,表示该 VCI Pod 的系统盘使用率目前为 2.34%。
    alt

告警

对接 VMP 后,可在 VMP 控制台配置告警规则并通过查询语句和触发策略。详细的操作,请参见 创建告警规则

  1. 登录 VMP 服务控制台
  2. 在顶部导航栏,选择目标地域。
  3. 在左侧导航栏选择 告警中心 > 告警规则
  4. 告警规则 页面,选择 创建 > 手动创建,并根据系统提示结合您的实际需求,配置参数。详细的参数配置说明,请参见 创建告警规则
    以 ID 为vci-3vvac********的 VCI Pod 的系统盘使用率为例,VCI 相关 查询语句 如下:
    sum((kubelet_volume_stats_used_bytes{vci_instance_id="vci-3vvac********"}/kubelet_volume_stats_capacity_bytes{vci_instance_id="vci-3vvac********"}) * 100) by (vci_instance_id, volume_type)
    
    alt

使用云监控服务

对接服务

使用云监控监控和查看 VCI Pod 的磁盘使用率监控和告警前,需要对接服务。详细操作,请参见 接入云监控

当前 VCI 支持通过云监控服务进行监控的磁盘相关指标为:存储卷声明 inode 使用率存储卷声明容量使用率。更多信息,请参见 存储卷声明

注意

云监控仅支持监控 VCI Pod 的数据盘,不支持监控系统盘。

监控

对接云监控服务后,可在云监控控制台查询 VCI Pod 磁盘使用率的监控指标。详细的操作,请参见 查看容器服务监控数据

  1. 登录 云监控控制台
  2. 在左侧导航栏中,单击 云产品监控
  3. 在产品列表中搜索并单击 容器服务,进入容器服务监控信息页面。
  4. 在资源选择下拉列表中,选择 存储卷声明,并进一步筛选目标 集群命名空间,即可查看 VCI Pod 磁盘使用率监控信息。
    alt

告警

对接云监控服务后,可在云监控控制台配置 VCI Pod 磁盘使用率的告警策略、触发条件等。详细的操作,请参见 查看容器服务监控数据

  1. 登录 云监控控制台
  2. 在左侧导航栏中,选择 告警中心 > 告警策略
  3. 单击 创建告警策略务,按如下图说明从 存储卷声明 维度,为 VCI Pod 配置告警策略。详细的操作步骤和参数配置说明,请参见 创建告警策略
    alt