CNI 网络 Kubernetes 集群最重要的底层资源和基础设施,其资源池最大容量、资源池当前资源总数等指标直接关系到集群的性能和稳定性。本文为您介绍如何配置 CNI 网络观测。
监控开启后,您可以配置采集规则,选择需要采集的目标组件、具体指标项及采集间隔。可以根据实际需求丢弃一些不用的指标。
说明
您可以基于系统预置的告警模板,快速完成 CNI 网络观测的告警配置。
配置项 | 说明 |
---|---|
告警模版 | 勾选需要的告警模版,允许多选。 |
告警聚合策略 | 在下拉菜单中选择告警聚合策略。详情请参见 创建告警聚合策略。 |
告警通知策略 | 在下拉菜单中选择告警通知策略。系统会使用通知策略中配置的告警等级和联系人组,将告警发送给指定的联系人。详情请参见 创建告警通知策略。 |
您可以查看 CNI 网络的监控信息,包括:IP 池最大容量、IP 池缓存目标值、IP 池缓存最小值等。支持设置查询的时间段,并指定刷新方式(手动刷新、自动刷新)。
该看板的指标清单如下表所示。
看板名称 | PromQL 语句 |
---|---|
IP 池最大容量 | resource_pool_max_cap{cluster="$ClusterId", node="$Node"} |
IP 池缓存目标值 | resource_pool_target{cluster=~"$ClusterId", node=~"$Node"} |
IP 池缓存最小值 | resource_pool_target_min{cluster=~"$ClusterId", node=~"$Node"} |
IP 池当前 IP 总数 | resource_pool_total{cluster=~"$ClusterId", node=~"$Node"} |
IP 池当前可用 IP 数 | resource_pool_available{cluster="$ClusterId", node=~"$Node"} |
说明
如果您需要在托管 Prometheus 中的 Explore 功能或告警中心使用上述 PromQL 语句查看具体的指标或配置告警,请修改或删除语句中关于集群、节点、容器组的变量。例如:将 cluster=~"$ClusterId"
参数中的$ClusterId
变量修改为具体的集群 ID ,或直接删除该参数。
您可以使用托管 Prometheus 的 Explore 功能来快速查询和展示指标数据。详情请参见 指标查询。