集群诊断可以帮助用户发现容器服务集群中各类资源可能存在的潜在风险,包括:节点池、节点、Pod 等。本文为您介绍如何配置节点池诊断。
配置项 | 说明 |
---|---|
诊断类型 | 配置需要进行诊断的资源类型,本示例中选择 节点池。 |
节点池 | 在左侧 全部节点池 列表中,单击勾选需要进行诊断的节点池,将其加入到右侧的 已选择节点池 列表中。 |
诊断任务执行完成后,如果当前诊断任务的状态为 异常,则说明节点池中存在风险项。您可以单击诊断任务列表 操作 列中对应的 查看详情,查看诊断报告。
诊断结果中会展示所有的诊断项、成功诊断项、未通过诊断项和警告诊断项,您需要查看 待处理 下的诊断项,并完成问题修复。
诊断任务完成后,您可以下载 PDF 格式的诊断报告。
诊断项 | 检查内容 | 修复建议 | 参考文档 |
---|---|---|---|
最近 6h 扩容记录检查 | 检查最近 6 小时内,集群是否存在扩容失败记录。扩容失败可能导致集群内资源不足,从而影响业务正常调度。 |
| |
最近 6h 缩容记录检查 | 检查最近 6 小时内,集群是否存在缩容失败记录。缩容失败可能导致集群内资源闲置从而造成浪费。 |
| |
节点池状态检查 | 检查节点池是否为 非 Running 状态。节点池状态异常会导致节点池资源不可用。 | 请参考节点池状态进行问题排查。 | 节点池状态 |
集群状态检测 | 检查集群是否为 非 Running 状态。集群状态异常会导致节点池资源不可用。 |
| |
ECS 库存检查 | 检查当前节点池中使用的 ECS 规格是否存在库存。ECS 库存售罄会导致无法创建该类型的节点,节点池扩容失败。 |
| |
EIP 容量 | 检查 EIP 剩余容量是否 < 1。EIP 不足时,如果节点池开启节点自动绑定公网 IP,会导致节点池扩容失败。 | 提交申请,提升配额。 | 依赖底层云产品配额限制 |
用户 VKE 集群节点 Quota | 检查集群节点配额。配额耗尽会导致节点池无法添加节点,扩容失败。 | 提交申请,提升配额。 | 集群配额限制 |
VPC 子网剩余可用 IP | 检查 VPC 网络中的剩余 IP 地址数量是否 < 5。VPC 网络中的 IP 地址耗尽,会导致后续无法创建新的 ECS,节点池扩容失败。 | 无 | 无 |
VPC 安全组检查 | 检查 VPC 安全组,安全组规则配置会影响集群内部网络连通性。 | 无 | 配置安全组 |
是否开启弹性伸缩 | 检查节点池是否开启了弹性伸缩。如未开启,可能导致节点池内的节点负载过高,无法自动扩容。 | 开启节点池弹性伸缩功能。 | 配置节点池弹性伸缩 |
CA 组件状态 | 检查集群中是否安装了集群自动伸缩组件(cluster-autoscaler),以及组件状态是否正常。如果组件未安装或状态异常,会导致节点池无法进行弹性伸缩。 | 安装集群自动伸缩组件(cluster-autoscaler)并保证组件正常。 | 安装组件 |