CA(Cluster Autoscaler,集群弹性伸缩)在 Kubernetes 集群中用于节点的自动伸缩,它监控集群中 Pod 的状态,当集群中存在处于 Pending 状态的 Pod 时,就采用用户指定的伸缩策略,自动扩容或缩容节点。
登录 容器服务控制台。
单击左侧导航栏中的 集群。
在集群列表页面,单击目标集群。
在集群管理页面的左侧导航栏中选择 节点池,单击 弹性伸缩配置。
在 弹性伸缩配置 页面中,单击 编辑规则,配置弹性伸缩规则参数。
说明
此处显示的 弹性伸缩规则 页面配置,与安装 cluster-autoscaler 组件时的配置一致。若编辑规则,表示更改安装 cluster-autoscaler 组件时配置的规则。
配置项 | 说明 |
---|---|
集群名称 | 当前集群的名称,不可修改。 |
扩容算法 | 节点池自动扩容时所采用的扩容算法类型,有如下几种类型:
|
弹性灵敏度 | 用于判断集群弹性伸缩的时间间隔,支持取值:10s、15s、30s、60s、120s、180s 和 300s。 |
自动缩容 | 是否开启节点的自动缩容:
|
开启 自动缩容 后,需要配置以下参数。
配置项 | 说明 |
---|---|
非 GPU 节点的缩容阈值 | 当非 GPU 类型节点的 CPU、内存资源使用率( 说明 非 GPU 类型节点的 CPU 或内存资源中任意一个达到缩容阈值,即可触发该规则。 |
GPU 节点的缩容阈值 | GPU 类型节点的缩容策略根据其是否使用 mGPU 能力,有不同的缩容策略,默认阈值为 50%:
注意
|
缩容触发时延 | 当节点资源使用率低于阈值,并持续该时间段后,集群将触发自动缩容。默认 10 分钟。 |
扩容后缩容冷却时间 | 节点进行扩容后,能再次执行缩容所需等待的时间间隔。默认 10 分钟。 |
缩容失败冷却时间 | 节点缩容失败后,能再次执行缩容所需等待的时间间隔。默认 3 分钟。 |
最大并发缩容数 | 节点缩容时,允许同时进行缩容的并发数目。默认 5。 |
Pod 终止超时时间 | 节点排水时等待 Pod 终止的最大等待时间。整数形式,取值范围为 1~10000,单位为秒。默认为 600 秒。 |
Pod 最小副本数 | 节点排水时允许存在的最小 Pod 数量。整数形式,取值范围为 1~10000。默认为 0。 |
开启 Daemonset 排水 | 节点缩容前是否驱逐节点上 DaemonSet 类型的 Pod。
|
不缩容节点 | 勾选不进行缩容的节点。可选项如下:
|
单击 确定,完成配置。