弹性伸缩是云计算领域资源类产品上被广泛采用的功能,典型的场景包含在线业务弹性、大规模计算训练、深度学习 GPU 或共享 GPU 的训练与推理、定时周期性负载变化等。集群中的弹性伸缩,主要分为以下两个维度:
在容器服务(VKE)集群中,资源层和调度层均支持的弹性伸缩功能,详情如下表所示。
方案名称 | 方案介绍 | 相关文档 |
---|---|---|
节点弹性伸缩 | 基于 CA(Cluster Autoscaler),根据 Pod 调度状态及资源使用情况对集群的节点进行自动扩容缩容,保证集群内的基础资源能够满足业务的正常需求。 | 创建节点弹性伸缩 |
工作负载弹性伸缩 | HPA:基于指标的工作负载弹性伸缩,允许基于 Pod 的 CPU 利用率、内存利用率、GPU 显存利用率、网络吞吐率等指标,对工作负载中的 Pod 数量进行自动扩缩容。 说明 HPA 也支持基于自定义指标进行弹性伸缩。 | |
CronHPA:支持在指定时间进行工作负载自动扩缩容,适用于应用资源使用率存在周期性变化的场景。 | 创建定时伸缩 | |
IHPA:能够结合工作负载的历史数据和预测数据,构建资源画像,建立工作负载副本数与资源(CPU、内存利用率)基于时间变化的资源视图,并基于数据驱动,精准调整业务副本数,及时响应业务峰值变化。 | 创建智能伸缩 |