You need to enable JavaScript to run this app.
导航
弹性伸缩概述
最近更新时间:2025.02.14 11:41:09首次发布时间:2022.03.04 23:10:38

弹性伸缩是云计算领域资源类产品上被广泛采用的功能,典型的场景包含在线业务弹性、大规模计算训练、深度学习 GPU 或共享 GPU 的训练与推理、定时周期性负载变化等。集群中的弹性伸缩,主要分为以下两个维度:

  • 资源层弹性:即节点弹性伸缩,当集群的容量规划不能满足集群调度容量时,会通过添加 ECS(Elastic Compute Service,云服务器) 或 VCI(Volcengine Container Instance,弹性容器实例)等资源的方式,补充集群整体的调度容量。
  • 调度层弹性:即工作负载弹性伸缩,通过增加应用负载副本的方式,修改负载的调度容量。例如,HPA(Horizontal Pod Autoscaler,容器水平伸缩)是典型的调度层弹性组件,通过 HPA 可以调整应用的副本数,调整的副本数会改变当前负载占用的调度容量,从而实现调度层的伸缩。

在容器服务(VKE)集群中,资源层和调度层均支持的弹性伸缩功能,详情如下表所示。

方案名称方案介绍相关文档
节点弹性伸缩基于 CA(Cluster Autoscaler),根据 Pod 调度状态及资源使用情况对集群的节点进行自动扩容缩容,保证集群内的基础资源能够满足业务的正常需求。创建节点弹性伸缩

工作负载弹性伸缩

HPA:基于指标的工作负载弹性伸缩,允许基于 Pod 的 CPU 利用率、内存利用率、GPU 显存利用率、网络吞吐率等指标,对工作负载中的 Pod 数量进行自动扩缩容。

说明

HPA 也支持基于自定义指标进行弹性伸缩。

CronHPA:支持在指定时间进行工作负载自动扩缩容,适用于应用资源使用率存在周期性变化的场景。创建定时伸缩
IHPA:能够结合工作负载的历史数据和预测数据,构建资源画像,建立工作负载副本数与资源(CPU、内存利用率)基于时间变化的资源视图,并基于数据驱动,精准调整业务副本数,及时响应业务峰值变化。创建智能伸缩