智能伸缩(Intelligent Horizontal Pod Autoscaler,IHPA)提供数据驱动工作负载扩缩容的过程,为业务方提供精细化控制资源副本数的能力,有效解决传统 HPA 基于固定计划执行副本数扩缩容操作,资源扩缩容操作滞后于业务突发流量的场景。
说明
【邀测·申请试用】:该功能目前处于邀测阶段,如需使用,请提交申请。
Kubernetes 集群中传统的工作负载弹性伸缩,主要包括指标伸缩(HPA)和定时伸缩(CronHPA),这两种方法均存在各自的缺点和局限性,如下表所示。
弹性伸缩方式 | 主要缺点 |
---|---|
指标伸缩(HPA) | 基于工作负载的指标变化调整副本数,弹性触发总是滞后于业务变化,这意味着在面对指标突增时,弹性行为滞后,给业务安全带来风险。 |
定时伸缩(CronHPA) |
|
为解决 HPA 和 CronHPA 的痛点,火山引擎云原生团队结合了内部 AI 算法团队提供的时序预测算法,推出了免运维、能够根据预测提前扩容的智能伸缩(Intelligent Horizontal Pod Autoscaler,IHPA)功能。IHPA 能够结合工作负载的历史数据和预测数据,构建资源画像,建立工作负载副本数与资源(CPU、内存利用率)基于时间变化的资源视图,并基于数据驱动,精准调整业务副本数,及时响应业务峰值变化。
智能伸缩的核心能力,如下图所示。
智能伸缩适用于以下典型场景: