You need to enable JavaScript to run this app.
导航
智能伸缩概述
最近更新时间:2024.07.24 16:07:47首次发布时间:2024.07.24 16:07:47

智能伸缩(Intelligent Horizontal Pod Autoscaler,IHPA)提供数据驱动工作负载扩缩容的过程,为业务方提供精细化控制资源副本数的能力,有效解决传统 HPA 基于固定计划执行副本数扩缩容操作,资源扩缩容操作滞后于业务突发流量的场景。

说明

邀测·申请试用】:该功能目前处于邀测阶段,如需使用,请提交申请。

背景信息

Kubernetes 集群中传统的工作负载弹性伸缩,主要包括指标伸缩(HPA)和定时伸缩(CronHPA),这两种方法均存在各自的缺点和局限性,如下表所示。

弹性伸缩方式主要缺点
指标伸缩(HPA)基于工作负载的指标变化调整副本数,弹性触发总是滞后于业务变化,这意味着在面对指标突增时,弹性行为滞后,给业务安全带来风险。

定时伸缩(CronHPA)

  • 需要手动为每个工作负载指定弹性时间和副本数,当工作负载数量较大时,成本和复杂度较高。
  • 业务发生变化时,无法自动感知变化,仍然需要人工调整,灵活性较差。

智能伸缩

核心能力

为解决 HPA 和 CronHPA 的痛点,火山引擎云原生团队结合了内部 AI 算法团队提供的时序预测算法,推出了免运维、能够根据预测提前扩容的智能伸缩(Intelligent Horizontal Pod Autoscaler,IHPA)功能。IHPA 能够结合工作负载的历史数据和预测数据,构建资源画像,建立工作负载副本数与资源(CPU、内存利用率)基于时间变化的资源视图,并基于数据驱动,精准调整业务副本数,及时响应业务峰值变化。

智能伸缩的核心能力,如下图所示。
alt

应用场景

智能伸缩适用于以下典型场景:

  • 业务流量突发,资源扩缩容响应滞后:基于业务实际资源用量触发扩缩容操作,副本数扩缩容操作完成前,需要等待一段时间才能正常响应业务流量,导致业务 Pending。
  • 基于业务波峰波谷指定工作副本数,造成资源浪费或不足:业务具备周期性资源波动的特征,需要频繁的人为干预,根据最高和最低的业务流量指定副本数,运维成本高且可能导致资源不足或浪费。