智能 HPA(Intelligent Horizontal Pod Autoscaler,IHPA)基于数据驱动预测扩缩容目标,提供精细化控制工作负载副本数的能力,降低原生 HPA 实际弹性滞后对业务影响。
说明
【邀测·申请试用】:该功能目前处于邀测阶段,如需使用,请提交申请。
说明
若您的集群版本不符要求,可以升级集群。详情请参见 升级集群。
说明
若您的集群中已安装 katalyst 组件,则需要将组件升级至 v0.5.6-vke.6 及以上版本。详情请参见 升级组件。
...
> 安装。在集群管理页面的左侧导航栏中,选择 弹性伸缩 > 智能伸缩,单击 创建智能伸缩,使用控制台创建伸缩规则。
配置项 | 说明 |
---|---|
名称 | 配置智能伸缩的名称,集群内名称唯一。 |
预测模式 | 配置智能伸缩的预测模式,包括:
|
命名空间 | 选择伸缩策略所属的命名空间。建议选择您自定义的命名空间或系统默认创建的 default 命名空间。命名空间相关介绍,请参见 命名空间概述。 |
标签 | 对应 Kubernetes 中的 Label,用于指定该伸缩策略的标识属性。单击 添加标签,根据界面提示输入符合要求的 键 和 值。 |
注解 | 对应 Kubernetes 中的 Annotation,用于为伸缩策略附加任意非标识的元数据,包括 标签 不允许的字符,方便客户端能够检索此元数据。单击 添加注解,根据界面提示输入符合要求的 键 和 值。 |
配置项 | 说明 |
---|---|
伸缩对象 | 配置需要伸缩的工作负载。在下拉菜单中选择工作负载的类型和具体的工作负载。工作负载类型支持 无状态负载 和 有状态负载。 |
检测指标 | 单击 添加监测指标,配置工作负载弹性伸缩的监测指标,系统基于此指标决定是否需要进行伸缩。包括:
|
最小实例数 | 配置伸缩时的最小实例数。策略触发时,工作负载实例将在最小和最大实例数范围内伸缩。 |
最大实例数 | 配置伸缩时的最大实例数。策略触发时,工作负载实例将在最小和最大实例数范围内伸缩。 |
预测分位数 | 预测分位数,业务指标实际值低于设定目标值的概率,越大表示越保守。正整数形态,取值范围为 1~100,推荐取值范围为 90~99。 |
冷启动时间 | Pod 达到 Ready 状态所需要的时间。 |
配置项 | 说明 |
---|---|
扩缩容策略 | 配置工作负载的扩缩容行为,勾选 扩容策略 或 缩容策略,分别配置扩容策略行为和缩容策略行为。 |
静默时间 | 扩容策略或缩容策略的静默时间,整数形式,单位为秒。 |
策略类型 | 配置策略类型,包括:
|
策略 | 配置扩缩容的具体策略行为,包括:
|
配置项 | 说明 |
---|---|
开始时间 | 配置智能 HPA 的开始生效时间,精确到秒。 |
结束时间 | 配置智能 HPA 的结束时间,包括:
|
定时伸缩策略 | 配置定时伸缩策略,包括:
|
单击 确定,完成配置。