本文以注入终止指定 Pod 的故障为例,介绍如何使用应用韧性增强服务。
支持通过主控集群,动态添加多个 Kubernetes 集群。
操作步骤
在左侧导航栏,单击 资源管理 > 集群管理。
在集群列表页面,单击 创建集群。
配置集群。
参数 | 说明 |
---|---|
集群名称 | 填写集群的名称。请确保集群名称唯一,创建同名的集群将覆盖已存在的集群。 |
集群描述 | 填写集群的描述。 |
集群配置 | 输入 Kubernetes 集群的配置。Kubernetes 集群的配置可在 ~/.kube/config 查看。 |
单击 确定, 完成操作。
场景表示一段具有特定目的的演练。 场景库以单个场景为故障目标,可在其中添加多个故障。
在左侧导航栏,单击 实验管理 > 实验场景。
在 实验场景 页面,单击 创建实验场景。
在 创建实验场景 页面,输入实验场景名称 和 备注。
单击 确定,完成实验场景创建。
在 演练场景 区域,单击 创建演练场景
在 创建演练场景 页面,配置演练场景参数。针对 Pod 故障的演练场景配置如下图所示。
参数 | 说明 |
---|---|
场景名称 | 填写演练场景的名称。 |
故障目标 | 选择 Kubernetes。 |
目标类型 | 支持 Pod 和 Node 两种类型:
|
影响范围 | 支持基于 Pod 、标签和 Service 维度筛选故障注入目标。 |
随机模式 | 选定故障目标的方法:
|
完成配置后,单击 确定。
选中目标演练场景,在右侧画布单击 添加故障。
选择故障类型 Pod Kill,完成后单击 下一步。
配置故障参数。Pod Kill 故障为您自动创建故障名称,您也可以进行编辑。
单击 确定,完成故障添加。
单击 保存并退出。
在实验场景详情页,单击 运行。
在 最新运行 页面,查看当前实验场景的运行结果。
故障运行节点的状态通过不同的颜色进行区分:
蓝色:运行中
绿色:运行成功
红色:运行失败
支持在故障详情页面查看故障注入和恢复的状态,以及演练过程中故障指标的变化情况。
在 最新运行 页面,单击故障区域的 执行详情。
在 观测 页面,查看故障执行的详情。
类型 | 说明 |
---|---|
基础信息 | 展示故障目标、目标类型等故障的基本信息。 |
节点详情 | 展示当前故障注入阶段的信息。 |
执行结果 | 执行状态折线图展示演练过程中故障指标的变化情况。本示例展示 Pod 可连通性随时间变化的结果。 |
执行日志 | 故障执行的记录,包括各执行阶段的时间、状态和具体的行为。 |