You need to enable JavaScript to run this app.
导航
快速入门
最近更新时间:2023.09.28 11:46:22首次发布时间:2023.09.28 11:46:22

本文以注入终止指定 Pod 的故障为例,介绍如何使用应用韧性增强服务。

第一步:添加集群

支持通过主控集群,动态添加多个 Kubernetes 集群。
操作步骤

  1. 在左侧导航栏,单击 资源管理 > 集群管理

  2. 在集群列表页面,单击 创建集群

  3. 配置集群。

    参数说明
    集群名称填写集群的名称。请确保集群名称唯一,创建同名的集群将覆盖已存在的集群。
    集群描述填写集群的描述。
    集群配置输入 Kubernetes 集群的配置。Kubernetes 集群的配置可在 ~/.kube/config 查看。
  4. 单击 确定, 完成操作。

第二步:创建实验场景

场景表示一段具有特定目的的演练。 场景库以单个场景为故障目标,可在其中添加多个故障。

  1. 在左侧导航栏,单击 实验管理 > 实验场景

  2. 实验场景 页面,单击 创建实验场景

  3. 创建实验场景 页面,输入实验场景名称备注。

  4. 单击 确定,完成实验场景创建。

  5. 演练场景 区域,单击 创建演练场景

  6. 创建演练场景 页面,配置演练场景参数。针对 Pod 故障的演练场景配置如下图所示。

    参数说明
    场景名称填写演练场景的名称。
    故障目标选择 Kubernetes。

    目标类型

    支持 Pod 和 Node 两种类型:

    • Pod:将故障注入 Pod,必须选择集群和命名空间,圈定目标 Pod 的范围。

    • Node:将故障注入 Node,必须选择集群和具体 Node 的名称。

    影响范围支持基于 Pod 、标签和 Service 维度筛选故障注入目标。

    随机模式

    选定故障目标的方法:

    • All:所有选中的资源都最为故障注入目标。

    • One:选中的资源中随机选取一个作为故障注入目标。

    • Number:在选中的资源随机选择多个作为故障注入目标。

    • Percent:在选中的资源中,按照指定的比例,随机选择若干个资源作为故障注入目标。

  7. 完成配置后,单击 确定

第三步:添加故障

  1. 选中目标演练场景,在右侧画布单击 添加故障

  2. 选择故障类型 Pod Kill,完成后单击 下一步



  3. 配置故障参数。Pod Kill 故障为您自动创建故障名称,您也可以进行编辑。

  4. 单击 确定,完成故障添加。

  5. 单击 保存并退出

第四步:运行实验场景

  1. 在实验场景详情页,单击 运行。

  2. 最新运行 页面,查看当前实验场景的运行结果。


    故障运行节点的状态通过不同的颜色进行区分:

    • 蓝色:运行中

    • 绿色:运行成功

    • 红色:运行失败

第五步:查看观测信息

支持在故障详情页面查看故障注入和恢复的状态,以及演练过程中故障指标的变化情况。

  1. 最新运行 页面,单击故障区域的 执行详情

  2. 观测 页面,查看故障执行的详情。

    类型说明
    基础信息展示故障目标、目标类型等故障的基本信息。
    节点详情展示当前故障注入阶段的信息。

    执行结果

    执行状态折线图展示演练过程中故障指标的变化情况。本示例展示 Pod 可连通性随时间变化的结果。
    Pod Kill 演练在 16 时 58 分 启动,延迟 1 分钟后执行 Kill Pod 指令,导致了 Pod 的不可连通。

    执行日志故障执行的记录,包括各执行阶段的时间、状态和具体的行为。