批量计算任务对应 Kubernetes 中的 Job,配置与 VKE 中常规的任务基本相同。与 VKE 常规任务不同的是,批量计算中通过将任务提交到指定的队列来使用批量计算能力。本文主要介绍批量计算任务的创建、查看、管理等方法。
说明
该功能目前处于 公测 阶段。
说明
目前仅 Kubernetes Job 类型的任务支持通过控制台创建。
说明
在批量计算任务中,除如下表格以及图中说明的参数外,其余参数均与 VKE 中常规的任务配置相同。详细操作,请参见 创建任务。
配置项 | 说明 |
---|---|
批量计算队列 | 选择批量计算任务所属的队列。 |
标签 | 参数不可配置。根据您选择的批量计算队列,系统自动生成任务标签信息,表示该任务使用批量计算套件能力。 |
batch.volcengine.com/queue-name
,将任务提交到指定的队列来使用批量计算能力。demo-batch-job.yaml
代码如下所示,详细的 Job YAML 字段说明,请参见 创建任务。注意
MPI Job、PyTorch Job 类型的任务还需要依赖相关插件(Operator)。您可以自行在业务代码中部署相关 Operator,也可以在 容器服务控制台 的 应用中心 > 应用模板 中部署相关 Operator。具体操作说明,请参见 应用模板。
应用模板 中各 Job 对应的 Operator 名称如下:
apiVersion: batch/v1 kind: Job metadata: name: demo-batch-job # 任务名称。 labels: batch.volcengine.com/queue-name: "demo-queue" # 将当前任务提交到指定的批量计算队列。 spec: suspend: true template: metadata: annotations: vke.volcengine.com/burst-to-vci: "enforce" spec: containers: - name: demo image: nginx:1.14.2 command: ["/bin/bash", "-c", "for i in {1..20} ; do echo $i ; sleep 1 ; done"] resources: limits: cpu: 50m memory: 50Mi requests: cpu: 50m memory: 50Mi restartPolicy: Never backoffLimit: 4
kubectl apply -f demo-batch-job.yaml