You need to enable JavaScript to run this app.
导航
批量计算套件使用说明
最近更新时间:2024.08.26 17:20:25首次发布时间:2023.09.25 16:09:31

本文主要描述使用云原生批量计算套件过程中涉及的使用说明、使用限制、名词概念等。

说明

该功能目前处于 公测 阶段。

使用说明

批量计算套件在邀测期间不收取任何额外费用。所依赖的容器服务、云服务器、弹性容器实例、托管 Prometheus 服务等云资源按照实际使用情况收费。详细说明,请参见 云基础资源计费

使用限制

限制项说明
Kubernetes 版本集群的 Kubernetes 版本需要 v1.24 及以上版本。相关说明,请参见 Kubernetes 版本发布记录

能力限制

  • 暂不支持使用 mGPU 多卡共享能力。
  • 当前支持 Kubernetes Job、MPI Job、PyTorch Job、TensorFlow Job。

名词概念

限制项说明
任务与容器服务中的 任务 相同,对应 Kubernetes 中的 Job。通过提交任务到指定的队列中,从而使用批量计算套件能力。
队列控制任务实际运行的模块。一个 VKE 集群中可创建多个队列。
队列组用于管理队列的组,同一个队列组内的队列之间可以相互借用资源配额。