容器服务支持在工作负载中使用 GPU 资源。本文主要介绍在负载中使用 NVIDIA GPU 进行调度的方法。
Worker 节点配置 处:计算规格 必须选择 GPU 计算型。该规格的详细介绍,请参见 GPU 计算型。
(可选)更多配置 处:添加 key 为vke.node.gpu.schedule
、Value 为nvidia
的 节点标签,表示在该节点池中的节点上,开启 NVIDIA GPU 调度能力。
说明
GPU 调度时使用的更多标签相关说明,请参见 GPU 调度标签说明。
本文以创建无状态负载(Deployment)为例。
说明
根据工作负载所在的集群是否安装 mgpu 组件,控制台有如下不同显示:
spec: affinity: nodeAffinity: requiredDuringSchedulingIgnoredDuringExecution: nodeSelectorTerms: - matchExpressions: - key: machine.cluster.vke.volcengine.com/gpu-name # 使用 GPU 显卡调度 operator: In values: - Tesla-V100 # GPU 显卡类型 containers: - image: cr-helm2-cn-beijing.cr.volces.com/sonobuoy/nfs-provisioner:v3.0.1 imagePullPolicy: IfNotPresent name: doc-container resources: limits: nvidia.com/gpu: "1" # GPU 显卡数量
使用 NVIDIA GPU 调度后,通过云监控查看节点调度情况。下文以无状态负载(Deployment)为例。
...
> 查看监控。