You need to enable JavaScript to run this app.
导航
mgpu
最近更新时间:2025.03.07 17:39:16首次发布时间:2022.11.25 18:47:26
我的收藏
有用
有用
无用
无用

mgpu 组件是容器服务提供的共享 GPU 组件,通过实现容器间显存、算力隔离,支持多个容器间共享 GPU 卡。本文主要介绍 mgpu 组件的变更记录。

说明

mGPU 组件目前处于 公测 阶段。

更多组件相关介绍和使用方法,请参见 组件管理

2025.02

版本号Kubernetes 版本兼容性版本状态变更内容变更影响
v0.6.1全版本维护中支持 H20 等大显存机型规格。
v0.6.0全版本维护中支持在离线混部。

2024.09

版本号Kubernetes 版本兼容性版本状态变更内容变更影响
v0.5.1全版本维护中收敛不需要的 SeviceAccount 权限。

2024.03

版本号Kubernetes 版本兼容性版本状态变更内容变更影响
v0.5.0全版本维护中Pod 独占整卡时,卡级别指标添加 3 个 Label,包括:pod、namespace、container。

2023.11

版本号Kubernetes 版本兼容性版本状态变更内容变更影响
v0.4.2全版本维护中支持 mem_copy_util 指标。

2023.09

版本号Kubernetes 版本兼容性版本状态变更内容变更影响
v0.4.1全版本维护中优化 exporter 监听资源的逻辑。

2023.08

版本号Kubernetes 版本兼容性版本状态变更内容变更影响
v0.4.0全版本维护中组件参数命名规范化。

2023.06

推荐选择合适时机升级组件,方便后续功能使用。

版本号Kubernetes 版本兼容性版本状态变更内容变更影响

v0.3.0

全版本

维护中

  • 支持向节点输出 mgpu version label。
  • 集成 mGPU 驱动安装功能,支持用户选择性安装 mGPU 驱动。
  • 用户新建节点池场景必须升级版本到 v0.3.0 版本,以便正常安装 mGPU 驱动和使用 mGPU 功能。
  • 存量 GPU 节点池在没有变配、没有刷新初始化脚本的情况下可以正常使用,扩容节点不受影响。

2023.03

版本号Kubernetes 版本兼容性版本状态变更内容变更影响
v0.2.0全版本停止维护支持多卡共享及配套监控。

2023.01

版本号Kubernetes 版本兼容性版本状态变更内容变更影响
v0.1.1全版本停止维护支持 mgpu-driver 健康检查。

2022.11

版本号Kubernetes 版本兼容性版本状态变更内容变更影响

v0.0.3

全版本

停止维护

  • 允许自定义安装共享 GPU 资源监控插件 mgpu-exporter。
  • 支持配置算力分配策略 QoS Policy。

2022.10

版本号Kubernetes 版本兼容性版本状态变更内容变更影响
v0.0.2全版本停止维护优化 mGPU 组件与非 GPU 节点的调度关系。

2022.09

版本号Kubernetes 版本兼容性版本状态变更内容变更影响
v0.0.1全版本停止维护mGPU 组件首次邀测发布。