说明
v2.0 功能简述:
【需要开白】vePFS所关联的VPC与全局配置绑定的VPC可以不一致,并且支持绑定多个VPC网络
若您的资源有多VPC环境隔离的诉求,可以通过在全局配置绑定多个VPC网络,并且在下单时关联到对应的资源组就可以实现机器和负载的网络隔离
若您有多vePFS实例的诉求,且vePFS实例间关联的VPC不一致,可以在全局配置创建两个vePFS挂载服务实现
支持在资源组动态挂载vePFS实例和解绑vePFS,即购买机器时可以决定是否挂载vePFS实例
全局配置完成所有依赖服务的授权和绑定,在各个负载完成配置。
说明
新功能:
vePFS的VPC不再与全局配置的VPC强关联
支持配置和绑定多VPC
支持绑定多个vePFS挂载服务(vePFS实例所属VPC不一致)
选择 VPC 模块,点击【配置私网】
请注意,在绑定VPC时,尽量选择网段较大的VPC,尽量保证可用IP数量满足您的业务场景。
建议私有网络的网段大小在/8~/16位网络掩码之间,可用区子网网段掩码小于等于 /20,以满足后续在其他可用区创建子网,同时避免子网网段过小导致IP耗尽,比如:
vpc CIDR:172.24.0.0/16 可用IPv4数量 65533
可用区A子网CIDR:172.24.0.0/20 可用IPv4数量 4093
可用区B子网CIDR:172.24.16.0/20 可用IPv4数量 4093
可用区C子网CIDR:172.24.32.0/20 可用IPv4数量 4093
可以根据未来对IP数目的需求,合理规划私有网络和子网的网段大小,不建议:
单个子网完全占用整个私有网络网段;
子网网段过小,比如掩码位大于等于 /24。
私有网络:
选择您需要授权给MLP的私有网络和子网
子网支持多选,选择的子网可用区须与机器资源所在的可用区保持一致
公网:(若没有此部分设置,请联系火山oncall开白)
允许公网访问时,开发机可以在公网环境登录和访问,也需要配置公网登录所需的 NAT网关和公网 IP
禁止公网访问时,开发机仅可以通过私网登录和访问(WebIDE和SSH远程访问)
机器学习平台的每个工作负载容器会消耗1个 ENI 和 1个 VPC 子网IP, 需要的目标数量,要考虑如下 3 部分之和:
sum (创建的开发机数量),开机和关机状态的开发机都需要
sum(Running 状态的自定义任务实例数 ),例如:2 个 12 机 x 卡训练任务,需要 24 个
sum (Running 状态的推理服务实例数),例如:2 个 30 机 x 卡训练任务,需要 60 个
请选择需要使用的vePFS实例
绑定vePFS实例后,您可以对该实例做挂载权限的配置
当挂载服务下没有绑定的vePFS挂载实例时,将会自动删除且不可恢复]
说明
新功能:
支持在资源组维度配置 私有网络VPC、子网和安全组
支持按照资源组维度绑定vePFS实例
支持给负载和存储配置不同的网络(负载指开发机、自定义任务和在线服务;存储指vePFS和NAS)
创建资源组需要完成以下的配置项:
步骤 | 参数名称 | 说明 | Demo |
---|---|---|---|
计算配置 | 名称 |
| |
描述 |
| ||
计费类型 |
| ||
地域 |
| ||
可用区 |
| ||
计算规格 |
| ||
云盘 |
| ||
存储和网络配置 | 负载网络配置 |
| |
存储网络配置 |
| ||
vePFS配置 |
| ||
SFCS配置 |
| ||
确认订单 | - |
|
若您需要在机器学习平台使用文件系统vePFS,请在创建资源组时选择全局配置绑定好的vePFS实例。
vePFS实例会在资源组下单后,异步绑定。您可以在资源组列表页【vePFS实例】查看绑定进度
支持在创建资源组后变更负载网络配置,支持更换VPC、子网和安全组
若您在机器学习平台会使用 NAT网关/网际快车/镜像仓库/负载均衡 等产品,也需要在更换VPC时同步更新
更换VPC后,存量的负载不会变更;只有新提交的负载会使用新VPC
存量开发机更换VPC不会生效
若您添加了新的安全组,不会对存量的开发机生效;若需要对存量开发机生效,请通过更改存量绑定安全组的出入向配置实现