You need to enable JavaScript to run this app.
导航
挂载智算版文件系统
最近更新时间:2024.10.10 12:50:04首次发布时间:2024.05.17 16:27:50

本文介绍挂载 vePFS 智算版文件系统的前提条件和操作步骤。

前提条件

挂载 vePFS 前,请确保您已完成以下操作:

使用流程

图片

步骤一:为高性能集群绑定文件系统

注意

  • 仅智算版文件系统需要执行该步骤。
  • 绑定智算版文件系统前,请确保您已创建高性能集群,且高性能集群已添加相应实例。
  • 智算版文件系统未开放控制台创建,如您需要使用,请联系相应客户经理。
  1. 登录 ECS 控制台
  2. 在顶部导航栏,选择目标实例的地域。
  3. 在左侧导航栏中,选择实例与镜像 > 高性能计算集群
  4. 高性能计算集群页面,单击目标集群操作列对应的 ... > 绑定vePFS
  5. 绑定vePFS面板,选择需要绑定的 vePFS 文件系统,单击确定

    注意

    • 如果您的高性能集群中没有实例,将无法绑定文件系统。
    • 仅支持绑定智算版文件系统,如果您没有可绑定的文件系统,可以单击面板上方的创建vePFS,前往 vePFS 控制台创建。
    • 单击确定后,文件系统不会立刻绑定成功,您需要等待一定时间后,刷新高性能计算集群页面,如果目标集群显示了绑定的 vePFS 文件系统名称及 ID 信息,才可以执行后续的挂载操作。

步骤二:为 ECS 实例添加安全组

挂载 vePFS 文件系统前,您需要为 ECS 实例关联与 vePFS 管理节点相同的安全组。

注意

  • 当您创建挂载服务之后,ECS 会自动创建三台 vePFS 管理节点,您可以登录 vePFS 控制台,查看相应的管理节点信息。
  • vePFS 管理节点的安全组主要开放了同一 VPC 网段及 100.64.0.0/10 云服务网段中入方向的相关 IP 端口。如果您的客户端节点有其他网络需求,需要开放额外的网段以及端口,请自行绑定其他安全组,与当前的安全组规则不冲突即可。
  1. 登录 ECS 控制台
  2. 在顶部导航栏,选择目标实例的地域。
  3. 在左侧导航栏中,选择实例与镜像 > 实例,进入实例列表页。
  4. 查看 vePFS 管理节点的安全组信息。
    1. 实例列表页面,找到 vePFS 的管理节点实例,单击实例名称。
    2. 在实例详情页面,查看网卡关联的安全组名称。

      说明

      您也可以根据挂载服务 ID 获取安全组信息,安全组命名格式为 sg-<挂载服务 ID>sg-<vePFS 文件系统 ID>-<挂载服务 ID>

  5. 为被挂载的 ECS 实例添加安全组信息。
    1. 实例列表页面,找到需要挂载 vePFS 的 ECS 实例,单击实例名称。
    2. 在实例详情页面,单击网卡页签。
    3. 网卡页签,单击需要关联安全组的网卡。
    4. 在网卡详情面板,单击关联安全组页签。
    5. 关联安全组页签,单击关联安全组
    6. 选择安全组面板,选择步骤 4 中确认的安全组信息,单击确定

    注意

    如果您的 ECS 实例包含多张网卡,请务必确认将安全组关联到挂载 IP 所在的网卡。

步骤三:挂载文件系统

注意

挂载文件系统前,请确保您的实例已正确关联了相应安全组。关联安全组后,您可以登录 vePFS 管理节点挂载 vePFS 文件系统。

  1. 登录 vePFS 管理节点,具体步骤,请参见登录云服务器

    说明

    • 当您创建挂载服务之后,ECS 会自动创建三台 vePFS 管理节点,您可以登录 vePFS 控制台,查看相应的管理节点 IP 及登录密码。
    • vePFS 管理节点名称格式为 client-{挂载服务 ID}-{数字}client-{vePFS 文件系统 ID}-{挂载服务 ID}-{数字}
  2. 根据实例的登录方式,选择合适方式挂载文件系统。

密码挂载
将以下命令中 {ECS IP地址} 替换为需要挂载的 ECS 实例的私网 IP 地址,然后执行命令,挂载 vePFS 文件系统。

vepfs -r add password {ECS IP 地址}

执行挂载命令后,您需要手动输入挂载节点的密码,然后系统会自动挂载 vePFS 文件系统。

说明

  • 您可以添加多个挂载地址,以空格隔开即可。最多支持同时挂载 50 个节点;如果您需要挂载的节点较多,建议您使用该方式批量挂载。
  • 同时挂载多个实例时,您可以在命令中增加 -p 选项,使用默认密码,例如您可以使用 vepfs -r -p 'xxx' add password xxx xxx xxx 添加默认密码。若密码中含有单引号('),建议密码内容使用双引号("),并使用转义符(\)对密码中的特殊字符进行转义,例如密码为 abc'def!,则挂载命令为 vepfs -r -p "abc\'def\!" add password xxx xxx xxx

后续操作
挂载智算版文件系统时,需要选择 RDMA 网卡:

  • 如果您在命令中增加 -a 选项,则默认启用所有 RDMA 网卡,可以省去交互输入网卡步骤,例如 vepfs -r -a -p 'xxx' add password xxx xxx xxx
  • 如果您没有在命令中增加 -a,在系统正常挂载 ECS 实例后,您需要根据实际情况选择 RDMA 网卡。
    图片

步骤四:查看挂载情况

  1. 登录挂载 vePFS 文件系统的 ECS 实例,具体步骤,请参见登录云服务器
  2. 执行 df -h 查看挂载情况。
    如果回显信息中 Filesystem 列显示 vepfsfs_实例 ID,说明挂载成功。本文中以显示 vepfs 为例。
    Filesystem      Size  Used Avail Use% Mounted on
    devtmpfs        3.8G     0  3.8G   0% /dev
    tmpfs           3.8G     0  3.8G   0% /dev/shm
    tmpfs           3.8G  8.6M  3.8G   1% /run
    tmpfs           3.8G     0  3.8G   0% /sys/fs/cgroup
    /dev/vda1        50G  3.7G   44G   8% /
    vepfs           6.0T   12G  6.0T   1% /mnt/vepfs
    tmpfs           777M     0  777M   0% /run/user/0
    

其他操作

  • 查看挂载节点状态
    您可以登录管理节点,执行如下命令,查看 vePFS 挂载节点状态。

    mmgetstate -N  {IP 地址}
    

    说明

    支持添加多个 IP 地址,以 , 分隔即可。

    返回信息如下,返回的 Node name 即为挂载节点的 ID。

    Node number  Node name                GPFS state  
    ---------------------------------------------------
               4  iv-ybqk7fafww8rx7p8****  active
    
  • 查看所有节点状态
    您可以登录管理节点,执行如下命令,查看 vePFS 所有节点状态。

    mmgetstate -a
    

    返回信息如下。

    Node number  Node name                                       GPFS state  
    ------------------------------------------------------------------------
               1  client-vepfs-cnbj83050aae****-mount-b990****-1  active
               2  client-vepfs-cnbj83050aae****-mount-b990****-2  active
               3  client-vepfs-cnbj83050aae****-mount-b990****-3  active
               4  iv-ybqk7fafww8rx7p8****                         active
    
  • 查看 Node 对应的 IP 地址
    您可以在 /etc/hosts 上查看对应节点名称对应的 IP 地址。