You need to enable JavaScript to run this app.
导航
RDMA网络配置器未正常运行解决方案
最近更新时间:2024.10.18 17:12:44首次发布时间:2024.07.26 10:20:39

本文主要介绍如何排查和解决RDMA网络配置器未正常运行的问题。

操作步骤

  1. 登录目标实例,操作详情可参考登录Linux实例

  2. 请执行如下命令,确认rdma-agent.service服务状态是否为active (exited)

    systemctl status rdma-agent.service
    

    正常运行示例如下
    alt

  3. 若不是active (exited)状态,请进行如下操作:

    1. 请确认您的实例是否支持RDMA网络,只有实例支持RDMA网络时,才需要使用rdma-agent.service服务。

      说明

      • 仅高性能计算GPU型实例支持RDMA,关于高性能计算GPU型
      • 若实例不支持RDMA网络,rdma-agent.service服务状态异常或不存在,视为正常情况。
    2. 若您的实例支持RDMA网络,请执行如下命令重启服务。

      systemctl restart rdma-agent.service	
      
    3. 重启服务后,再次执行如下命令查看服务状态是否为active (exited)

      systemctl status rdma-agent.service
      
    4. 若还未解决您的问题,请提交工单获取技术支持。