创建 高性能计算GPU型hpcpni2 实例后,您可在实例内部手动安装RDMA网络观测性增强插件,用于监控RDMA网络的健康状况。
登录云服务器控制台。
在左侧导航树中选择“实例与镜像 > 实例”。
在顶部导航栏,选择目标实例的地域。
在实例列表页,使用root账号登录Linux实例。
登录成功后,按地域粘贴以下安装命令,并按回车键开始执行。
bash -c "$(wget -q -O - wget https://rdma-tool-beijing.tos-cn-beijing.volces.com/install_rdma_monitor.sh)"
bash -c "$(wget -q -O - wget https://rdma-tool-shanghai.tos-cn-shanghai.volces.com/install_rdma_monitor.sh)"
bash -c "$(wget -q -O - wget https://rdma-tool-guangzhou.tos-cn-guangzhou.volces.com/install_rdma_monitor.sh)"
查看安装结果。
反馈如下信息则安装成功,等待3-5分钟后插件即可正常采集监控数据。
rdma-monitor installed rdma-monitor.service start
如果您不再需要RDMA网络观测性增强功能,可以卸载RDMA网络增强插件。
bash /usr/local/rdma-monitor/uninstall.sh