GPU云服务器正常工作需提前安装正确的基础设施软件,对NVIDIA Tesla系列的GPU而言,有以下两个层次的软件包需要安装:
在通用计算场景下,如深度学习、AI等通用计算业务场景或者OpenGL、Direct3D、云游戏等图形加速场景,安装了Tesla驱动的GPU才可以发挥高性能计算能力,或提供更流畅的图形显示效果。
如果您在创建GPU实例时未同时安装Tesla驱动,则需要在创建GPU实例后,参考本文和安装CUDA工具包手动安装Tesla驱动。
说明
您已购买GPU实例,并为其绑定公网IP,使其具备访问公网的能力。
Linux操作系统的驱动安装采用Shell脚本安装方式,适用于任何Linux发行版,包括CentOS、Ubuntu等。
访问NVIDIA 驱动下载。
设置搜索条件,单击“查找”按钮查找符合条件的驱动版本。本文以Tesla T4安装CUDA 12.2对应的GPU驱动版本为例,如下图所示。
配置项 | 说明 | 示例 |
---|---|---|
| 根据实例规格配备的GPU卡进行选择。详情请参见实例规格介绍。 |
|
操作系统 | 根据实例使用的镜像选择对应的Linux操作系统版本。 说明 操作系统选择Linux 64-bit即表示下载shell安装文件。如果选择具体的发行版本,则下载的文件是对应的包安装文件。 | Linux 64-bit |
CUDA Toolkit | 选择CUDA Toolkit版本。 | 12.2 |
语言 | 选择驱动对应的语言。 | Chinese (Simplified) |
选择特定的版本单击“查看”按钮。本文以下载535.216.03版本为例,如下图所示。
在驱动下载页面,右键单击“同意并开始下载”并选择菜单中的“复制链接地址”。
使用wget
命令,粘贴步骤4中已获取的链接地址,下载安装包(需要GPU实例能访问外网)。例如:
wget https://cn.download.nvidia.com/tesla/535.216.03/NVIDIA-Linux-x86_64-535.216.03.run
(条件必选) 若您的实例使用“veLinux 1.0 CentOS兼容版 with 5.10 kernel”或“veLinux 1.0 CentOS兼容版”镜像,需执行以下命令,修改GNU编译器套件(GNU Compiler Collection,GCC)的默认版本。
source /opt/rh/devtoolset-8/enable
执行sh
命令,运行驱动安装程序,并按提示进行后续操作。
sh NVIDIA-Linux-x86_64-535.216.03.run
安装完成后,执行以下命令进行验证。
nvidia-smi
如返回类似下图中的GPU信息,则说明GPU驱动安装成功。
在远程桌面中,通过浏览器访问NVIDIA 驱动下载。
设置搜索条件,单击“查找”按钮查找符合条件的驱动版本。本文以Tesla T4安装CUDA 11.4对应的GPU驱动版本为例,如下图所示。
选择特定的版本单击“查看”按钮。本文以下载472.50版本为例,如下图所示。
单击“下载”按钮,下载驱动。
依次单击“运行”和“查看下载”按钮,待下载完成后单击“OK”按钮并按提示完成安装。
安装完成后,在桌面单击右键,可以看到“NVIDIA控制面板”程序,单击后选择控制面板左下角的“系统信息”按钮,可以查看驱动版本。