GPU云服务器正常工作需提前安装正确的基础设施软件,对NVIDIA Tesla系列的GPU而言,有以下两个层次的软件包需要安装:
在通用计算场景下,如深度学习、AI等通用计算业务场景或者OpenGL、Direct3D、云游戏等图形加速场景,安装了Tesla驱动的GPU才可以发挥高性能计算能力,或提供更流畅的图形显示效果。
如果您在创建GPU实例时未同时安装Tesla驱动,则需要在创建GPU实例后,参考本文和安装CUDA工具包手动安装Tesla驱动。
说明
您已购买GPU实例,并为其绑定公网IP,使其具备访问公网的能力。
Linux操作系统的驱动安装采用Shell脚本安装方式,适用于任何Linux发行版,包括CentOS、Ubuntu等。
登录NVIDIA 驱动下载 。
设置搜索条件,单击“搜索”按钮查找符合条件的驱动版本。本文以Tesla T4安装CUDA 12.2对应的GPU驱动版本为例,如下图所示。
配置项 | 说明 | 示例 |
---|---|---|
| 根据实例规格配备的GPU卡进行选择。详情请参见实例规格介绍。 |
|
操作系统 | 根据实例使用的镜像选择对应的Linux操作系统版本。 说明 操作系统选择Linux 64-bit即表示下载shell安装文件。如果选择具体的发行版本,则下载的文件是对应的包安装文件。 | Linux 64-bit |
CUDA Toolkit | 选择CUDA Toolkit版本。 | 12.2 |
语言 | 选择驱动对应的语言。 | Chinese (Simplified) |
最新 | 默认项为 全部,保持默认选项即可。 | 全部 |
选择特定的版本进入下载页面,单击“下载”按钮。本文以下载535.154.05版本为例,如下图所示。
(可选)如有填写个人信息的页面可选择直接跳过。
在驱动下载页面,右键单击“同意并开始下载”并选择菜单中的“复制链接地址”。
使用wget
命令,粘贴步骤5中已获取的链接地址,下载安装包(需要GPU实例能访问外网)。例如:
wget https://cn.download.nvidia.com/tesla/535.154.05/NVIDIA-Linux-x86_64-535.154.05.run
(条件必选) 若您的实例使用“veLinux 1.0 CentOS兼容版 with 5.10 kernel”或“veLinux 1.0 CentOS兼容版”镜像,需执行以下命令,修改GNU编译器套件(GNU Compiler Collection,GCC)的默认版本。
source /opt/rh/devtoolset-8/enable
执行sh
命令,运行驱动安装程序,并按提示进行后续操作。
sh NVIDIA-Linux-x86_64-535.154.05.run
安装完成后,执行以下命令进行验证。
nvidia-smi
如返回类似下图中的GPU信息,则说明GPU驱动安装成功。
在远程桌面中,通过浏览器访问NVIDIA 驱动下载。
设置搜索条件,单击“Search”按钮查找符合条件的驱动版本。
选择特定的版本进入下载页面,单击“下载”按钮。
(可选)如有填写个人信息的页面可选择直接跳过。
在驱动下载页面,单击“同意并开始下载”按钮,下载驱动。
下载完成后,单击“查看下载”按钮进入下载页面,并单击“运行”按钮,按提示完成安装。
安装完成后,在桌面单击右键,可以看到“NVIDIA控制面板”程序,单击后选择控制面板左下角的“系统信息”按钮,可以查看驱动版本。