## 背景信息 GPU云服务器正常工作需提前安装正确的基础设施软件，对NVIDIA Tesla系列的GPU而言，有以下两个层次的软件包需要安装： * 驱动GPU工作的硬件驱动程序。 * 上层应用程序所需要的库。在通用计算场景下，如深度学习、AI等通用计算业务场景或者OpenGL、Direct3D、云游戏等图形加速场景，安装了Tesla驱动的GPU才可以发挥高性能计算能力，或提供更流畅的图形显示效果。 ## 操作场景如果您在创建GPU实例时未同时安装Tesla驱动，则需要在创建GPU实例后，参考本文和[安装CUDA工具包](https://www.volcengine.com/docs/6419/69858)手动安装Tesla驱动。 :::tip * 手动安装GPU驱动和CUDA包时，必须确保驱动版本和CUDA包版本的兼容性，[了解更多](https://docs.nvidia.com/deploy/cuda-compatibility/index.html#binary-compatibility__table-toolkit-driver)。 * 为方便使用，您可以在创建GPU实例时，选择支持自动安装或者预装了特定版本GPU驱动和CUDA的公共镜像，[了解更多](https://www.volcengine.com/docs/6419/68596)。 * 搭载A100/A800显卡的实例还需[安装NVIDIA-Fabric Manager服务](https://www.volcengine.com/docs/6419/73634)，否则将无法正常使用GPU实例。 ::: ## 前提条件您已购买GPU实例，并为其绑定公网IP，使其具备访问公网的能力。 ## 安装GPU驱动（Linux） Linux操作系统的驱动安装采用Shell脚本安装方式，适用于任何Linux发行版，包括CentOS、Ubuntu等。 1. 访问[NVIDIA 驱动下载](https://www.nvidia.cn/drivers/lookup/)。 2. 设置搜索条件，单击“查找”按钮查找符合条件的驱动版本。本文以Tesla T4安装CUDA 12.2对应的GPU驱动版本为例，如下图所示。 ![图片](https://portal.volccdn.com/obj/volcfe/cloud-universal-doc/upload_94eaae3a2239013d763b5edb3182d9f9.png =400x) |配置项 |说明 |示例 | |---|---|---| |* 产品类型|根据实例规格配备的GPU卡进行选择。详情请参见[实例规格介绍](https://www.volcengine.com/docs/6419/1088202)。 |* Data Center / Tesla|\ |* 产品系列| |* T\-Series|\ |* 产品家族 | |* Tesla T4 | |操作系统 |根据实例使用的镜像选择对应的Linux操作系统版本。|Linux 64\-bit |\ | |:::tip| |\ | |操作系统选择Linux 64\-bit即表示下载shell安装文件。如果选择具体的发行版本，则下载的文件是对应的包安装文件。| |\ | || |\ | |:::| | |CUDA Toolkit |选择CUDA Toolkit版本。 |12.2 | |语言 |选择驱动对应的语言。 |Chinese (Simplified) | 3. 选择特定的版本单击“查看”按钮。本文以下载535.216.03版本为例，如下图所示。 ![图片](https://portal.volccdn.com/obj/volcfe/cloud-universal-doc/upload_b0b2e931002ef1d3f4f610fdd6222021.png =600x) 4. 在驱动下载页面，右键单击“下载”按钮，在弹出的菜单中选择“复制链接地址”。 ![图片](https://portal.volccdn.com/obj/volcfe/cloud-universal-doc/upload_0e28aa37374fe6dd75998a142167f541.png =600x) 5. [登录GPU实例](https://www.volcengine.com/docs/6396/67747)。 6. 使用`wget`命令，粘贴步骤4中已获取的链接地址，下载安装包（需要GPU实例能访问外网）。例如： ```Plain Text wget https://cn.download.nvidia.com/tesla/535.216.03/NVIDIA-Linux-x86_64-535.216.03.run ``` 7. **（条件必选）** 若您的实例使用“veLinux 1.0 CentOS兼容版 with 5.10 kernel”或“veLinux 1.0 CentOS兼容版”镜像，需执行以下命令，修改GNU编译器套件（GNU Compiler Collection，GCC）的默认版本。 ```Plain Text source /opt/rh/devtoolset-8/enable ``` 8. 执行`sh`命令，运行驱动安装程序，并按提示进行后续操作。 ```Plain Text sh NVIDIA-Linux-x86_64-535.216.03.run ``` 9. 安装完成后，执行以下命令进行验证。 ```Plain Text nvidia-smi ``` 如返回类似下图中的GPU信息，则说明GPU驱动安装成功。 ![图片](https://portal.volccdn.com/obj/volcfe/cloud-universal-doc/upload_c526f9c8dd6c725b65ac0aa80252c5a1.png =600x) ## 安装GPU驱动（Windows） 1. [登录Windows实例](https://www.volcengine.com/docs/6396/67800)。 2. 在远程桌面中，通过浏览器访问[NVIDIA 驱动下载](https://www.nvidia.cn/drivers/lookup/)。 3. 设置搜索条件，单击“查找”按钮查找符合条件的驱动版本。本文以Tesla T4安装CUDA 11.4对应的GPU驱动版本为例，如下图所示。 ![图片](https://portal.volccdn.com/obj/volcfe/cloud-universal-doc/upload_1ac094b169dd770af30bb6b914707933.png =400x) 4. 选择特定的版本单击“查看”按钮。本文以下载472.50版本为例，如下图所示。 ![图片](https://portal.volccdn.com/obj/volcfe/cloud-universal-doc/upload_8ce49ca0d9e28b5fdde01896033030bd.png =600x) 5. 单击“下载”按钮，下载驱动。 ![图片](https://portal.volccdn.com/obj/volcfe/cloud-universal-doc/upload_58ef723a7ebbe976ddffa34ed7af2969.png =600x) 6. 依次单击“运行”和“查看下载”按钮，待下载完成后单击“OK”按钮并按提示完成安装。 ![图片](https://portal.volccdn.com/obj/volcfe/cloud-universal-doc/upload_600e6c74b10e18ed03e393e9afceee8a.png =600x) 7. 安装完成后，在桌面单击右键，可以看到“NVIDIA控制面板”程序，单击后选择控制面板左下角的“系统信息”按钮，可以查看驱动版本。 ![图片](https://portal.volccdn.com/obj/volcfe/cloud-universal-doc/upload_17336a705e8c800303df3bd85b6d365e.png =600x)