本文将介绍在GPU实例上部署NGC环境。
本教程向大家介绍,如何在GPU实例上部署NGC环境。NGC(NVIDIA GPU CLOUD)是NVIDIA开发的一套深度学习生态系统,可以使开发者免费访问深度学习软件堆栈,建立合适深度学习的开发环境。
在实验正式开始之前,请先完成以下准备工作:
购买Linux GPU实例。具体操作步骤可参考购买云服务器;
确保您已经为您的Linux实例绑定了公网IP,若暂未绑定,可参考绑定公网IP;
在实例安全组入方向添加规则并放行端口443或5000;
登录NGC网站,注册NGC账号并获取NGC API key保存到本地。
预计部署时间:60分钟
级别:中级
相关产品:GPU云服务器
受众:通用
本示例操作系统版本为:Ubuntu 18.04
nvidia-smi
命令,查看实例驱动版本信息,若出现如下回显,表明驱动信息正常,可进行后续操作。apt install -y apt-transport-https ca-certificates curl gnupg-agent software-properties-common curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add - add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" apt update apt install -y docker-ce docker-ce-cli containerd.io docker version //查看docker容器版本信息,出现如下回显,表明安装成功
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list apt update apt install -y nvidia-docker2 //安装nvidia-docker2容器 systemctl daemon-reload systemctl restart docker //重启docker容器
docker login nvcr.io Username: $oauthtoken Password: API KEY
执行完成后,会出现如下所示回显内容:
2. 登录NGC官网,在左侧导航栏点击“Containers”;
docker pull nvcr.io/nvidia/tensorflow:18.03-py3 docker images //查看下载的镜像,出现如下回显,表明拉取成功
nvidia-docker run --rm -it nvcr.io/nvidia/tensorflow:18.03-py3
出现如下回显,表明部署成功。
验证测试
执行python
,若环境正常,则直接进入python环境;
在Python环境下执行以下命令,若出现如下回显表明环境搭建成功。
import tensorflow as tf hello = tf.constant('Hello, TensorFlow!') sess = tf.Session() sess.run(hello)
至此,关于GPU实例上部署NGC环境就完成了,您可以在该开发环境中访问深度学习框架,可以极大程度的缩减产品开发及业务部署的时间,实现开发环境的预安装。
如果您有其他问题,欢迎您联系火山引擎技术支持服务。