官方安装指导大法好,见链接

Installation Guide — NVIDIA Cloud Native Technologies documentation

以Ubuntu为例:

# Add the package repositories
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
sudo systemctl restart docker

注意nvidia-docker的distribution默认只支持LTS版本,即*.04,使用非该类版本时需要指定为改版本,例如系统是22.10,上面的命令要指定distribution="ubuntu22.04",具体而言变为:

# Add the package repositories
distribution="ubuntu22.04"
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
sudo systemctl restart docker

如果使用的时候无法使用gpu,则执行:

sudo apt-get install nvidia-container-runtime
sudo systemctl restart docker

Nvidia docker和普通docker调用方式略有不同,创建容器的时候加 gpus,例如

docker run -it --gpus all ubuntu nvidia-smi
或
docker run -it --gpus 0 ubuntu nvidia-smi

获取nvidia/cuda镜像在官方镜像库查找:nvidia/cuda

根据 操作系统 - CUDA 来浏览获取对应的tag,例如下图中的pull获取方式为:

docker pull nvidia/cuda:10.2-cudnn8-runtime-ubuntu18.04

获取镜像后可以创建容器,并使用或进行更新,主要安装新包前经常需要进行apt-get更新,再执行安装,例如

apt-get update
apt-get install ***

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐