基于RTX3090的Ubuntu22.04安装cuda11.7和cudnn8.6
本实验基于Linux的Ubuntu系统在搭载RTX3090的显卡后,完成驱动安装后继续安装cuda11.7和cudnn8.6,目的是为了运行CVPR文章Omnipose模型进行COCO数据集训练,下载的软件包包含python3.8、torch2.0.1、torchaudio2.0.2、torchision0.15.2等等。本实验于2023年7月12日实验成功。
摘要:本实验基于Linux的Ubuntu系统在搭载RTX3090的显卡后,完成驱动安装后继续安装cuda11.7和cudnn8.6,目的是为了运行CVPR文章Omnipose模型进行COCO数据集训练,下载的软件包包含python3.8、torch2.0.1、torchaudio2.0.2、torchision0.15.2等等。本实验于2023年7月12日实验成功。
【1】打开终端输入指令:
nvidia-smi
上图的CUDA Version:12.0指的是最高支持cuda12.0的版本,并不是已经安装了cuda12.0的版本,输入以下指令查看cuda版本:
nvcc -V
从上图可以看到cuda的版本为11.7。
import torch
torch.cuda.is_available()
torch.zeros(1).cuda()
【2】假设你的cuda版本太低,不支持RTX3090的算力,比如你的版本是cuda11.1在这里安装新的cuda11.7并不需要你卸载cuda11.1直接下载新的就可以了。
下载gcc:
sudo apt install gcc
【3】下在cuda11.7并安装
登陆网站选择合适的版本CUDA Toolkit 11.7 Update 1 Downloads | NVIDIA Developer
wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda_11.7.1_515.65.01_linux.run
sudo sh cuda_11.7.1_515.65.01_linux.run
执行完上面的指令后会在终端卡一段时间,之后在终端进行安装选择:
下图中取消选择Driver,[x]代表选中,点击空格取消选中。然后选择install按回车。
安装完成。但是没有结束。输入以下指令:
gedit ~/.bashrc
在最后面加上以下两行指令:
export PATH=/usr/local/cuda-11.7/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.7/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
保存,退出。
【4】安装cudnn8.6,进入网站https://developer.nvidia.com/rdp/cudnn-download
点击进行下载,还需要更改两个文件的权限,输入以下指令:
cd /usr/local/cuda
sudo chmod 666 include
sudo chmod 666 lib64
找到刚刚下载的cudnn8.6,如下图,在这个文件夹中,点击在终端中打开。
输入以下指令:
sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include
sudo cp cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
打开新终端,输入以下指令测试是否成功:
sudo cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
【5】进行测试,进入python终端,没有报错就成功了。
import torch
torch.cuda.is_available()
torch.zeros(1).cuda()
【6】如果报错如以下:说明显卡、cuda、pytorch之间不对称,有可能是显卡的算力太高,cuda的版本太低,不支持高算力。
CUDA error: no kernel image is available for execution on the device
更多推荐
所有评论(0)