摘要:本实验基于Linux的Ubuntu系统在搭载RTX3090的显卡后,完成驱动安装后继续安装cuda11.7和cudnn8.6,目的是为了运行CVPR文章Omnipose模型进行COCO数据集训练,下载的软件包包含python3.8、torch2.0.1、torchaudio2.0.2、torchision0.15.2等等。本实验于2023年7月12日实验成功。

【1】打开终端输入指令:

nvidia-smi

 上图的CUDA  Version:12.0指的是最高支持cuda12.0的版本,并不是已经安装了cuda12.0的版本,输入以下指令查看cuda版本:

nvcc -V

从上图可以看到cuda的版本为11.7。

import torch

torch.cuda.is_available()
torch.zeros(1).cuda()

【2】假设你的cuda版本太低,不支持RTX3090的算力,比如你的版本是cuda11.1在这里安装新的cuda11.7并不需要你卸载cuda11.1直接下载新的就可以了。

下载gcc:

sudo apt install gcc

【3】下在cuda11.7并安装

登陆网站选择合适的版本CUDA Toolkit 11.7 Update 1 Downloads | NVIDIA Developer

 

wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda_11.7.1_515.65.01_linux.run
sudo sh cuda_11.7.1_515.65.01_linux.run

执行完上面的指令后会在终端卡一段时间,之后在终端进行安装选择:

 

 下图中取消选择Driver,[x]代表选中,点击空格取消选中。然后选择install按回车。

 

 安装完成。但是没有结束。输入以下指令:
 

gedit ~/.bashrc

在最后面加上以下两行指令:

export PATH=/usr/local/cuda-11.7/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.7/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

保存,退出。

【4】安装cudnn8.6,进入网站https://developer.nvidia.com/rdp/cudnn-download

 点击进行下载,还需要更改两个文件的权限,输入以下指令:

cd /usr/local/cuda
sudo chmod 666 include
sudo chmod 666 lib64

找到刚刚下载的cudnn8.6,如下图,在这个文件夹中,点击在终端中打开。

 输入以下指令:

sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include 
sudo cp cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64 
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

打开新终端,输入以下指令测试是否成功:

sudo cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

 

【5】进行测试,进入python终端,没有报错就成功了。

import torch

torch.cuda.is_available()

torch.zeros(1).cuda()

【6】如果报错如以下:说明显卡、cuda、pytorch之间不对称,有可能是显卡的算力太高,cuda的版本太低,不支持高算力。

CUDA error: no kernel image is available for execution on the device

Logo

更多推荐