参考CUDA官网:https://docs.nvidia.com/cuda/archive/9.2/cuda-installation-guide-linux/index.html

(1)安装CUDA的系统需求总览

安装CUDA9.2需要满足以下系统配置:

(2)确认有CUDA支持的GPU。

目前,CUDA只支持NVIDIA的GPU。并且CUDA支持的NVIDIA GPU型号在如下的列表中 https://developer.nvidia.com/cuda-gpus      一般情况下NVIDIA的GPU基本上都支持。

查看本机GPU型号,使用如下命令:

        $>lspci | grep -i nvidia

补充:

        如果执行该命令后没有看到任何信息,需要更新PCI硬件数据库。执行如下更新命令:

                $>update-pciids

        然后在重新执行上面的lspci命令。

        如果没有该命令:执行     yum install pciutils      安装该命令。

(3)确认是否有CUDA支持的OS架构

执行命令:     $>uname -m && cat /etc/*release

(4)确认系统是否有CUDA需要的GCC版本

a.查看gcc版本,使用如下命令:

        $>gcc --version      

b.如果没有gcc命令,使用yum安装,使用如下命令:

        $>yum install gcc 

(5)确认系统有当前内核版本的内核头和开发包

a.查看当前系统的内核版本,使用如下命令:

        $>uname -r

        

b.查看当前已经安装的内核头和开发包,使用如下命令:

        $>rpm -qa | grep kernel

        

补充:如果没有内核头和开发包,手动安装与当前内核版本一致的内核头和开发包,使用如下命令:

        $>sudo yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)

(6)下载CUDA Toolkit

CUDA Toolkit包括:CUDA Driver, CUDA Tools libraries, CUDA Samples以及其他。

下载地址:https://developer.nvidia.com/cuda-toolkit-archive

下载cuda9.2的rpm包

(7)安装cuda9.2

注意:由于NVIDIA驱动rpm包依赖于DKMS和libvdpau包,这些包仅能在第三方知识库中找到,如EPEL。因此需先安装第三方知识库,然后安装DKMS和libvdpau依赖。

a.安装第三方知识库EPEL(epel-release),使用如下命令:

        $>yum -y install epel-release              //将自动选择对应的知识库

        $>yum repolist

b.安装DKMS和libvdpau依赖,使用如下命令:

        $>yum install dkms libvdpau

c.自定义xorg.conf(这一步一般情况下都不需要执行)

        注意:驱动依赖于自动生成的/etc/X11/xorg.conf文件,如果该文件已经存在,会影响驱动的正常运行,需要删除已存在的xorg.conf文件。如果需要手动修改该文件,则添加/etc/X11/xorg.conf.d/00.nvidia.conf到xorg.conf文件。

d.安装CUDA知识库,清除yum过期的知识库缓存,使用如下命令:

        $>sudo rpm --install cuda-repo-rhel7-9-2-local-9.2.148-1.x86_64.rpm

        $>sudo yum clean expire-cache

e.安装cuda9.2,使用如下命令:

        $>sudo yum install cuda9-2

(8)Post安装动作(Post安装动作必须手动执行)

a.配置环境变量

        在/etc/profile文件中添加如下:

export PATH=$PATH:/usr/local/cuda-9.2/bin    
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64
export NUMBAPRO_CUDALIB=/usr/local/cuda-9.2/bin
export NUMBAPRO_NVVM=/usr/local/cuda-9.2/nvvm/lib64/libnvvm.so
export NUMBAPRO_LIBDEVICE=/usr/local/cuda-9.2/nvvm/libdevice/

b.验证安装

        在这一步中需要验证CUDA Toolkit能找到并与CUDA硬件正确沟通,所以需要编译并运行一些Sample程序。

        b1.验证驱动的版本

                $>cat /proc/driver/nvidia/version

                显示当前驱动版本结果如下:

                 补充:如果没有安装驱动,先安装驱动。

        b2.编译Sample程序

                $>cd /usr/local/cuda-9.2/samples

                $>make

                补充:编译后生成的二进制文件在/usr/local/cuda-9.2/samples/bin目录下

        b3.本机的NVIDIA显卡文件

                /dev/nvidia*文件表示本机的第*块NVIDIA显卡

        b4.查询CUDA设备

                $>cd /usr/local/cuda-9.2/samples/bin/x86_64/linux/release

                $>./deviceQuery

                显示结果如下:

        b5.确保系统与CUDA设备正确通信

                $>cd /usr/local/cuda-9.2/samples/bin/x86_64/linux/release

                $>./bandwidthTest

                输出结果如下:

        

c.使用nvidia-smi查看目前GPU的使用情况

        $>nvidia-smi

        如果不成功,reboot重启服务器试试!

Logo

更多推荐