Ubuntu 16.04. 装tesla p4 显卡驱动+cuda9.0+docker+nvidia-docker 详细方法，这里是服务器为主

Ubuntu 16.04. 装tesla p4 显卡驱动+cuda9.0+docker+nvidia-docker 详细方法，这里是服务器为主这里说明一下，我也是在网上看的教程，小白一个，通过好几次的安装步骤写下来给大家分享给大家，希望对想安装这个功能的伙计们有个帮助吧首先下载ubuntu镜像地址 http://releases.ubuntu.com/16.04/?_ga=2.246..

he嘟嘟嘟

5818人浏览 · 2019-08-16 14:53:27

he嘟嘟嘟 · 2019-08-16 14:53:27 发布

Ubuntu 16.04. 装tesla p4 显卡驱动+cuda9.0+docker+nvidia-docker 详细方法，这里是服务器为主

这里说明一下，我也是在网上看的教程，小白一个，通过好几次的安装步骤写下来给大家分享给大家，希望对想安装这个功能的伙计们有个帮助吧
首先下载ubuntu镜像地址 http://releases.ubuntu.com/16.04/?_ga=2.246976388.1827311414.1565755267-1068360699.1565755267 看不懂英文的可以用浏览器自带翻译，翻译一下网页就可以了，然后用 UltraISO 软件刻录到U盘或者光盘。我使用的是服务器 SR650 ，我安装的显卡驱动是 9.0 384.183 版本 cuda 也是 9.0 版本的
cuda 下载地址看你是什么系统就选什么系统 https://developer.nvidia.com/cuda-downloads
cudnn9.2 下载地址这里我没有安装 https://pan.baidu.com/s/1VgSYJqze32bpKIT7lxd2hQ 密码 vude

nvidia-docker 1.0.1-1_amd64.deb 下载地址https://pan.baidu.com/s/1Sh3WKPYbdE1BeowvozVMLw 密码 33ox

显卡驱动下载地址：https://www.nvidia.cn/Download/index.aspx?lang=cn ，这里如果你是Ubuntu，最好下载 linux-64bit的而不是Ubuntu 版本，要是安装ubuntu版本重启后会登录循环
在这里插入图片描述
这里是cuda 下载地址界面，我画框的是旧版本下载地址里面有 8. 0 9.0 10.0 的旧版，官网界面显示是最新的，如果不想换也可以下最新的，
安装好系统好后，第一步打开终端输入
sudo gedit /etc/modprobe.d/blacklist.conf 这里的意思是要禁用 nuoveau
输入命令会跳出文本编写框，在文本框最下面空格或两格然后写这两条代码，或者复制粘贴也行，不要加# 号，直接复制或者手动输入下面代码就行，输好就点保存关掉文本框
blacklist nouveau
options nouveau modeset=0

在这里插入图片描述

然后输入 sudo update-initramfs -u 更新一下，会显示内核什么的要等一分钟这样
然后reboot 重启服务器，重启好后在终端输入执行：lsmod | grep nouveau 如果没有屏幕输出，说明禁用nouveau成功（如果想看显示的结果是什么样的，这里可以在刚刚装好系统后输入这个命令就可以看到）
在这里插入图片描述
重启好系统检查nouveau 是否禁用了输入 lsmod | grep nouveau 已经没有了，然后可以安装显卡驱动了

很多教程说要按ctrl+alt+f1 进入ATT 文本模式安装，这里呢看个人喜欢吧，如果是装了显卡驱动重启后出现登录循环，就可以这样来操作，因为我安装驱动是deb格式，重启后出现了登录循环，然后在ATT 文本模式下卸载原有的驱动，然后 ctrl+alt+f7切换到桌面模式，输入密码正常了，后面就是换了 run 文件安装，重启正常进入，网上很多教程的装了deb文件格式也是出现登录循环，安装下载好的显卡驱动，如果是Ubuntu自带浏览器下载的文件是在（英文下是Downloads，中文是下载）这文件夹下，然后移动到HOME也就是桌面文件夹，在终端下 ls 看看，会看到移动过来的驱动文件，这里也可以不需要移动文件到home 文件夹下，这里我是闲麻烦，因为想要安装驱动，查看驱动文件，还要cd 到这个目录下查看，我就直接省了这一步。

开始安装显卡驱动一定要看清楚大小写
sudo chmod a+x NVIDIA-Linux-x86_64-384.59.run 这是给run文件赋予执行权限（这里可以不需要，直接输入下面命令）
sudo ./NVIDIA-Linux-x86_64-384.59.run --no-opengl-files （这里安装过程出错提示X的话用下面命令）
或者 sudo ./NVIDIA-Linux-x86_64-396.18.run -no-x-check -no-nouveau-check -no-opengl-files
只有禁用opengl这样安装才不会出现循环登陆的问题，顺便说一下，旧版本的应该跟我安装的一样步骤，新版本可能不一样，但是方法都是一样的，accept ok ok ok 就这些

![在这里插入图片描述](https://img-blog.csdnimg.cn/20190815133047101.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI1Mzg3MDcz,size_16,color_FFFFFF,t_70

安装好后输入 nvidia-smi 就可以看到显卡信息了，重启后输入密码正常进入系统，
也可以不重启系统，装好显卡驱动可直接安装 cuda
在这里插入图片描述
安装cuda sudo ./cuda_9.0.176_384.81_linux.run --no-opengl-libs

会弹出选项框直接ctrl+c 然后选accept

不要在安装显卡驱动，因为前面已经单独安装了，这一步选N ，如果选y 安装好后会登录循环

下一步，选y

在这里插入图片描述
然后按enter 下一步选y ，自动创建安装路径
最后一步可选y或n ，这里我选了n，我测试过，后面都是pass 通过的
然后等着出结果

这里是安装上了在这里插入图片描述
然后测试cuda 是否pass
CUDA Sample测试：

复制代码
#编译并测试设备 deviceQuery：
cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
在这里插入图片描述

然后在原有路径输入cd …/bandwidthTest，#编译并测试带宽 bandwidthTest：

输入
sudo make
输入
./bandwidthTest
复制代码
然后结果也是pass

如果这两个测试的最后结果都是Result = PASS，说明cuda 安装好了

下面就是安装 docker了，这里需要联网来操作，因为需要更新源，刚安装的系统不需要卸载docker，这里安装 docker 需要很大时间
1、sudo apt-get update ###更新apt-get源
在这里插入图片描述
2、sudo apt-get install apt-transport-https ca-certificates curl software-properties-common ###安装docker的依赖

3、curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -

4、sudo apt-key fingerprint 0EBFCD88 添加秘钥

在这里插入图片描述

5、sudo add-apt-repository “deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable” 建议手动打，复制粘贴会出错，不报错是正常的

在这里插入图片描述

6、sudo apt-get update ####再次跟新
在这里插入图片描述

7、sudo apt-get install docker-ce ###开始安装docker 这里要等漫长时间
在这里插入图片描述

8、apt-cache madison docker-ce ###加载docker

9.sudo docker run hello-world ###验证docker是否安装成功。如果安装完成会有以下提示
在这里插入图片描述

然后下载 nvidia-docker deb文件

wget -P /tmp https://github.com/NVIDIA/nvidia-docker/releases/download/v1.0.1/nvidia-docker_1.0.1-1_amd64.deb

sudo dpkg -i /tmp/nvidia-docker*.deb && rm /tmp/nvidia-docker*.deb

安装好后，就是验证 nvidia图形显卡是否在docker 上显示了，在终端输入 sudo nvidia-docker run --rm nvidia/cuda:9.0-devel（或者9.0-base） nvidia-smi 都显示就是可以了
可能还需要下载几百兆的东西然后就可以显示了，我实验时候是需要下载的正常显示如图

在这里插入图片描述

向您推荐>>Eolink开发者社区

权威｜前沿｜技术｜干货｜国内首个API全生命周期开发者社区

更多推荐

深入理解 Mocha 测试框架：从零实现一个 Mocha

前言什么是自动化测试自动化测试在很多团队中都是Devops环节中很难执行起来的一个环节，主要原因在于测试代码的编写工作很难抽象，99%的场景都需要和业务强绑定，而且写测试代码的编写工作量往往比编写实际业务代码的工作量更多。在一些很多业务场景中投入产出比很低，适合写自动化测试的应该是那些中长期业务以及一些诸如组件一样的基础库。自动化测试是个比较大的概念，其中分类也比较多，比如单元测试，端对端测试，集

云原生

ELK实现containerd的容器日志采集展示【基于logging的全栈监测】

企业级ELK Stack构建介绍

云原生

(20200916 Solved)docker-compose up创建容器自动退出

问题描述如题，创建容器后自动退出了。并且docker start container无效解决方案原因是缺失了控制终端的配置，需要在docker-compose.yml中增加tty:true ，有时候这样也不行，需要再增加一个command:/bin/bash，命令不一定是这个，需要是一个不会退出的命令，然后用-d后台启动容器。Referencesdocker-compose启动容器后自动退出...