问题

docker: Error response from daemon: OCI runtime create failed: container_linux.go:344: starting
container process caused "process_linux.go:424: container init caused \"process_linux.go:407: running
prestart hook 1 caused \\\"error running hook: exit status 1, stdout: , stderr: exec command: 
[/usr/bin/nvidia-container-cli --load-kmods configure --ldconfig=@/sbin/ldconfig.real --device=all --
compute --utility --require=cuda>=10.0 brand=tesla,driver>=384,driver<385 --pid=7142 
/var/lib/docker/overlay2/c2f4ac7d7d905051e77682447a97f563cbdf7ccf2fe43afccdb521350adab0f4/mer
ged]\\\\nnvidia-container-cli: requirement error: unsatisfied condition: brand = tesla\\\\n\\\"\"": unknown.
复制代码

原因:

显卡驱动版本和cuda10不兼容(版本信息)
查看驱动版本命令:nvidia-smi

 

一、环境

内核:3.10.0-514.26.1.el7.x86_64

gcc:4.8.5

二、卸载旧版驱动

使用 chmod a+x 给下载的.run文件添加执行权限,然后使用 --uninstall参数进行旧版驱动卸载

chmod a+x NVIDIA-Linux-x86_64-440.33.01.run (对应老驱动版本)
./NVIDIA-Linux-x86_64-440.33.01.run --uninstall

or 

使用如下命令卸载:

sudo /usr/bin/nvidia-uninstall

三、安装显卡驱动

1、检查是否屏蔽掉了默认的nouveau

lsmod | grep nouveau

有输出内容则没有屏蔽

2、屏蔽掉了默认的nouveau

vim /lib/modprobe.d/dist-blacklist.conf
将nvidiafb注释掉:
#blacklist nvidiafb 

然后添加以下语句:
blacklist nouveau
options nouveau modeset=0

3、重建initramfs image步骤

mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

dracut /boot/initramfs-$(uname -r).img $(uname -r)

4、修改运行级别为文本模式

systemctl set-default multi-user.target

5、重启系统

reboot

6、验证nouveau是否已禁用(无输出则代表已禁用)

lsmod | grep nouveau

7、开始安装显卡驱动

chmod a+x NVIDIA-Linux-x86_64-440.33.01.run
./NVIDIA-Linux-x86_64-440.33.01.run 

没有报错的话会很快完成!!!!

 

 

 

 

 

Logo

权威|前沿|技术|干货|国内首个API全生命周期开发者社区

更多推荐