服务器docker安装多版本cuda

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas 是基于N

zdbhbc

5249人浏览 · 2021-05-29 14:40:07

zdbhbc · 2021-05-29 14:40:07 发布

一、创建docker

sudo NV_GPU=7 nvidia-docker run --name wgxiest -it -p 10029:22 -p 5009:80 -v /raid/wgxie/ssh-swin/:/workspace nvcr.io/nvidia/pytorch:20.12-py3
(10029和5009是宿主机端口,自定)

二、更新库

apt update
apt upgrade

三、安装CUDA

安装依赖

sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev

运行CUDA安装包

sh cuda_10.1.243_418.87.00_linux.run

报错：

./cuda-installer: error while loading shared libraries: libxml2.so.2: cannot open shared object file: No such file or directory

原因是缺少：libxml2

解决方法：

apt install libxml2

#安装时需要选择地区，选择亚洲上海即可

报错：

Failed to verify gcc version. See log at /var/log/cuda-installer.log for details.

跳过gcc版本检查即可

解决方法：

sh cuda_10.1.243_418.87.00_linux.run --override

弹出cuda安装参数时，需要确定的有

接受条款：accept

选择安装内容：单选 cuda toolkit

update cuda路径：yes

报错：

Installation failed. See log at /var/log/cuda-installer.log for details.

查看该日志，主要报错信息为：

[ERROR]: boost::filesystem::remove: Directory not empty: "/var/log/nvidia/.uninstallManifests/CUDA_Toolkit_10.1-components/"

出现这种情况，只需要在安装命令后再加上安装路径

--librarypath=/usr/local/cuda-10.1

安装路径按自己的选择

解决方法：

sh cuda_10.1.243_418.87.00_linux.run --override --librarypath=/usr/local/cuda-10.1

出现下图界面，安装成功

nvidia-smi 查看cuda版本是否更换成功
nvcc -V

四、配置CUDA环境变量(可选)

添加环境变量


vi ~/.bashrc 

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda

多版本切换

cd /usr/local

cuda是默认路径，cuda-10.1和cuda-11.1是安装的两个版本

使用stat查看cuda文件夹链接的是哪个版本的cuda

可以看到cuda链接的是cuda-10.1

当想要使用cuda-11.1时，删除当前软链接，新建cuda-11.1和cuda的软链接即可。

sudo rm -rf cuda
sudo ln -s /usr/local/cuda-10.1 /usr/local/cuda

再次确认版本：

总结

本文主要是记录创建服务器docker后，cuda版本不符要求进行多版本安装配置，仅供私人学习。

向您推荐>>Eolink开发者社区

权威｜前沿｜技术｜干货｜国内首个API全生命周期开发者社区

更多推荐

沃云统一开发平台介绍

沃云集成平台研发平台介绍1.平台优势2.平台原理3.研发平台使用方法4.遇到的问题5.现阶段实现的功能6.后续需要补充的功能和优化内容研发平台介绍1.平台优势解决孤岛式应用，实现能力共享；现有系统框架过于复杂，跨系统业务处理成本居高不下，协同服务共享，降低运维成本；提高项目应用资源监控能力，改善资源利用率；业务微服务化，快速发布、快速部署，快速响应业务需求变化；沃云平台不仅提供了自动化的、可快速部

云原生

(20200916 Solved)docker-compose up创建容器自动退出

问题描述如题，创建容器后自动退出了。并且docker start container无效解决方案原因是缺失了控制终端的配置，需要在docker-compose.yml中增加tty:true ，有时候这样也不行，需要再增加一个command:/bin/bash，命令不一定是这个，需要是一个不会退出的命令，然后用-d后台启动容器。Referencesdocker-compose启动容器后自动退出...

云原生

基于docker的test-containers环境百宝箱

笔者语录：我开了个公众号【Java你我他】，欢迎大家关注。在很多时候，程序猿们更关注代码本身，而不愿意把时间花费在环境搭建上，这也是Docker变得越来越受欢迎的原因之一。test-containe是Docker生态圈中的一颗新星，其主要针对测试领域、背靠Docker实现环境百宝箱功能。 test-containers：你要的环境，我都有~ 假设我们现在需要一个redis-clust

云原生

所有评论(0)

查看更多评论

zdbhbc

@zdbhbc

已为社区贡献1条内容