WSL2上Docker打包的镜像迁移到Ubuntu服务器上无法使用GPU

WSL2上Docker打包的镜像迁移到Ubuntu服务器上无法使用GPU的解决方法

Leeoo_lyq

4214人浏览 · 2022-08-03 11:43:25

Leeoo_lyq · 2022-08-03 11:43:25 发布

WSL2子系统上Docker打包的镜像迁移到Linux服务器后，启动容器输入命令nvidia-smi，没有输出预期的显卡和驱动信息，而是报错：

```
NVIDIA-SMI couldn't find libnvidia-ml.so library in your system. Please make sure that the NVIDIA Display Driver is properly installed and present in your system.
Please also try adding directory that contains libnvidia-ml.so to your system PATH.
```

从报错的信息来看，是无法检索到libnvidia-ml.so文件，所以要找到这个文件的路径（如果存在的话），建立正确的软连接。解决问题的方法：

检查软链接是否有问题
```
ldconfig
```
如果输出很多***empty，说明软链接确实有问题。
查询系统中文件名开头为“libnvidia-ml”的文件路径
```
find  -name libnvidia-ml*
```
可以看到文件在路径 /usr/lib/x86_64-linux-gnu下面

建立软链接

进入 /usr/lib/x86_64-linux-gnu，建立正确的软链接。

# 在容器中运行以下命令，注意下面的450.102.04是驱动版本信息，应当根据实际情况修改
cd /usr/lib/x86_64-linux-gnu
# 建立软链接 libcuda.so > libcuda.so.1
cp libcuda.so libcuda.so.backup
rm libcuda.so
ln -s libcuda.so.1 libcuda.so

# 建立软链接 libcuda.so.1 > libcuda.so.450.102.04
cp libcuda.so.1 libcuda.so.1.backup
rm libcuda.so.1
cp libcuda.so.450.102.04 libcuda.so.1

# 建立软链接 libnvidia-ml.so.1 > libnvidia-ml.so.450.102.04
cp libnvidia-ml.so.1 libnvidia-ml.so.1.backup
rm libnvidia-ml.so.1
ln -s libnvidia-ml.so.450.102.04 libnvidia-ml.so.1

有网友提出了另外一种解决方法，就是在WSL2子系统的Docker上启动容器不添加--gpus all配置参数，即不使用GPU。等配置好环境后，打包镜像，在服务器上再使用GPU来跑代码。这个方法我还没验证过，但看起来可行。

参考文章

向您推荐>>Eolink开发者社区

权威｜前沿｜技术｜干货｜国内首个API全生命周期开发者社区

更多推荐

ELK实现containerd的容器日志采集展示【基于logging的全栈监测】

企业级ELK Stack构建介绍

云原生

深入理解 Mocha 测试框架：从零实现一个 Mocha

前言什么是自动化测试自动化测试在很多团队中都是Devops环节中很难执行起来的一个环节，主要原因在于测试代码的编写工作很难抽象，99%的场景都需要和业务强绑定，而且写测试代码的编写工作量往往比编写实际业务代码的工作量更多。在一些很多业务场景中投入产出比很低，适合写自动化测试的应该是那些中长期业务以及一些诸如组件一样的基础库。自动化测试是个比较大的概念，其中分类也比较多，比如单元测试，端对端测试，集

云原生

(20200916 Solved)docker-compose up创建容器自动退出

问题描述如题，创建容器后自动退出了。并且docker start container无效解决方案原因是缺失了控制终端的配置，需要在docker-compose.yml中增加tty:true ，有时候这样也不行，需要再增加一个command:/bin/bash，命令不一定是这个，需要是一个不会退出的命令，然后用-d后台启动容器。Referencesdocker-compose启动容器后自动退出...

云原生

所有评论(0)

查看更多评论

Leeoo_lyq

@Leeoo_lyq

已为社区贡献1条内容