ERROR: No supported GPU(s) detected to run this container

ERROR: No supported GPU(s) detected to run this container在拉取yolov5官方Docker image之后docker run --ipc=host --gpus all -it ultralytics/yolov5:latest启动容器使用以下命令查看GPU：root@87fb0c80ec7f:~# nvcc -Vnvcc: NVIDIA

ayiya_Oese

3994人浏览 · 2021-03-09 15:03:36

ayiya_Oese · 2021-03-09 15:03:36 发布

ERROR: No supported GPU(s) detected to run this container

在拉取yolov5官方Docker image之后docker run --ipc=host --gpus all -it ultralytics/yolov5:latest启动容器
使用以下命令查看GPU：

root@87fb0c80ec7f:~# nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2020 NVIDIA Corporation
Built on Mon_Nov_30_19:08:53_PST_2020
Cuda compilation tools, release 11.2, V11.2.67
Build cuda_11.2.r11.2/compiler.29373293_0

root@87fb0c80ec7f:~# nvidia-smi -L
GPU 0: GeForce RTX 3090 (UUID: GPU-834af3c0-5d3b-00a7-c027-e68486b35d2d)

root@87fb0c80ec7f:~# nvidia-smi 
Tue Mar  9 06:41:13 2021       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.39       Driver Version: 460.39       CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce RTX 3090    Off  | 00000000:65:00.0  On |                  N/A |
| 34%   34C    P8    29W / 350W |    242MiB / 24265MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
+-----------------------------------------------------------------------------+

以上均可以正常查看GPU相关信息，但是在使用的时候却发现用不了GPU。

root@87fb0c80ec7f:~# python -c "import torch; print(torch.cuda.is_available())"
/opt/conda/lib/python3.8/site-packages/torch/cuda/__init__.py:52: UserWarning: CUDA initialization: CUDA unknown error - this may be due to an incorrectly set up environment, e.g. changing env variable CUDA_VISIBLE_DEVICES after program start. Setting the available devices to be zero. (Triggered internally at  ../c10/cuda/CUDAFunctions.cpp:104.)
  return torch._C._cuda_getDeviceCount() > 0
False

回头查看前面启动容器之后的打印信息：

ERROR: No supported GPU(s) detected to run this container

NOTE: MOFED driver for multi-node communication was not detected.
      Multi-node communication performance may be reduced.

相关issue显示：

可能是Docker安装有问题，或者是CUDA安装有问题

小结：
在容器中，即使nvcc -V，nvidia-smi都表现正常，GPU还是有用不了的可能

搞了一天，突然想起会不会是GPU设备被占用了，遂将电脑重启，果然重启大法好。

向您推荐>>Eolink开发者社区

权威｜前沿｜技术｜干货｜国内首个API全生命周期开发者社区

更多推荐

深入理解 Mocha 测试框架：从零实现一个 Mocha

前言什么是自动化测试自动化测试在很多团队中都是Devops环节中很难执行起来的一个环节，主要原因在于测试代码的编写工作很难抽象，99%的场景都需要和业务强绑定，而且写测试代码的编写工作量往往比编写实际业务代码的工作量更多。在一些很多业务场景中投入产出比很低，适合写自动化测试的应该是那些中长期业务以及一些诸如组件一样的基础库。自动化测试是个比较大的概念，其中分类也比较多，比如单元测试，端对端测试，集

云原生

ELK实现containerd的容器日志采集展示【基于logging的全栈监测】

企业级ELK Stack构建介绍

云原生

(20200916 Solved)docker-compose up创建容器自动退出

问题描述如题，创建容器后自动退出了。并且docker start container无效解决方案原因是缺失了控制终端的配置，需要在docker-compose.yml中增加tty:true ，有时候这样也不行，需要再增加一个command:/bin/bash，命令不一定是这个，需要是一个不会退出的命令，然后用-d后台启动容器。Referencesdocker-compose启动容器后自动退出...

云原生

所有评论(0)

查看更多评论

ayiya_Oese

@ayiya_Oese

已为社区贡献1条内容