在配置完环境以后运行程序,程序正常运行但是GPU没有任务,此时判断程序没有在GPU上运行。调试步骤:

  • 先查看cuda安装有没有问题:nvcc -V

                                

可以看到cuda驱动等安装没有问题。

  • 进程序去看.cuda()或者.todevice之类代码,看程序确实放在GPU上了,故排除

但是在查看代码是看到这里是一个and,参数args.no_cuda是设置的Flase,所以问题因为在torch.cuda.is_available(),没有获得cuda加速。

  • 查看深度学习环境搭建torch.cuda.is_available()这里返回了False,所以原因在这里

Torch官网的版本只提供了CUDA 9.2和CUDA 10.1的版本,我的cuda是10.0的。所以这里版本不对应导致Torch.cuda加速无法运行。

但是出现这个错误的原因有很多,但是因为环境配置的比较仓促,所以查看了一下环境配置,怀疑是pytorch安装版本不对应。

所以把torch,torchvision等相关安装包全部删除,安装适合版本的torch。

pip install https://download.pytorch.org/whl/cu100/torch-1.1.0-cp37-cp37m-linux_x86_64.whl
pip install https://download.pytorch.org/whl/cu100/torchvision-0.3.0-cp37-cp37m-linux_x86_64.whl

再次运行:

                                          

再次运行程序,程序就可以在GPU上运行啦。

 

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐