问题:远程能跑,本地连远程调试跑不通,显示Found no NVIDIA driver,或是torch._C._cuda_init() RuntimeError: cuda runtime error (38) : no CUDA-capable device is detected
首先,确认自己的cuda是available的:

import torch
print(torch.cuda.is_available())
print(torch.cuda.device_count())
print(torch.cuda.get_device_name())
print(torch.cuda.current_device())

发现确实是available的。

由于服务器上是能跑的,pycharm连服务器也只配了deployment和interpreter,显然不是deployment的问题,所以找interpreter的问题。
期间看了几个blog,都没用,基本都是cuda is available是False的情况,唯一一个也是True的是这篇blog,加入LD_LIBRARY_PATH解决了,但我这里加入解决不了

折腾了半天,感觉应该是interpreter的一些映射出了问题的缘故,所以删了远程环境在本地的一些映射文件,然后重新配了一个相同的新的remote python interpreter
skeleton装载完毕之后,就没报错了

Logo

鸿蒙生态一站式服务平台。

更多推荐