PyTorch CUDA RuntimeError: all CUDA-capable devices are busy or unavailable

某天服务器的屏幕锁突然解不开,输入不了密码,只能关机重启,一般这种情况重启后都会有问题,以前遇到重启后显卡驱动报错,只要卸载原先的驱动然后再重装一遍显卡驱动就行了。

这次遇到的问题如标题所示,在网上搜索了一些解决方案,但是都没用,因为我这是两个卡,只有一个人用,代码也没有任何问题,根据以往经验判断还是显卡驱动的问题。
但是卸载重装自适应版本还是不行,于是去navidia官网查看最新的驱动版本重新安装就解决了问题。
比如我原本是460版本,查询得到最新版本为465.24,从官网下载最新版本的.run文件,安装之后bug解决。

官网查询版本地址:https://www.nvidia.cn/Download/index.aspx?lang=cn

下载后安装参考博客https://blog.csdn.net/qq_42091428/article/details/107393502?ops_request_misc=&request_id=&biz_id=102&utm_term=ubuntu%E5%A6%82%E4%BD%95%E5%9C%A8%E5%AE%89%E8%A3%85navidia%E6%98%BE%E5%8D%A1&utm_medium=distribute.pc_search_result.none-task-blog-2allsobaiduweb~default-1-107393502.first_rank_v2_pc_rank_v29

因为之前安环境都是配置好的,所以从该文的第二部分一步一步照做就可以了。

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐