最近跑一个知识图谱的程序,按照论文作者的说明,执行以下命令训练模型:

CUDA_VISIBLE_DEVICES=0 python trainer.py 

然而,出现了以下报错:

 于是啪的一下,很快啊,立马上Google和百度找解决方案,结果发现,居然没一个有效回答。

但这个问题看样子,确实是困扰了挺多人,光下面这个网页浏览量就达到了3.6K。

 于是就只能自己动手丰衣足食了~

想到模型训练一般都是在Linux服务器上跑,而我在win10上测试,会不会是环境的问题?

于是把模型部署到了实验室Ubuntu18.04的服务器上,果然跑通了。

因为第0号显卡被师兄拿来跑程序了,这里我把GPU改成了第1张

CUDA_VISIBLE_DEVICES=1 python trainer.py 

这说明这条命令在Linux上是没问题的,只是在windows上不适用。

那么,要用个人PC在windows上运行咋办呢?

其实这条命令的含义很简单,也就是指定某个GPU来运行程序,我们可以在程序开头添加指定GPU的代码,效果是一样的:

import os
os.environ["CUDA_VISIBLE_DEVICES"]='0'

或者在程序外部cmd命令行里执行以下命令,设置临时变量:

set CUDA_VISIBLE_DEVICES=0

由于我的工作机上只插了一张显卡,于是我直接把它设置成了环境变量:

 然后在windows上运行 python trainer.py 即可。

(以前遇到问题总是上Google和百度白嫖解决方案,依赖万能网友们,这次花了十分钟写了个自己的解决方案,总算是为互联网贡献了自己的微小贡献了~)

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐