导语:记录一下在k8s的pod中无法使用cuda及获取不到egl

问题1 nvidia-smi可以获取到显卡版本 但是使用torch时显示没有gpu

UserWarning: CUDA initialization: Found no NVIDIA driver on your system

# python3中执行
import torch
torch.cuda.is_available()
# 返回True 接着用下列代码进一步测试
torch.zeros(1).cuda()

问题2 无法获取egl

# 已经安装对应egl的依赖也不行
apt install libglew-dev -y;
apt install gcc-multilib -y ;
apt-get install mesa-utils -y ;
apt-get install freeglut3-dev -y ;
apt-get install -y build-essential -y ;
apt-get install libgl1-mesa-dev freeglut3-dev libglu1-mesa-dev -y ;
apt-get install libsoil-dev libglm-dev libassimp-dev libglew-dev libglfw3-dev libxinerama-dev libxcursor-dev libxi-dev -y 

可以通过开启特权模式 以上2个问题都可以解决

        securityContext:
          privileged: true

通过env参数 也可以解决

        env:
        - name: NVIDIA_DRIVER_CAPABILITIES
          value: compute,utility,video,graphics,display
        - name: NVIDIA_VISIBLE_DEVICES
          value: all
Logo

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐