ubuntu20.04 k8s nvidia-device-plugin: failed to initialize NVML
nvidia-device-plugin failed to initialize NVML k8s kubenetes ubuntu20.04
·
部署k8s时其中一台机器ubuntu20.04无法获取到显卡数据,其他ubuntu16.04机器可以正常获取显卡数据
主机上可以正常看到显卡信息
1.查看pod日志
错误:Failed to initialize NVML: could not load NVML library.
2.进入docker
单独启动报同样的错
看一下nvidia-smi
找不到libnvidia-ml.so错误
加载这个库启动libnvidia-ml.so 试试
成功起来
3.猜测原因可能是docker在ubuntu20.04上运行没有价值nvidia相关的库,考虑启动前先执行ldconfig加载库
4.修改nvidia-device-plugin的yml 文件的启动方式启动前先执行ldconfig
5.重新部署后正常
更多推荐
已为社区贡献1条内容
所有评论(0)