安装nvidia/gpu-operator支持GPU在容器中共享

安装 nvidia/gpu-operator遇到两个问题:

  1. 由于我们都懂的某个原因,导致某些镜像一直现在不成功。
    解决办法,准备一个🪜;
    或者,修改镜像地址,换成能访问的。
  2. 安装在宿主机上的 nvidia-container-toolkit配置给 containerd 使用; 我们的k8s使用的rke2;rke2 托管了containerd 的配置文件,直接修改重启后会被重置回去
    最后,我们采用 https://thenewstack.io/install-a-nvidia-gpu-operator-on-rke2-kubernetes-cluster/这篇文档中的步骤成功将 nvidia/gpu-operator 安装上了。

当时安装的详细步骤没有记录,重现起来太累了,也没有多少人阅读;说来算是虎头蛇尾,惭愧呀……
在这里插入图片描述

Logo

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐