
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文完成了一个从模型下载到 Kubernetes 部署的完整小模型推理服务实践。ModelScope 下载 Qwen2.5-1.5B-Instruct↓模型保存到宿主机 /data/models↓nerdctl 单独启动 vLLM 进行验证↓Kubernetes Pod 通过 hostPath 挂载模型目录↓vLLM 加载本地模型↓Volcano Scheduler 调度 vGPU 资源↓Serv
本文介绍了在Kubernetes集群中部署NVIDIA GPU Operator的完整流程。主要内容包括:1. 环境准备(Kubernetes 1.35.5、NVIDIA RTX 3070Ti显卡、containerd运行时);2. 通过Helm部署GPU Operator并配置相关参数,包括禁用自动安装驱动(driver.enabled=false)和启用DCGM Exporter;3. 验证G
本文记录了在Kubernetes单节点集群(配备NVIDIA RTX 3070Ti显卡)上测试VolcanovGPU与HAMi-core实现GPU共享调度的过程。测试验证了四个核心场景:1)单Pod成功申请vGPU资源(2000Mi显存/30%核心);2)VolcanoJob通过minAvailable实现GangScheduling,确保两个worker同时调度;3)资源不足时PodGroup保
Volcano 是一个 Kubernetes 原生的批调度系统,主要面向 AI 训练、大数据计算、HPC、高性能批处理等场景。相比 Kubernetes 默认调度器,Volcano 更关注“成组任务”的调度语义。例如分布式训练中的多个 worker、parameter server、MPI 任务等,这类任务往往不是单个 Pod 能独立完成的,而是需要一组 Pod 同时满足资源条件后才具备运行意义。
Volcano 是一个 Kubernetes 原生的批调度系统,主要面向 AI 训练、大数据计算、HPC、高性能批处理等场景。相比 Kubernetes 默认调度器,Volcano 更关注“成组任务”的调度语义。例如分布式训练中的多个 worker、parameter server、MPI 任务等,这类任务往往不是单个 Pod 能独立完成的,而是需要一组 Pod 同时满足资源条件后才具备运行意义。
本文系统梳理了Kubernetes支持NVIDIA GPU的技术架构,重点分析了各层级组件的作用与协作关系: 基础支撑层 NVIDIA Driver:使宿主机识别GPU硬件 Container Toolkit:让容器运行时支持GPU访问 Kubernetes集成层 Device Plugin:核心组件,将GPU注册为可调度资源(nvidia.com/gpu) 通过DaemonSet部署,使kube







