logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

使用 vLLM 在 Kubernetes 单节点部署 Qwen2.5 小模型实践

本文完成了一个从模型下载到 Kubernetes 部署的完整小模型推理服务实践。ModelScope 下载 Qwen2.5-1.5B-Instruct↓模型保存到宿主机 /data/models↓nerdctl 单独启动 vLLM 进行验证↓Kubernetes Pod 通过 hostPath 挂载模型目录↓vLLM 加载本地模型↓Volcano Scheduler 调度 vGPU 资源↓Serv

#kubernetes#容器
Kubernetes 中部署 NVIDIA GPU Operator,并接入 Prometheus + Grafana 监控 GPU 指标

本文介绍了在Kubernetes集群中部署NVIDIA GPU Operator的完整流程。主要内容包括:1. 环境准备(Kubernetes 1.35.5、NVIDIA RTX 3070Ti显卡、containerd运行时);2. 通过Helm部署GPU Operator并配置相关参数,包括禁用自动安装驱动(driver.enabled=false)和启用DCGM Exporter;3. 验证G

HAMi + Volcano 联合测试:在单节点 Kubernetes 上使用 RTX 3070 Ti 验证 vGPU 与 Gang Scheduling

本文记录了在Kubernetes单节点集群(配备NVIDIA RTX 3070Ti显卡)上测试VolcanovGPU与HAMi-core实现GPU共享调度的过程。测试验证了四个核心场景:1)单Pod成功申请vGPU资源(2000Mi显存/30%核心);2)VolcanoJob通过minAvailable实现GangScheduling,确保两个worker同时调度;3)资源不足时PodGroup保

Volcano 部署与基础功能测试:VolcanoJob、Gang Scheduling、Queue 与 Deployment 调度验证

Volcano 是一个 Kubernetes 原生的批调度系统,主要面向 AI 训练、大数据计算、HPC、高性能批处理等场景。相比 Kubernetes 默认调度器,Volcano 更关注“成组任务”的调度语义。例如分布式训练中的多个 worker、parameter server、MPI 任务等,这类任务往往不是单个 Pod 能独立完成的,而是需要一组 Pod 同时满足资源条件后才具备运行意义。

Volcano 部署与基础功能测试:VolcanoJob、Gang Scheduling、Queue 与 Deployment 调度验证

Volcano 是一个 Kubernetes 原生的批调度系统,主要面向 AI 训练、大数据计算、HPC、高性能批处理等场景。相比 Kubernetes 默认调度器,Volcano 更关注“成组任务”的调度语义。例如分布式训练中的多个 worker、parameter server、MPI 任务等,这类任务往往不是单个 Pod 能独立完成的,而是需要一组 Pod 同时满足资源条件后才具备运行意义。

GPU Operator 是什么?和 NVIDIA Device Plugin 是什么关系?

本文系统梳理了Kubernetes支持NVIDIA GPU的技术架构,重点分析了各层级组件的作用与协作关系: 基础支撑层 NVIDIA Driver:使宿主机识别GPU硬件 Container Toolkit:让容器运行时支持GPU访问 Kubernetes集成层 Device Plugin:核心组件,将GPU注册为可调度资源(nvidia.com/gpu) 通过DaemonSet部署,使kube

到底了