superDBL 个人主页

@weixin_44349426

superDBL

2022-11-21 15:07:00 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

使用 vLLM 在 Kubernetes 单节点部署 Qwen2.5 小模型实践

本文完成了一个从模型下载到 Kubernetes 部署的完整小模型推理服务实践。ModelScope 下载 Qwen2.5-1.5B-Instruct↓模型保存到宿主机 /data/models↓nerdctl 单独启动 vLLM 进行验证↓Kubernetes Pod 通过 hostPath 挂载模型目录↓vLLM 加载本地模型↓Volcano Scheduler 调度 vGPU 资源↓Serv

#kubernetes #容器

Kubernetes 中部署 NVIDIA GPU Operator，并接入 Prometheus + Grafana 监控 GPU 指标

本文介绍了在Kubernetes集群中部署NVIDIA GPU Operator的完整流程。主要内容包括：1. 环境准备（Kubernetes 1.35.5、NVIDIA RTX 3070Ti显卡、containerd运行时）；2. 通过Helm部署GPU Operator并配置相关参数，包括禁用自动安装驱动（driver.enabled=false）和启用DCGM Exporter；3. 验证G

HAMi + Volcano 联合测试：在单节点 Kubernetes 上使用 RTX 3070 Ti 验证 vGPU 与 Gang Scheduling

本文记录了在Kubernetes单节点集群（配备NVIDIA RTX 3070Ti显卡）上测试VolcanovGPU与HAMi-core实现GPU共享调度的过程。测试验证了四个核心场景：1）单Pod成功申请vGPU资源（2000Mi显存/30%核心）；2）VolcanoJob通过minAvailable实现GangScheduling，确保两个worker同时调度；3）资源不足时PodGroup保

Volcano 部署与基础功能测试：VolcanoJob、Gang Scheduling、Queue 与 Deployment 调度验证

Volcano 是一个 Kubernetes 原生的批调度系统，主要面向 AI 训练、大数据计算、HPC、高性能批处理等场景。相比 Kubernetes 默认调度器，Volcano 更关注“成组任务”的调度语义。例如分布式训练中的多个 worker、parameter server、MPI 任务等，这类任务往往不是单个 Pod 能独立完成的，而是需要一组 Pod 同时满足资源条件后才具备运行意义。

Volcano 部署与基础功能测试：VolcanoJob、Gang Scheduling、Queue 与 Deployment 调度验证

GPU Operator 是什么？和 NVIDIA Device Plugin 是什么关系？

本文系统梳理了Kubernetes支持NVIDIA GPU的技术架构，重点分析了各层级组件的作用与协作关系：基础支撑层 NVIDIA Driver：使宿主机识别GPU硬件 Container Toolkit：让容器运行时支持GPU访问 Kubernetes集成层 Device Plugin：核心组件，将GPU注册为可调度资源(nvidia.com/gpu) 通过DaemonSet部署，使kube

到底了