Radeon GPU Profiler的API Shader Stage Control 用法

颜早早

144人浏览 · 2025-01-22 11:41:22

颜早早 · 2025-01-22 11:41:22 发布

API Shader Stage Control

加入AMD AI开发者计划！

免费领 200 小时云算力，进群参与显卡、AI PC 幸运抽奖

更多推荐

生产级大模型服务部署，vLLM 多卡并行与监控告警方案

本文详解生产级大模型服务部署方案，聚焦 vLLM 多卡并行优化与监控告警体系。通过 CPU 亲和性绑定提升通信效率，结合 DCGM、Prometheus 及 Grafana 构建全链路可观测性，有效解决长尾延迟与资源瓶颈，保障高并发场景下的大模型服务稳定运行。

AMD开发者中国社区

Strix Halo 部署避坑指南，从驱动配置到模型量化的真实经验

本文详解 Strix Halo 部署避坑指南，涵盖驱动选型与模型量化策略。针对 Ryzen AI Max+统一内存架构，推荐原生 Windows+Vulkan 后端，并指出 Q5_K_M 为最佳量化格式。通过配置 HSA_OVERRIDE_GFX_VERSION 解决编译报错，结合 KV Cache 监控优化性能，助开发者高效落地端侧 AI 应用。