登录社区云,与社区用户共同成长
邀请您加入社区
接下来,在Droplet 上执行下面这条命令,从 HuggingFace 拉取经过剪枝的 MiniMax-M2.1 模型。本文将带你实操:如何在AMD Developer Cloud 上,借助企业级数据中心 GPU,AMD GPU(单卡 192GB 显存),免费运行一个强大的开源大模型,让你摆脱消费级 GPU 的限制。下面的所有步骤,都需要在你上一节已经创建好的 Droplet 上完成。现在,你可
5] 访问 ROCm AI Developer Hub,了解更多关于在 AMD GPU 上进行 AI 开发的教程、开源项目和技术博客:https://www.amd.com/en/developer/resources/rocm-hub/dev-ai.html?通过在 AMD GPU 上实现 SGLang 与 vLLM 的 Day 0 支持,我们为开发者提供了强大的算力平台和经过优化的软件栈,使其
AMD与Meta宣布扩大战略合作,达成一项为期多年、总量达6吉瓦(GW)的AMD Instinct GPU供应协议。此次合作涉及定制芯片、系统及软件层面的深度协同,旨在为Meta的大规模AI工作负载构建高性能、高能效的基础设施。
与拥有少量强大核心的CPU不同,GPU内部集成了成百上千个,乃至如今数以万计的、相对小巧但高效的计算单元,这些单元被称为“流处理器”(Streaming Processors, SP)或“CUDA核心”。因此,GPU早已超越了“图形”的范畴,成为通用并行计算(GPGPU)的核心,是名副其实的“算力心脏”。这是GPU工作站的传统优势领域,并且在2025年,随着实时渲染和虚拟现实(VR)的普及,其重要
摘要: ROCm是AMD推出的开源GPU计算平台,旨在挑战NVIDIA CUDA在高性能计算领域的地位。其核心组件包括支持Radeon和Instinct GPU的硬件层、ROCr运行时及HIP工具,后者可实现CUDA代码向ROCm的移植。ROCm还提供对标CUDA的数学库(如rocBLAS、MIOpen),优化HPC和AI任务。尽管开源策略带来透明度和社区优势,但ROCm仍面临生态系统成熟度、性能
本文是对的Radeon GPU Profiler(RGP)的学习记录,原文是AMD的官网介绍,本文翻译overview部分。主要涉及Frame summary 、Barriers、 Context rolls 、Most expensive events、Pipelines这几个部分。
AMD刚刚正式宣布了推出Radeon RX 9000系列显卡家族的首批产品——Radeon RX 9070与Radeon RX 9070 XT。两款显卡基于全新RDNA 4架构,搭载第三代光线追踪加速器与第二代AI加速单元,目标以高性价比策略冲击中高端GPU市场。这些产品将与英伟达的Blackwell RTX 50系列GPU以及英特尔的Battlemage Arc B系列GPU展开竞争,并且在未来
在启动参数中传入radeon.hard_reset=1这一参数,实际上是给模块参数赋了值,模块参数所在文件及代码为:drivers/gpu/drm/radeon/radeon_drv.cint radeon_hard_reset = 0;MODULE_PARM_DESC(hard_reset, "PCI config reset (1 = force enable, 0 = disable (de
1.什么是Radeon简介:Radeon(中文名称称为镭龙™)是一个英文产品的商标。Radeon是AMD公司出品的显示芯片的一种系列。俗称A卡。全称一般写作:AMD Radeon HD xxxx ,例如台式机显卡型号:AMD Radeon HD 6450。HD7000系列以后,AMD启用新的AMD Radeon R9/R7 xxx命名旗下新的显示芯片。出产型号AMD Radeon系列的台式机显卡有
GPU(Graphics Processing Unit,图形处理器)是一种专门设计用于处理图形和并行计算任务的微处理器。最初GPU主要用于计算机图形渲染,但随着技术的发展,现代GPU已经成为并行计算、人工智能、科学计算等领域不可或缺的核心组件。
你是否还在为GPU性能瓶颈难以定位而困扰?传统调试工具要么功能单一,要么操作复杂,让开发者在优化图形应用时举步维艰。本文将带你掌握RenderDoc与AMD Radeon GPU Profiler(RGP)的无缝集成方案,通过5个实战步骤解决90%的GPU性能问题,读完你将获得:- 零代码配置RenderDoc-RGP双向通信- 精准定位Shader瓶颈的事件关联技巧- 跨工具数据联动的高级...
原文:关注公zh: AI-Frontiers论文标题:mHC: Manifold-Constrained Hyper-Connections论文地址:https://arxiv.org/pdf/2512.24880延续在节假日搞事情的习惯,2026年元旦期间,Deepseek发表了一篇新论文,提出了名为mHC(Manifold-Constrained Hyper-Connections,流形约束超