登录社区云,与社区用户共同成长
邀请您加入社区
大模型推理正从通用GPU加速转向专用AI芯片优化,其核心在于软硬协同的深度适配。理解CUDA与CANN的本质差异——前者强调线程级精细控制,后者依托AscendCL运行时实现计算图抽象——是迁移成功的前提。技术价值体现在性能、功耗与稳定性三重突破:昇腾950PR凭借Da Vinci 3.0架构和2.4TB/s HBM带宽,在128K长上下文场景下实现312ms P99延迟与62%功耗降幅;而Dyn
授课团队课程兼顾大模型基础原理、轻量化微调前沿技术与昇腾算力工程落地实践,以 Qwen3 系列模型为实操载体讲解核心技术,同步指导学员完成训练调参、Loss 与超参监控、多组实验对比等标准化科研流程,并依托昇腾 NPU 硬件、CANN 一站式开发平台开展 Ascend C 开发与 CANNBot 智能体实践,让全体学员完整完成算子开发、NPU 编译加速、大模型微调三大工程案例,亲手实践自主算力软硬
随着 DeepSeek 等越来越多国产大模型适配昇腾等国产软硬件环境,很多开发者也开始希望上手体验 NPU 训练与推理。如果你准备在昇腾 NPU 上基于 CANN 云开发环境运行 **Qwen2.5-1.5B-Instruct + verl**,这篇文档可以作为一条可复现、可验收的实践路径。
本课程将介绍在DeepSeek-V4网络上如何基于TorchTitan-NPU框架攻克超长文本训练瓶颈、实现512K级别长序列的大规模续训练,怎样结合大EP+FSDP以及torch.compile+AutoFuse编译入图方案达成极致训练吞吐性能的实践经验,分享如何帮助昇腾大模型开发者在超长上下文场景下快速开展 CPT/SFT算法验证并实现开箱即优。
B站预约链接:点击预约
本课程将介绍在DeepSeek V4网络上如何实现网络精度无损的低bit量化,怎样结合昇腾软硬件特性达成网络极致部署性能的实践经验,分享如何在实际量化模型部署中平衡精度损失与推理加速。
欢迎小伙伴们预约观看,参与互动答题赢CANN周边礼品,不容错过,我们直播间见~
DeepSeek V4引入全新的Compressor算子,实现模型推理的关键性能突破,本课程深入解析Compressor算子的设计理念、核心算法与实现细节,探讨在低时延场景下的优化策略。
AI Agent作为新一代智能应用范式,其核心挑战不在模型能力,而在多跳推理下的低延迟调度与软硬协同效率。传统GPU架构因Kernel启动开销大、内存搬运频繁,难以适配Agent‘小而碎’的计算特征。昇腾通过CANN编译运行时系统、MindStudio全栈调试工具与NPU硬件深度耦合,实现PyTorch代码零修改迁移,并在典型多跳任务中将P99延迟压至1.1秒内。该方案显著降低AI工程化门槛,适用
NPU推理是AI模型国产化落地的核心环节,其本质区别于GPU的内存管理、流同步与计算图执行机制。理解昇腾硬件特性(如HBM带宽约束、SIMD对齐要求、PCIe延迟抖动)和CANN运行时行为(如aclrtSetDevice就绪机制、动态shape支持边界),是保障DeepSeek V4-Pro等MoE架构大模型稳定推理的前提。技术价值在于规避静默失败、显存泄漏与时序错乱等产线高频问题;典型应用场景涵
大模型推理性能不仅取决于参数规模,更依赖底层硬件抽象、算子优化与编译调度的深度协同。在AI基础设施自主可控趋势下,'去CUDA化'已从概念走向工程实践——它要求重构硬件抽象层(HAL)、运行时调度(CANN Runtime)、自研算子库(如AscendFlash)、图编译器(MindIR)、框架适配(PyTorch Custom Autograd)、混合精度策略及数据管道。DeepSeek V4
稀疏注意力(Sparse Attention)是大语言模型处理长上下文的核心技术,其原理在于通过结构化稀疏计算降低显存带宽压力,而非简单跳过token。相比FlashAttention-2等通用优化方案,DeepSeek-V3.2提出的DSA(DeepSeek Sparse Attention)结合硬件感知编译器CANN,实现了从算法设计到GPU kernel级的端到端协同优化,显著提升128K长
B站直播间链接:点击跳转 视频号、B站搜索: 【昇腾CANN】
以开源仓样例代码为依托,详解Cube类算子开发的设计逻辑、代码架构及关键代码功能,帮助开发者扫清入门障碍,高效上手Cube算子开发
AI 大模型的浪潮已经从“技术探索”全面迈入“场景落地”的新阶段。作为连接大模型与现实世界的关键桥梁,正在重塑千行百业的生产力。面对广阔的行业应用前景,开发者们也面临着真实的痛点:底层算力如何高效调用?模型适配如何更加平滑?从代码开发到行业落地的“最后一公里”究竟该怎么走?,由联合主办的将在上海重磅开启!无论你是深耕算法的极客,还是苦苦寻找解决方案的行业专家,这场干货满满的线下聚会都不容错过!
CANN开发者Meetup|开发体验专场开始报名啦
CANN
——CANN
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net