登录社区云,与社区用户共同成长
邀请您加入社区
本文介绍基于华为BigCloud系统+CANN+MINDIE+DOCKER部署大模型。
本文详细介绍了在Mind Studio 3.0.2中解决Python解释器配置、cv2导入不一致和远程调试三大难题的实战方法。通过系统化的解决方案和高效的工作流优化,帮助开发者提升昇腾AI应用开发效率,特别适合华为昇腾平台的开发环境配置。
大模型部署本质上是计算图、内存布局与硬件执行单元的深度协同过程。当通用大模型(如GLM系列)迁移至国产AI芯片(如昇腾910B)时,传统GPU移植范式失效,必须面向DSA架构重构编译流程、显存管理与数值精度控制。核心挑战在于计算图编译失败、Unified Buffer显存爆炸及BF16精度漂移,而解决方案依赖硬件感知的ONNX导出、动态UB切分与混合精度校准等关键技术。veRL等向量化强化学习范式
大语言模型推理优化是AI工程落地的核心环节,其本质是计算、内存与通信三者的协同调度。Qwen3.5作为支持BF16+INT8混合精度与滑动窗口注意力的先进架构,天然适配昇腾AI处理器的硬件特性——如HBM2e内存带宽约束、AI Core密集计算单元及HCCL通信协议。相比通用CUDA生态方案,昇腾平台需重构PagedAttention内存管理、Kernel细粒度融合及分布式同步语义,才能释放真实性
大模型推理正从‘能跑’迈向‘稳跑、快跑、长跑’新阶段。百万上下文并非单纯堆砌显存,而是依赖稀疏注意力(DSA)、硬件级KV Cache优化与NPU原生编译支持的系统工程。DeepSeek V4通过动态稀疏机制大幅降低计算复杂度,昇腾NPU凭借HCCS互联、FP8张量计算与智能内存调度,实现TPOT<10ms的稳定低延迟。该技术组合显著降低Agent长程记忆衰减与工具调用断裂风险,支撑VSCode插
本案例基于华为云智果(AgentArts)智能体平台,结合MaaS平台大模型与知识库能力,构建昇腾C算子开发专业领域知识助手。
本课程将介绍在DeepSeek-V4网络上如何基于TorchTitan-NPU框架攻克超长文本训练瓶颈、实现512K级别长序列的大规模续训练,怎样结合大EP+FSDP以及torch.compile+AutoFuse编译入图方案达成极致训练吞吐性能的实践经验,分享如何帮助昇腾大模型开发者在超长上下文场景下快速开展 CPT/SFT算法验证并实现开箱即优。
适用于分布式或多进程并行通过显式通信完成数据交换OpenMP适用于共享内存并行通过编译指令实现线程级并行在鲲鹏平台上,这两种模型都能稳定运行,并且可以根据应用规模灵活选择。与 MPI 不同,OpenMP 主要用于共享内存并行编程模型简单对现有串行代码侵入性低非常适合单机多核场景在鲲鹏平台上,OpenMP 能够充分利用 CPU 的多核心能力。本文围绕鲲鹏平台的 HPC 应用实践,介绍了并行计算技术栈
过去,MindStudio提供了性能调优工具msProf,集群分析工具msprof-analyze,精度调优工具msProbe,内存调优工具msMemScope,可视化工具msInsight等一系列工具来帮助客户提高算子性能、设备性能、集群性能,同时MindStudio也沉淀了计算(算子调优),通信(快慢卡),下发(Host下发慢),IO瓶颈以及服务化等一系列的调试调优方法论。更多内置 Tools
B站预约链接:点击预约
本课程将介绍在DeepSeek V4网络上如何实现网络精度无损的低bit量化,怎样结合昇腾软硬件特性达成网络极致部署性能的实践经验,分享如何在实际量化模型部署中平衡精度损失与推理加速。
欢迎小伙伴们预约观看,参与互动答题赢CANN周边礼品,不容错过,我们直播间见~
ONNX是一种通用模型中间表示格式,广泛用于跨框架模型迁移;昇腾AI处理器则依赖专有OM格式实现高性能推理。其转换原理在于通过ATC编译器完成算子映射、精度适配与硬件特性对齐,技术价值体现在可验证的模型兼容性保障与端到端推理性能优化。典型应用场景包括工业质检、智能安防等需在昇腾910B/310P设备上部署YOLO系列模型的边缘AI项目。本文聚焦YOLOv5从PyTorch导出ONNX,再到ATC精
large_N_8192用例的连续虚拟内存地址空间大小中超过256 KB的地方都是存在问题的,其中最后面的地方保留的连续虚拟内存地址空间最大,是导致内存溢出问题最严重的地方。这里我们需要点击超过256 KB的内存块,分析导致内存溢出的具体原因,即这个内存块是在哪一行代码申请的,定位到内存溢出的代码位置。当出现Triton算子内存溢出时,通过日志,我们仅能知道发生了UB overflow,但是具体在
昇腾
——昇腾
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net