
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
承接上篇《Ascend C 算子开发:零基础实战指南》,本文深入探讨如何通过并行编程技术释放昇腾芯片的强大算力。

直击传统算子开发高门槛痛点,以 “技术解析 + 实战路径” 双主线,揭秘 Ascend C 如何通过多层接口抽象、自动并行等核心技术降低开发难度,结合 CANN 训练营 2025 第二季专属资源,为 0 基础开发者提供可落地的入门方案,快速开启昇腾算力开发之旅。
本文提供了ResNet在昇腾平台上C++推理的完整实现方案,涵盖从原理到代码的各个环节,为深度学习模型部署提供实用参考。025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。报名链接:htt
CANN(Compute Architecture for Neural Networks)是华为针对AI场景推出的异构计算架构,在昇腾AI生态中扮演着承上启下的关键角色。简单来说,CANN是对标英伟达CUDA的软硬件协同计算栈,包含运行时、编译器、算子库与SDK,用于将主流AI框架模型编译和加速到昇腾硬件上。下图展示了 CANN 在昇腾 AI 生态中的位置,以及其与上层 AI 框架和底层硬件的关
承接上篇《Ascend C 算子开发:零基础实战指南》,本文深入探讨如何通过并行编程技术释放昇腾芯片的强大算力。

本文提供了ResNet在昇腾平台上C++推理的完整实现方案,涵盖从原理到代码的各个环节,为深度学习模型部署提供实用参考。025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。报名链接:htt
摘要:本文详细介绍了YOLOv8目标检测模型在昇腾Atlas系列设备的端到端部署方案。重点阐述了从PyTorch模型到ONNX再到昇腾专属OM格式的转换流程,包括关键参数配置和常见问题解决方法。同时提供了基于AscendC++的推理引擎开发指南,涵盖模型加载、预处理、推理执行和后处理等核心环节。此外,文章还介绍了使用AMCT工具进行8bit量化优化的方法,量化后模型体积减少75%,推理速度提升40
将多个连续的计算操作合并为单个计算单元。还是以一次性数据加载:将输入数据和所有权重参数加载到芯片高速缓存连续计算:在缓存中依次执行矩阵乘、偏置加、GELU激活一次性结果写回:仅将最终结果写回主内存这种"一气呵成"的计算方式,消除了中间结果的内存读写开销,实现了显著的性能提升。华为昇腾CANN的融合算子技术,通过减少内存访问降低调度开销和提高缓存利用率,为大语言模型推理带来了显著的性能提升。这项技术
CANN(Compute Architecture for Neural Networks)是华为针对AI场景推出的异构计算架构,在昇腾AI生态中扮演着承上启下的关键角色。简单来说,CANN是对标英伟达CUDA的软硬件协同计算栈,包含运行时、编译器、算子库与SDK,用于将主流AI框架模型编译和加速到昇腾硬件上。下图展示了 CANN 在昇腾 AI 生态中的位置,以及其与上层 AI 框架和底层硬件的关
承接上篇《Ascend C 算子开发:零基础实战指南》,本文深入探讨如何通过并行编程技术释放昇腾芯片的强大算力。








