logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Ascend C算子调试实战:CPU域的2种高效调试方法

因此,在GDB调试时,需设置“跟踪子进程”,才能正确调试每个核的代码逻辑。而CPU域调试是算子开发的“第一站”——它无需依赖NPU硬件,能快速验证算子的逻辑正确性,大幅降低开发成本。对于 LocalTensor 的数值验证,Ascend C提供了 Local::Print() 接口,可直接打印 LocalTensor 的元素数据。当算子出现“逻辑错误”(如循环次数错误、条件判断异常)时,仅靠 pr

文章图片
#学习#算法
Ascend C矩阵编程(高阶API):矩阵乘的核心逻辑与Tiling策略

2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。报名链接:https://www.hiascend.com/developer/activities/cann20252。

文章图片
#学习#矩阵
Ascend C算子性能优化:从搬运、内存到API的3个核心方向

当Ascend C算子实现功能后,性能优化是“让算子跑满”昇腾NPU算力的关键一步。算子性能的瓶颈往往集中在“数据搬运”“内存利用”“API使用”三个维度,这三个维度的优化可使算子性能提升50%-200%。本文将拆解每个优化方向的核心思路、实操方法与案例,帮助开发者系统性掌握Ascend C算子性能优化技巧。Ascend C算子性能优化的终极目标是“最大化硬件资源利用率”,具体包括:计算单元利用率

文章图片
#学习
Ascend C融合算子开发:以Matmul+LeakyRelu为例的全流程

2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。报名链接:https://www.hiascend.com/developer/activities/cann20252。

文章图片
#学习
Ascend C算子开发(高级)全栈学习路线:从调试到性能优化

Ascend C高级开发的学习,是从“能实现算子功能”到“能实现高性能算子”的进阶——调试是基础,矩阵编程是核心,融合算子是手段,性能优化是目标。结合CANN 2025第二季训练营的资源,开发者可通过“理论学习→任务实践→认证验证”的路径,系统性掌握Ascend C高级开发能力。2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,

文章图片
#学习
鸿蒙PC开发实战:基于Electron快速构建Web技术栈桌面应用

随着鸿蒙OS(HarmonyOS)在鸿蒙PC端的全面落地与普及,前端开发者群体面临一个核心诉求:如何将成熟的Web技术栈快速迁移至鸿蒙PC生态,实现高效开发?Electron作为前端开发者最熟悉的跨平台框架,通过融合Chromium渲染引擎与Node.js运行时,早已实现“一套代码多端运行”。而鸿蒙Electron方案的出现,更是打通了Web技术栈与鸿蒙PC的最后一道壁垒——它允许开发者直接复用现

#electron#harmonyos
跨平台开发进阶:Flutter核心技巧与鸿蒙、Electron多端适配实践

本文从Flutter核心开发技巧出发,详细讲解了Widget性能优化、状态管理、网络请求封装等基础实用技巧,后续延伸至与开源鸿蒙、Electron的多端适配方案,涵盖环境配置、原生交互、打包发布全流程,并结合实操代码案例与避坑指南,形成完整的跨平台开发知识体系。Flutter、开源鸿蒙、Electron三者适配场景互补,掌握其核心技巧与适配逻辑,可高效覆盖移动端、全场景设备、桌面端的跨平台开发需求

文章图片
#flutter#harmonyos#electron
Ascend C算子调试实战:CPU域的2种高效调试方法

因此,在GDB调试时,需设置“跟踪子进程”,才能正确调试每个核的代码逻辑。而CPU域调试是算子开发的“第一站”——它无需依赖NPU硬件,能快速验证算子的逻辑正确性,大幅降低开发成本。对于 LocalTensor 的数值验证,Ascend C提供了 Local::Print() 接口,可直接打印 LocalTensor 的元素数据。当算子出现“逻辑错误”(如循环次数错误、条件判断异常)时,仅靠 pr

文章图片
#学习#算法
Ascend C算子开发(高级)全栈学习路线:从调试到性能优化

Ascend C高级开发的学习,是从“能实现算子功能”到“能实现高性能算子”的进阶——调试是基础,矩阵编程是核心,融合算子是手段,性能优化是目标。结合CANN 2025第二季训练营的资源,开发者可通过“理论学习→任务实践→认证验证”的路径,系统性掌握Ascend C高级开发能力。2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,

文章图片
#学习
Ascend C算子性能优化:从搬运、内存到API的3个核心方向

当Ascend C算子实现功能后,性能优化是“让算子跑满”昇腾NPU算力的关键一步。算子性能的瓶颈往往集中在“数据搬运”“内存利用”“API使用”三个维度,这三个维度的优化可使算子性能提升50%-200%。本文将拆解每个优化方向的核心思路、实操方法与案例,帮助开发者系统性掌握Ascend C算子性能优化技巧。Ascend C算子性能优化的终极目标是“最大化硬件资源利用率”,具体包括:计算单元利用率

文章图片
#学习
    共 122 条
  • 1
  • 2
  • 3
  • 13
  • 请选择