
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
算子融合(Operator Fusion)是将多个独立算子的计算逻辑整合为单个复合算子的优化技术,核心目标是消除冗余数据搬运、提升计算并行度、降低硬件调度开销。减少数据迁移:避免中间结果在全局内存(GM)与片上缓存(UB/L1)间的重复读写,将 “多算子串行的多次 GM 访问” 压缩为 “单算子的单次 GM 访问”;提升硬件利用率:让矩阵计算核(AIC)、向量计算核(AIV)、存储转换引擎(MTE

获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。Ascend C 是昇腾 CANN 生态的核心算子开发语言,原生兼容 C/C++ 标准,通过硬件抽象层屏蔽不同昇腾 AI 处理器差异,让开发者聚焦算法优化而非底层硬件细节。,多个计算单元执行相同代码但处理不同数据子集,配合 “流水任务(Stage)+ 张量(Tensor)+ 队列(Queue)

2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。报名链接:https://www.hiascend.com/developer/activities/cann20252。核心功能:动态分块、硬件资源适配,支持 MatMul/Conv2d 等多算子类型。核心功能:UB/L1/GM 内存动态

2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。报名链接:https://www.hiascend.com/developer/activities/cann20252。输出关键数据

动态形状(Dynamic Shape)算子是指输入 / 输出张量的维度大小(如 N、C、H、W)在运行时可动态变化,而非编译期固定的算子。动态形状算子的开发遵循 “原型定义→Tiling 实现→核函数开发→编译验证” 的四步流程,以下以动态矩阵乘算子(DynamicMatMul)为例,详细讲解每一步的实现逻辑和关键代码。核函数是算子的执行核心,需基于 TilingData 的动态参数,实现数据搬运

2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。报名链接:https://www.hiascend.com/developer/activities/cann20252。核心功能:动态分块、硬件资源适配,支持 MatMul/Conv2d 等多算子类型。核心功能:UB/L1/GM 内存动态

动态形状(Dynamic Shape)算子是指输入 / 输出张量的维度大小(如 N、C、H、W)在运行时可动态变化,而非编译期固定的算子。动态形状算子的开发遵循 “原型定义→Tiling 实现→核函数开发→编译验证” 的四步流程,以下以动态矩阵乘算子(DynamicMatMul)为例,详细讲解每一步的实现逻辑和关键代码。核函数是算子的执行核心,需基于 TilingData 的动态参数,实现数据搬运

算子融合(Operator Fusion)是将多个独立算子的计算逻辑整合为单个复合算子的优化技术,核心目标是消除冗余数据搬运、提升计算并行度、降低硬件调度开销。减少数据迁移:避免中间结果在全局内存(GM)与片上缓存(UB/L1)间的重复读写,将 “多算子串行的多次 GM 访问” 压缩为 “单算子的单次 GM 访问”;提升硬件利用率:让矩阵计算核(AIC)、向量计算核(AIV)、存储转换引擎(MTE

获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。Ascend C 是昇腾 CANN 生态的核心算子开发语言,原生兼容 C/C++ 标准,通过硬件抽象层屏蔽不同昇腾 AI 处理器差异,让开发者聚焦算法优化而非底层硬件细节。,多个计算单元执行相同代码但处理不同数据子集,配合 “流水任务(Stage)+ 张量(Tensor)+ 队列(Queue)

2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。报名链接:https://www.hiascend.com/developer/activities/cann20252。输出关键数据








