
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
【昇腾CANN】cann-learning-hub:开源社区的“技术大本营“
【昇腾CANN】cann-learning-hub:开源社区的"技术大本营"

【昇腾CANN】cann-learning-hub:开源社区的“技术大本营“
【昇腾CANN】cann-learning-hub:开源社区的"技术大本营"

【昇腾CANN】cann-learning-hub:开源社区的“技术大本营“
【昇腾CANN】cann-learning-hub:开源社区的"技术大本营"

【昇腾CANN】ops-transformer算子库深度解析:让大模型训练快起来
【昇腾CANN】ops-transformer算子库深度解析:让大模型训练快起来

【昇腾CANN】ops-transformer算子库深度解析:让大模型训练快起来
【昇腾CANN】ops-transformer算子库深度解析:让大模型训练快起来

【昇腾CANN】ops-transformer算子库深度解析:让大模型训练快起来
【昇腾CANN】ops-transformer算子库深度解析:让大模型训练快起来

Ascend C 算子开发终极实战:实现支持动态分组的 `GroupNorm` 自定义算子(含反向传播与性能调优)
Ascend C 算子开发终极实战:实现支持动态分组的 `GroupNorm` 自定义算子(含反向传播与性能调优)

[特殊字符][特殊字符] 深度解析 Ascend C 算子开发:基于达芬奇架构的高性能张量计算编程范式(附 Tiling 优化、UB Cache 利用与性能火焰图)
🔥🔥 深度解析 Ascend C 算子开发:基于达芬奇架构的高性能张量计算编程范式(附 Tiling 优化、UB Cache 利用与性能火焰图)

# Ascend C 算子开发进阶实战:实现支持任意形状广播的 `Add` 算子(含 Tiling 分块与性能优化)
Ascend C 算子开发进阶实战:实现支持任意形状广播的 `Add` 算子(含 Tiling 分块与性能优化)

【昇腾算力巅峰】深度解构 Ascend C 算子开发:从微架构指令调度到生产级融合算子优化(附 Tiling 自动调优、UB Cache 建模与全栈性能火焰图)
【昇腾算力巅峰】深度解构 Ascend C 算子开发:从微架构指令调度到生产级融合算子优化(附 Tiling 自动调优、UB Cache 建模与全栈性能火焰图)








