logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【昇腾CANN】cann-learning-hub:开源社区的“技术大本营“

【昇腾CANN】cann-learning-hub:开源社区的"技术大本营"

文章图片
#开源
【昇腾CANN】cann-learning-hub:开源社区的“技术大本营“

【昇腾CANN】cann-learning-hub:开源社区的"技术大本营"

文章图片
#开源
【昇腾CANN】cann-learning-hub:开源社区的“技术大本营“

【昇腾CANN】cann-learning-hub:开源社区的"技术大本营"

文章图片
#开源
【昇腾CANN】ops-transformer算子库深度解析:让大模型训练快起来

【昇腾CANN】ops-transformer算子库深度解析:让大模型训练快起来

文章图片
#transformer#深度学习#人工智能
【昇腾CANN】ops-transformer算子库深度解析:让大模型训练快起来

【昇腾CANN】ops-transformer算子库深度解析:让大模型训练快起来

文章图片
#transformer#深度学习#人工智能
【昇腾CANN】ops-transformer算子库深度解析:让大模型训练快起来

【昇腾CANN】ops-transformer算子库深度解析:让大模型训练快起来

文章图片
#transformer#深度学习#人工智能
Ascend C 算子开发终极实战:实现支持动态分组的 `GroupNorm` 自定义算子(含反向传播与性能调优)

Ascend C 算子开发终极实战:实现支持动态分组的 `GroupNorm` 自定义算子(含反向传播与性能调优)

文章图片
#c语言#开发语言
[特殊字符][特殊字符] 深度解析 Ascend C 算子开发:基于达芬奇架构的高性能张量计算编程范式(附 Tiling 优化、UB Cache 利用与性能火焰图)

🔥🔥 深度解析 Ascend C 算子开发:基于达芬奇架构的高性能张量计算编程范式(附 Tiling 优化、UB Cache 利用与性能火焰图)

文章图片
#c语言#架构#开发语言
# Ascend C 算子开发进阶实战:实现支持任意形状广播的 `Add` 算子(含 Tiling 分块与性能优化)

Ascend C 算子开发进阶实战:实现支持任意形状广播的 `Add` 算子(含 Tiling 分块与性能优化)

文章图片
#c语言#性能优化#开发语言
【昇腾算力巅峰】深度解构 Ascend C 算子开发:从微架构指令调度到生产级融合算子优化(附 Tiling 自动调优、UB Cache 建模与全栈性能火焰图)

【昇腾算力巅峰】深度解构 Ascend C 算子开发:从微架构指令调度到生产级融合算子优化(附 Tiling 自动调优、UB Cache 建模与全栈性能火焰图)

文章图片
#c语言#架构#人工智能
    共 24 条
  • 1
  • 2
  • 3
  • 请选择