logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CANN自定义算子开发指南:扩展AI模型能力的底层利器

CANN自定义算子开发指南:扩展AI模型能力的底层利器

文章图片
#人工智能
CANN自定义算子开发指南:扩展AI模型能力的底层利器

CANN自定义算子开发指南:扩展AI模型能力的底层利器

文章图片
#人工智能
【昇腾算力巅峰】深度解构 Ascend C 算子开发:从微架构指令调度到生产级融合算子优化(附 Tiling 自动调优、UB Cache 建模与全栈性能火焰图)

【昇腾算力巅峰】深度解构 Ascend C 算子开发:从微架构指令调度到生产级融合算子优化(附 Tiling 自动调优、UB Cache 建模与全栈性能火焰图)

文章图片
#c语言#架构#人工智能
# Ascend C 算子开发进阶实战:实现支持任意形状广播的 `Add` 算子(含 Tiling 分块与性能优化)

Ascend C 算子开发进阶实战:实现支持任意形状广播的 `Add` 算子(含 Tiling 分块与性能优化)

文章图片
#c语言#性能优化#开发语言
【昇腾算力巅峰】深度解构 Ascend C 算子开发:从微架构指令调度到生产级融合算子优化(附 Tiling 自动调优、UB Cache 建模与全栈性能火焰图)

【昇腾算力巅峰】深度解构 Ascend C 算子开发:从微架构指令调度到生产级融合算子优化(附 Tiling 自动调优、UB Cache 建模与全栈性能火焰图)

文章图片
#c语言#架构#人工智能
【昇腾算力巅峰】深度解构 Ascend C 算子开发:从微架构指令调度到生产级融合算子优化(附 Tiling 自动调优、UB Cache 建模与全栈性能火焰图)

【昇腾算力巅峰】深度解构 Ascend C 算子开发:从微架构指令调度到生产级融合算子优化(附 Tiling 自动调优、UB Cache 建模与全栈性能火焰图)

文章图片
#c语言#架构#人工智能
到底了