logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

optimized_transducer算子任务开发性能调优

聚焦社区任务中optimized_transducer算子,分享其核心开发思路与性能调优技巧,深入分享如何提升算子并行度、突破性能瓶颈,拆解高任务值算子的开发逻辑与实操要点,助力学习者快速掌握算子开发核心能力。

文章图片
#CANN#CANN开源#昇腾
【码力全开特辑】Triton Ascend代码架构及功能扩展

本课程基于样例详解Triton算子的编译流程,以及Triton Ascend如何通过编译优化在昇腾硬件上高效运行。

文章图片
#CANN#CANN开源
【码力全开特辑】详解面向昇腾的Triton算子调试和性能优化

介绍Triton算子调试方法与性能检测工具,讲解高性能算子设计逻辑与具体实现流程。

文章图片
#CANN
从基础理论到实践,全流程掌握面向昇腾的Triton算子开发

介绍Triton整体架构与编程基础知识,学习Triton算子开发基本模式和常用接口,以及面向昇腾架构开发与迁移的关键点

文章图片
【开发者说】SignBitsUnpack算子社区任务开发指南

系统讲解如何参与社区任务的全流程,并结合实际案例,深入解析 SignBitsUnpack 算子的开发过程。通过本课程,了解从认领任务到提交贡献的完整参与路径,掌握该算子的设计思路与实现细节,为后续参与社区开发打下扎实基础

文章图片
PyPTO典型算子案例剖析

真实算子案例拆解!从网络真实算子开发到新硬件特性使能,手把手带你搞定典型场景,学完就能直接上手项目实践!

文章图片
【码力全开特辑】PyPTO算子性能调优

性能瓶颈快速破解!分享真实调优经验+计算流优化实践,教你用PyPTO轻松榨干硬件性能,算子速度直接起飞~

文章图片
Ascend C算子编程和C++基础学习成果分享

作为一个算子开发小白,关于Ascend C的学习其实磕磕绊绊,有很多地方也反复学习实践了很久,以下为一些学习内容总结。以上为学习Ascend C算子开发基础内容,另外掌握Ascend C算子编程和C++基础还需要搭配相关直播课讲解内容。第二步:MobaXterm软件ssh远程连接、linux基础命令和vim基本使用。第三步:vscode安装和远程开发。

文章图片
#学习
CANN开源贡献指南

社区任务参与·开源仓实践·算子成果分享

文章图片
Ascend C算子开发基础知识

Ascend C算子开发基础知识

文章图片
    共 16 条
  • 1
  • 2
  • 请选择