logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Tensor操作基础:理解张量在NPU中的运作

在深度学习中,Tensor(张量)是最核心的数据结构。理解Tensor在NPU中如何存储、如何操作,是写好CANN算子的关键。昇腾CANN训练营提供系统化的Tensor操作课程,从基础到进阶,手把手教你掌握昇腾NPU上的Tensor编程技巧!我刚开始时,总搞不清楚Tensor的shape、stride、layout这些概念。后来通过大量实践,才真正理解Tensor在内存中的排布方式。今天就系统讲解

文章图片
#harmonyos
第一个Hello World算子开发实战

这篇文章介绍了如何在昇腾平台上开发第一个"Hello World"级别的Add算子

文章图片
#后端
CANN数据类型与内存管理入门

写完第一个算子后,我发现自己对数据类型和内存管理还是一知半解。什么时候用FP16,什么时候用FP32?Global Memory和Unified Buffer到底有什么区别?内存对齐是怎么回事?这些问题直到我踩了几次坑,才慢慢理解。让我们先看看CANN的整体架构:从官方架构图可以看到,CANN的异构计算架构包含多层内存层次和不同的数据类型支持。今天就来系统梳理CANN的数据类型和内存管理,这是写高

文章图片
#harmonyos
开发工具链介绍:从编译到调试

本文介绍了昇腾CANN训练营提供的AI开发工具链,重点讲解了编译器、算子分析工具和性能分析工具的使用方法,帮助开发者提升算子开发效率。

文章图片
#mfc#c++
到底了