logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

开发工具链介绍:从编译到调试

本文介绍了昇腾CANN训练营提供的AI开发工具链,重点讲解了编译器、算子分析工具和性能分析工具的使用方法,帮助开发者提升算子开发效率。

文章图片
#mfc#c++
CANN数据类型与内存管理入门

写完第一个算子后,我发现自己对数据类型和内存管理还是一知半解。什么时候用FP16,什么时候用FP32?Global Memory和Unified Buffer到底有什么区别?内存对齐是怎么回事?这些问题直到我踩了几次坑,才慢慢理解。让我们先看看CANN的整体架构:从官方架构图可以看到,CANN的异构计算架构包含多层内存层次和不同的数据类型支持。今天就来系统梳理CANN的数据类型和内存管理,这是写高

文章图片
#harmonyos
CANN是什么?从零开始理解昇腾AI计算架构

说实话,刚开始接触CANN的时候,我一脸懵。什么是CANN?和CUDA有啥区别?为啥要学这个?这些问题在我脑子里转了好几天。后来跟着训练营一步步学下来,慢慢理解了CANN的价值和定位。今天我把这些学习心得整理出来,希望能帮到和我一样从零开始的同学。这是我们训练营的核心内容。当现有算子库不能满足需求时,可以用Ascend C开发自己的算子。某个特殊的激活函数定制化的attention机制特定领域的数

文章图片
#人工智能#架构
CANN算子开发核心概念全解析

学了Ascend C的语法,能看懂代码了,但写起算子来还是云里雾里。什么是Tiling?为什么要分块处理?Kernel函数到底是怎么运行的?这些问题困扰了我好几天。直到在训练营听老师系统讲解,并且自己动手实践了几个算子,才真正理解这些概念。今天就把这些核心概念梳理清楚,相信能帮大家少走不少弯路。算子(Operator)就是神经网络中的一个计算单元。

文章图片
Tensor操作基础:理解张量在NPU中的运作

在深度学习中,Tensor(张量)是最核心的数据结构。理解Tensor在NPU中如何存储、如何操作,是写好CANN算子的关键。昇腾CANN训练营提供系统化的Tensor操作课程,从基础到进阶,手把手教你掌握昇腾NPU上的Tensor编程技巧!我刚开始时,总搞不清楚Tensor的shape、stride、layout这些概念。后来通过大量实践,才真正理解Tensor在内存中的排布方式。今天就系统讲解

文章图片
#harmonyos
Ascend C编程语言快速上手

本文介绍了华为昇腾NPU专用编程语言Ascend C的核心概念。Ascend C基于C++14标准,添加了NPU专用API和向量化扩展,主要用于高性能算子开发。

文章图片
搭建第一个CANN开发环境:避坑指南

说到环境搭建,我第一次装CANN的时候真的是踩了一堆坑。从下载安装包找了半天,到装完发现版本不对,再到环境变量配错导致找不到库文件…整整折腾了两天才搞定。后来在训练营老师的指导下,我重新梳理了整个流程,现在10分钟就能装好。今天就把这些经验分享给大家,让你们少走弯路。

文章图片
#harmonyos#centos
Ascend C编程语言快速上手

本文介绍了华为昇腾NPU专用编程语言Ascend C的核心概念。Ascend C基于C++14标准,添加了NPU专用API和向量化扩展,主要用于高性能算子开发。

文章图片
CANN算子开发核心概念全解析

学了Ascend C的语法,能看懂代码了,但写起算子来还是云里雾里。什么是Tiling?为什么要分块处理?Kernel函数到底是怎么运行的?这些问题困扰了我好几天。直到在训练营听老师系统讲解,并且自己动手实践了几个算子,才真正理解这些概念。今天就把这些核心概念梳理清楚,相信能帮大家少走不少弯路。算子(Operator)就是神经网络中的一个计算单元。

文章图片
driver驱动层解读:NPU能工作的幕后功臣

说到驱动程序,可能很多人觉得很底层、很神秘。确实,驱动是软件和硬件之间的桥梁,普通开发者很少直接接触。但理解驱动的基本概念,对于深入理解整个系统很有帮助。今天就来聊聊CANN生态中的driver项目。负责NPU硬件的控制和管理是所有上层软件工作的基础普通开发者通常不需要直接接触了解驱动的作用,有助于理解整个系统架构。

    共 18 条
  • 1
  • 2
  • 请选择