logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GE图引擎深度解析:CANN的计算图编译与执行核心

GE图引擎深度解析:CANN的计算图编译与执行核心

CANN数据类型与内存管理入门

写完第一个算子后,我发现自己对数据类型和内存管理还是一知半解。什么时候用FP16,什么时候用FP32?Global Memory和Unified Buffer到底有什么区别?内存对齐是怎么回事?这些问题直到我踩了几次坑,才慢慢理解。让我们先看看CANN的整体架构:从官方架构图可以看到,CANN的异构计算架构包含多层内存层次和不同的数据类型支持。今天就来系统梳理CANN的数据类型和内存管理,这是写高

文章图片
#harmonyos
搭建第一个CANN开发环境:避坑指南

说到环境搭建,我第一次装CANN的时候真的是踩了一堆坑。从下载安装包找了半天,到装完发现版本不对,再到环境变量配错导致找不到库文件…整整折腾了两天才搞定。后来在训练营老师的指导下,我重新梳理了整个流程,现在10分钟就能装好。今天就把这些经验分享给大家,让你们少走弯路。

文章图片
#harmonyos#centos
CANN算子开发核心概念全解析

学了Ascend C的语法,能看懂代码了,但写起算子来还是云里雾里。什么是Tiling?为什么要分块处理?Kernel函数到底是怎么运行的?这些问题困扰了我好几天。直到在训练营听老师系统讲解,并且自己动手实践了几个算子,才真正理解这些概念。今天就把这些核心概念梳理清楚,相信能帮大家少走不少弯路。算子(Operator)就是神经网络中的一个计算单元。

文章图片
CANN是什么?从零开始理解昇腾AI计算架构

说实话,刚开始接触CANN的时候,我一脸懵。什么是CANN?和CUDA有啥区别?为啥要学这个?这些问题在我脑子里转了好几天。后来跟着训练营一步步学下来,慢慢理解了CANN的价值和定位。今天我把这些学习心得整理出来,希望能帮到和我一样从零开始的同学。这是我们训练营的核心内容。当现有算子库不能满足需求时,可以用Ascend C开发自己的算子。某个特殊的激活函数定制化的attention机制特定领域的数

文章图片
#人工智能#架构
Ascend C编程语言快速上手

本文介绍了华为昇腾NPU专用编程语言Ascend C的核心概念。Ascend C基于C++14标准,添加了NPU专用API和向量化扩展,主要用于高性能算子开发。

文章图片
CANN数据类型与内存管理入门

写完第一个算子后,我发现自己对数据类型和内存管理还是一知半解。什么时候用FP16,什么时候用FP32?Global Memory和Unified Buffer到底有什么区别?内存对齐是怎么回事?这些问题直到我踩了几次坑,才慢慢理解。让我们先看看CANN的整体架构:从官方架构图可以看到,CANN的异构计算架构包含多层内存层次和不同的数据类型支持。今天就来系统梳理CANN的数据类型和内存管理,这是写高

文章图片
#harmonyos
到底了