logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CANN:面向AI计算的异构架构软件栈详解

CANN作为面向AI计算的异构软件栈,通过软硬协同设计,在性能、易用性与生态兼容性之间取得了良好平衡。无论是科研探索还是工业部署,它都为开发者提供了一条高效、可靠的AI加速路径。随着工具链的不断完善与社区的壮大,CANN有望成为下一代AI基础设施的重要组成部分。

文章图片
#人工智能#架构
CANN 自动混合精度训练指南

训练大模型需要海量算力,而自动混合精度(AMP)是提升效率的关键。CANN 原生支持 AMP,可在几乎不损精度的前提下,显著加速训练并降低显存占用。

文章图片
#人工智能
CANN 架构入门:AI 加速的全栈软件基石

CANN 并非单一工具,而是一套从底层驱动到高层 API 的完整软件体系。它专为 AI 计算设计,支持训练与推理,兼容主流框架,并通过软硬协同实现极致效率。其核心优势在于分层解耦 + 全栈优化:上层开发者无需关心硬件细节,底层则针对特定架构深度调优。当内置算子不足时,可通过 TBE(Tensor Boost Engine)编写自定义算子。例如一个简单的平方算子:python编译后即可在模型中调用,

文章图片
#人工智能#架构
CANN 推理实战:从 ONNX 到高性能部署

将训练好的模型高效部署到边缘或云端,是 AI 落地的关键一步。CANN(Compute Architecture for Neural Networks)提供端到端的推理解决方案,支持模型转换、量化、多流并发与容器化部署。

文章图片
#人工智能
到底了