logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

华为昇腾(Ascend):中国AI算力的破局者与全栈自主生态构建者

然而,长期以来,全球AI芯片市场被英伟达(NVIDIA)的GPU主导,其CUDA生态构筑了极高的技术壁垒。在此背景下,华为昇腾(Ascend)系列AI处理器应运而生。联影医疗基于昇腾开发 AI 辅助诊断系统,可在 10 秒内完成肺结节 CT 影像分析,准确率超 96%,已在 300+ 医院落地。本文将深入剖析昇腾的技术架构、软件栈、开发范式、典型应用,并探讨其在国产替代浪潮中的战略价值。:在千亿参

文章图片
#华为#人工智能
Ascend C 高级实战:从卷积到 Attention,打造极致性能的自定义算子

在上一篇文章中,我们介绍了 Ascend C 的基础编程模型,并实现了 GELU 这类 Element-wise 算子。Attention 计算包含 QK^T、Softmax、PV 三步,其中 Softmax 的 Reduce 操作是瓶颈。✅ 整个 Attention block 在 UB 内完成,仅读取 Q/K/V,仅写回 output。掌握 Ascend C,意味着你不仅能优化推理,还能参与国

文章图片
#c语言#深度学习#人工智能
Ascend C 入门实战:手把手教你开发昇腾自定义算子

在大模型时代,AI 推理对算力、能效和延迟提出了前所未有的要求。华为昇腾(Ascend)系列 AI 处理器凭借其达芬奇架构,在国产 AI 芯片中脱颖而出,广泛应用于智慧城市、金融风控、自动驾驶等领域。然而,要真正“榨干”昇腾 NPU 的性能,仅靠高层框架(如 MindSpore、PyTorch)远远不够。当遇到以下场景时,开发者必须深入到底层:为此,华为推出了 Ascend C —— 一种面向昇腾

文章图片
#c语言#开发语言
华为昇腾(Ascend):中国AI算力的破局者与全栈自主生态构建者

然而,长期以来,全球AI芯片市场被英伟达(NVIDIA)的GPU主导,其CUDA生态构筑了极高的技术壁垒。在此背景下,华为昇腾(Ascend)系列AI处理器应运而生。联影医疗基于昇腾开发 AI 辅助诊断系统,可在 10 秒内完成肺结节 CT 影像分析,准确率超 96%,已在 300+ 医院落地。本文将深入剖析昇腾的技术架构、软件栈、开发范式、典型应用,并探讨其在国产替代浪潮中的战略价值。:在千亿参

文章图片
#华为#人工智能
华为昇腾(Ascend):中国AI算力的破局者与全栈自主生态构建者

然而,长期以来,全球AI芯片市场被英伟达(NVIDIA)的GPU主导,其CUDA生态构筑了极高的技术壁垒。在此背景下,华为昇腾(Ascend)系列AI处理器应运而生。联影医疗基于昇腾开发 AI 辅助诊断系统,可在 10 秒内完成肺结节 CT 影像分析,准确率超 96%,已在 300+ 医院落地。本文将深入剖析昇腾的技术架构、软件栈、开发范式、典型应用,并探讨其在国产替代浪潮中的战略价值。:在千亿参

文章图片
#华为#人工智能
华为昇腾(Ascend):中国AI算力的破局者与全栈自主生态构建者

然而,长期以来,全球AI芯片市场被英伟达(NVIDIA)的GPU主导,其CUDA生态构筑了极高的技术壁垒。在此背景下,华为昇腾(Ascend)系列AI处理器应运而生。联影医疗基于昇腾开发 AI 辅助诊断系统,可在 10 秒内完成肺结节 CT 影像分析,准确率超 96%,已在 300+ 医院落地。本文将深入剖析昇腾的技术架构、软件栈、开发范式、典型应用,并探讨其在国产替代浪潮中的战略价值。:在千亿参

文章图片
#华为#人工智能
Ascend C 高级实战:从卷积到 Attention,打造极致性能的自定义算子

在上一篇文章中,我们介绍了 Ascend C 的基础编程模型,并实现了 GELU 这类 Element-wise 算子。Attention 计算包含 QK^T、Softmax、PV 三步,其中 Softmax 的 Reduce 操作是瓶颈。✅ 整个 Attention block 在 UB 内完成,仅读取 Q/K/V,仅写回 output。掌握 Ascend C,意味着你不仅能优化推理,还能参与国

文章图片
#c语言#深度学习#人工智能
深入 Ascend C:华为昇腾 AI 芯片的高效编程语言全解析

Ascend C 是华为 CANN(Compute Architecture for Neural Networks)软件栈中用于自定义算子开发的核心编程接口。极致性能:直接映射到昇腾芯片的硬件资源(如 Cube 单元、Vector ALU),实现接近理论峰值的计算效率。开发友好:保留 C++ 语法习惯,降低学习曲线;提供丰富的内置函数(Intrinsic)封装底层指令。跨代兼容:支持昇腾 910

文章图片
#c语言#华为#人工智能
深入 Ascend C:华为昇腾 AI 芯片的高效编程语言全解析

Ascend C 是华为 CANN(Compute Architecture for Neural Networks)软件栈中用于自定义算子开发的核心编程接口。极致性能:直接映射到昇腾芯片的硬件资源(如 Cube 单元、Vector ALU),实现接近理论峰值的计算效率。开发友好:保留 C++ 语法习惯,降低学习曲线;提供丰富的内置函数(Intrinsic)封装底层指令。跨代兼容:支持昇腾 910

文章图片
#c语言#华为#人工智能
Ascend C 入门实战:手把手教你开发昇腾自定义算子

在大模型时代,AI 推理对算力、能效和延迟提出了前所未有的要求。华为昇腾(Ascend)系列 AI 处理器凭借其达芬奇架构,在国产 AI 芯片中脱颖而出,广泛应用于智慧城市、金融风控、自动驾驶等领域。然而,要真正“榨干”昇腾 NPU 的性能,仅靠高层框架(如 MindSpore、PyTorch)远远不够。当遇到以下场景时,开发者必须深入到底层:为此,华为推出了 Ascend C —— 一种面向昇腾

文章图片
#c语言#开发语言
    共 12 条
  • 1
  • 2
  • 请选择