社区云

CANN

华为云开发者联盟来自华为开发者空间

huaweicloud.csdn.net · 2024-08-07 10:20:29

深度解读昇腾CANN小shape算子计算优化技术，进一步减少调度开销

Host调度模式下，GE将模型中算子的执行单元划分为Host CPU执行与Device（昇腾AI处理器）执行两大类。

#深度学习 #CANN

966 

23 
华为云开发者联盟来自华为开发者空间

huaweicloud.csdn.net · 2024-07-15 14:27:00

深度解读昇腾CANN模型下沉技术，提升模型调度性能

如何减少Host Bound模型的Device空闲时间，从而优化模型执行性能显得尤其重要，GE（Graph Engine）图引擎通过图模式的Host调度和模型下沉调度的方式，可提升模型调度性能，缩短模型E2E执行时间。

#人工智能 #机器学习 #深度学习 +1

941 

20 
华为云开发者联盟来自华为开发者空间

huaweicloud.csdn.net · 2024-07-02 09:02:47

深度解读昇腾CANN多流并行技术，提高硬件资源利用率

GE（Graph Engine）图引擎采用多流并行算法，在满足计算图任务内部依赖关系的前提下，支持高效并发执行计算任务，从而大大提高硬件资源利用率和AI计算效率。

#人工智能 #CANN #华为云

1040 

14 
qianbo_insist 来自昇腾AI开发者社区

ascend.csdn.net · 2024-05-25 08:22:29

香橙派华为昇腾CANN架构编译opencv4.9

这块小盒子本身带了一些例子，不过我们最需要的是如何发挥他的关键，就是硬件资源调度，在教育、体育、安防、交通、医疗等领域中，AI检测应用发挥着至关重要的作用，比如在各种安全分析，各种体育训练时的实时人体关键点检测可以精确、实时地捕捉运动员的动作，在安防应用场景中，识别各种异常现象和异常行为或特定姿态，以达到场景安全防控的目的。

#华为 #CANN

1286 

13 
华为云开发者联盟来自华为开发者空间

huaweicloud.csdn.net · 2024-06-12 14:14:23

基于Ascend C的FlashAttention算子性能优化最佳实践

本文针对FlashAttention反向融合算子的性能优化方案展开介绍，并通过优化实现了典型场景4倍左右的性能提升，希望对开发者优化此类基于Ascend C开发的融合算子带来启发。

#c语言 #性能优化 #开发语言 +2

1819 

24 
华为云开发者联盟来自华为开发者空间

huaweicloud.csdn.net · 2024-05-29 11:11:31

一文教你如何调用Ascend C算子

本文重点介绍基于Ascend C算子编程语言完成自定义算子的开发和部署后，如何调用自定义算子验证算子功能。

#人工智能 #算法 #CANN

890 

21 
STRUGGLE_xlf 来自昇腾AI开发者社区

ascend.csdn.net · 2023-04-16 00:11:40

【2023 · CANN训练营第一季】昇腾AI入门课（Pytorch)——第一章学习笔记

昇腾 AI 全栈可以分成四个大部分：1．应用使能层面，此层面通常包含用于部署模型的软硬件，例如 API 、 SDK 、部署平台，模型库等等。2. AI 框架层面，此层面包含用于构建模型的训练框架，例如华为的 MindSpore 、TensorFlow 、 Pytorch 等。3．异构计算架构，偏底层、偏通用的计算框架，用于针对上层 AI 框架的调用进行加速，力求向上支持多种 AI 框架，并在硬件上

#人工智能 #学习 #CANN

2082 

1 

标签介绍

CANN

——CANN

热门标签

关于我们

联系我们（工作时间：8:30-22:00）

400-660-0108 kefu@csdn.net