
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在深度学习框架中,算子(Operator)是构成计算图的基本单元。opbase是CANN框架中负责算子定义、注册、管理和调度的基础框架库。它提供了一套完整的算子开发基础设施,使开发者能够高效地创建、注册和部署自定义算子。本文将深入剖析opbase的架构设计和核心机制。

计算机视觉是人工智能应用最广泛的领域之一,涵盖图像分类、目标检测、语义分割、视频分析等多种任务。这些任务的基础是高效的图像处理和特征提取算子。CANN的ops-cv库提供了丰富的计算机视觉算子,针对NPU硬件进行了深度优化,能够显著提升视觉应用的性能。

在AI加速器开发中,Vector算子的开发占据了相当大的工作量。传统的Ascend C算子开发需要开发者深入了解硬件架构、手动管理内存层次、编写大量重复代码。CANN开源社区推出的ATVC(Ascend C Templates for Vector Compute)模板库,为Vector算子开发提供了高效的模板化解决方案。

在AI加速器开发中,Vector算子的开发占据了相当大的工作量。传统的Ascend C算子开发需要开发者深入了解硬件架构、手动管理内存层次、编写大量重复代码。CANN开源社区推出的ATVC(Ascend C Templates for Vector Compute)模板库,为Vector算子开发提供了高效的模板化解决方案。

在大规模分布式训练场景中,节点间的高效通信是决定训练性能的关键因素。HCCL(Huawei Collective Communication Library)是CANN生态中的高性能集合通信库,为多机多卡训练提供通信基础设施。本文将深入剖析HCCL的通信算法、拓扑优化策略以及在超大规模集群中的最佳实践。

Transformer架构已成为自然语言处理和计算机视觉领域的主流模型架构。随着GPT、LLaMA等大语言模型的兴起,如何高效地在NPU上部署和推理Transformer模型成为关键挑战。ascend-transformer-boost是CANN生态中专门针对Transformer模型优化的加速库,提供了从算子级别到模型级别的全方位优化方案。

Transformer架构已成为自然语言处理和计算机视觉领域的主流模型架构。随着GPT、LLaMA等大语言模型的兴起,如何高效地在NPU上部署和推理Transformer模型成为关键挑战。ascend-transformer-boost是CANN生态中专门针对Transformer模型优化的加速库,提供了从算子级别到模型级别的全方位优化方案。

随着深度学习模型的规模不断扩大,如何高效地在AI加速器上执行张量计算成为了一个关键挑战。

随着 AIGC 的爆发式发展,数字人技术正从科幻走向现实。本文将带你从零开始,构建一个基于 Web 的实时交互式数字人系统,涵盖数字人驱动、AI 对话、语音交互等核心技术。

随着 AIGC 的爆发式发展,数字人技术正从科幻走向现实。本文将带你从零开始,构建一个基于 Web 的实时交互式数字人系统,涵盖数字人驱动、AI 对话、语音交互等核心技术。








