logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CANN训练营 学习(day2)Ascend C编程语言解析:从入门到高性能算子开发

摘要:AscendC是CANN专为昇腾AI处理器设计的算子开发语言,兼容C/C++标准,提供多层接口抽象和自动并行计算。其核心是核函数编程模型,采用"搬入-计算-搬出"三级流水线,支持多核并行。AscendC提供基础API、高阶API和硬件加速API,并基于Global/Local Tensor实现高效内存管理。开发流程包括环境准备、核函数实现和多核优化,配备CPU孪生调试工具

文章图片
#开发语言#人工智能
CANN训练营 学习(day1)AI编程利器:AscendC全面解析

本文系统介绍了华为昇腾AI处理器的专用编程语言AscendC。该语言基于C++扩展,通过专用API实现对AI芯片的高效开发。文章详细解析了AscendC的核心特性:首先阐述了其语法扩展(函数执行空间限定符、地址空间限定符和核函数调用机制);其次分析了API体系结构(基础API与高阶API);然后深入讲解了核函数开发方法(三级流水线编程范式和多核并行数据切分);最后通过Add算子的完整开发案例,展示

文章图片
#人工智能#云计算
CANN训练营 学习(day3)AI处理器开发环境构建与实践指南

摘要:本文详细介绍了昇腾AI处理器开发环境的完整构建流程,包含环境架构设计、系统准备、CANN安装配置、环境验证及故障排查等关键环节。提供了可直接使用的自动化脚本和代码示例,包括硬件检测、系统优化、Python环境配置、CANN安装及示例算子测试等内容。特别涵盖了分设环境部署方案和CI/CD集成指南,为开发者搭建稳定可靠的AI开发环境提供了全面指导。通过遵循本文流程,开发者能够快速构建昇腾AI开发

文章图片
#人工智能#AI
CANN训练营 学习(day4)Ascend C算子开发全流程深度解析:从环境准备到异构计算部署

本文系统介绍了AscendC算子开发的全流程,涵盖开发环境配置、算子分析与设计、核函数实现、多核并行优化等核心内容。重点讲解了三级流水线设计、数据切分策略等关键技术,以及异构计算环境下的验证体系。通过Add算子实例,详细阐述了从数学表达式到高性能实现的完整方法论,包括内存管理、接口选择、性能优化等实践要点。文章还探讨了高级优化技术、实际应用场景及未来发展方向,为开发者提供了昇腾AI处理器编程的全面

文章图片
#网络#人工智能#服务器 +1
CANN训练营 学习(day12)昇腾AI处理器性能加速的利器:TIK实战配置与进阶开发指南

在AI应用从“能用”迈向“好用”的今天,算力已成为核心生产力。华为昇腾AI处理器以其卓越的能效比和计算密度,正在成为AI基础设施的重要选择。然而,要充分压榨其硬件潜能,开发者面临一个经典困境:使用如TensorFlow、PyTorch等高级框架,开发便捷但性能受限于框架抽象层;直接使用底层汇编或CCE(Compute Engine for CANN),性能极致但开发门槛高、周期长。TIK(Tens

文章图片
#人工智能
CANN具身智能优化实战教程:cann-recipes-embodied-intelligence详解

CANN平台推出"cann-recipes-embodied-intelligence"项目,专注具身智能领域优化。该项目提供视觉感知、运动规划和强化学习三大核心模块的硬件加速方案,包含YOLOv5优化、轨迹规划加速和PPO训练优化等功能。通过自适应图优化、算子融合和混合精度等技术,在机器人视觉导航等场景中实现3-5倍性能提升。项目提供完整的环境配置指南、性能调优建议和基准测试

文章图片
CANN推理优化实战:cann-recipes-infer项目详解

摘要:CANN-Recipes-Infer是AI平台的开源推理加速工具集,针对大语言模型和多模态模型提供四大核心优化模块:LLM推理优化、多模态加速、显存优化策略和性能分析工具。项目通过三阶段优化流程(基础实现→策略应用→高级配置)提升推理性能,支持长文本处理、实时交互和边缘部署等典型场景。提供从优化路径选择到性能调优的完整指南,并支持自定义优化器开发。该项目持续演进,致力于降低平台上的模型优化门

文章图片
CANN并行编程深度解析:PyPTO编程范式完整指南

本文系统介绍了CANN架构中的PyPTO(Parallel Tensor/Tile Operation)编程模型,这是面向Ascend AI处理器的高效并行编程范式。PyPTO通过Tile数据抽象和并行执行模型,解决了传统张量计算中的数据局部性差、并行粒度粗等问题。文章详细讲解了PyPTO的核心概念、编程接口、优化技巧及实际应用,包括矩阵运算优化、CNN加速、注意力机制实现等。特别强调了内存管理策

文章图片
#昇腾
CANN ops-cv算子库:高效实现NPU加速的图像处理与目标检测

摘要:CANN ops-cv是专为计算机视觉任务设计的NPU加速算子库,提供高性能图像处理和目标检测算子。其核心优势包括:NPU原生加速、丰富的视觉算子集合、与主流深度学习框架无缝集成及跨平台一致性。典型应用场景涵盖深度学习推理预处理、目标检测后处理加速和传统视觉算法NPU加速。该库通过优化算子实现显著提升性能,并提供快速入门示例和优化建议,为计算机视觉任务提供高效的NPU加速解决方案。

文章图片
#图像处理#目标检测#人工智能
CANN训练优化库cann-recipes-train实战教程

cann-recipes-train是华为CANN平台推出的模型训练优化实践库,专门针对大语言模型(LLM)和多模态模型的训练场景,提供基于昇腾AI处理器的完整优化方案。该项目通过实际可运行的代码示例,展示了如何充分利用CANN平台的硬件特性,显著提升训练效率。

文章图片
    共 89 条
  • 1
  • 2
  • 3
  • 9
  • 请选择