logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【昇腾CANN训练营·行业篇】自动驾驶核心:基于Ascend C的Voxelization体素化算子开发

摘要:2025年昇腾CANN训练营第二季推出0基础到进阶的算子开发课程,助力开发者提升技能。本文以3D检测网络中的Voxelization算子为例,详解其核心算法:通过哈希映射将离散点云转换为规则网格,处理动态输入和并发写入问题。重点展示了AscendC实现方案,包括原子操作处理冲突、随机内存访问优化等关键技术,并指出性能瓶颈及优化方向(如点云预排序)。该算子是检验AI芯片编程能力的重要案例,掌握

文章图片
#昇腾
【昇腾CANN训练营·行业篇】自动驾驶核心:基于Ascend C的Voxelization体素化算子开发

摘要:2025年昇腾CANN训练营第二季推出0基础到进阶的算子开发课程,助力开发者提升技能。本文以3D检测网络中的Voxelization算子为例,详解其核心算法:通过哈希映射将离散点云转换为规则网格,处理动态输入和并发写入问题。重点展示了AscendC实现方案,包括原子操作处理冲突、随机内存访问优化等关键技术,并指出性能瓶颈及优化方向(如点云预排序)。该算子是检验AI芯片编程能力的重要案例,掌握

文章图片
#昇腾
【昇腾CANN训练营·行业篇】自动驾驶核心:基于Ascend C的Voxelization体素化算子开发

摘要:2025年昇腾CANN训练营第二季推出0基础到进阶的算子开发课程,助力开发者提升技能。本文以3D检测网络中的Voxelization算子为例,详解其核心算法:通过哈希映射将离散点云转换为规则网格,处理动态输入和并发写入问题。重点展示了AscendC实现方案,包括原子操作处理冲突、随机内存访问优化等关键技术,并指出性能瓶颈及优化方向(如点云预排序)。该算子是检验AI芯片编程能力的重要案例,掌握

文章图片
#昇腾
【昇腾CANN训练营·生态篇】端云一体:Ascend C 算子在鸿蒙系统上的交叉编译与部署

2025年昇腾CANN训练营第二季推出系列课程,助力开发者提升算子开发技能,完成认证可获证书及大奖。文章重点讲解如何实现"一次编写,端侧运行"的交叉编译技术:通过搭建OpenHarmony SDK和昇腾ACL库(ARM版)工具链,配置CMake进行交叉编译生成ARM架构可执行文件,并使用HDC工具部署到鸿蒙设备运行。同时指出端侧开发需注意内存池化、静态Shape等资源约束问题,

文章图片
#昇腾#harmonyos
【昇腾CANN训练营·生态篇】端云一体:Ascend C 算子在鸿蒙系统上的交叉编译与部署

2025年昇腾CANN训练营第二季推出系列课程,助力开发者提升算子开发技能,完成认证可获证书及大奖。文章重点讲解如何实现"一次编写,端侧运行"的交叉编译技术:通过搭建OpenHarmony SDK和昇腾ACL库(ARM版)工具链,配置CMake进行交叉编译生成ARM架构可执行文件,并使用HDC工具部署到鸿蒙设备运行。同时指出端侧开发需注意内存池化、静态Shape等资源约束问题,

文章图片
#昇腾#harmonyos
【昇腾CANN训练营·生态篇】端云一体:Ascend C 算子在鸿蒙系统上的交叉编译与部署

2025年昇腾CANN训练营第二季推出系列课程,助力开发者提升算子开发技能,完成认证可获证书及大奖。文章重点讲解如何实现"一次编写,端侧运行"的交叉编译技术:通过搭建OpenHarmony SDK和昇腾ACL库(ARM版)工具链,配置CMake进行交叉编译生成ARM架构可执行文件,并使用HDC工具部署到鸿蒙设备运行。同时指出端侧开发需注意内存池化、静态Shape等资源约束问题,

文章图片
#昇腾#harmonyos
【昇腾CANN训练营·进阶篇】极致融合:利用C++表达式模板(Expression Templates)实现算子“零开销”级联

摘要:2025年昇腾CANN训练营第二季提供系列课程,帮助开发者提升算子开发技能,完成认证可获奖励。文章重点探讨了深度学习算子融合技术,提出利用C++模板元编程构建惰性求值引擎,通过表达式模板技术实现算子自动融合。详细介绍了TensorWrapper包装类、操作节点定义及简易DSL实现方法,最终利用AscendC指令实现高效计算。该方案将数学逻辑与底层指令解耦,通过模板展开优化计算图,显著提升开发

文章图片
#昇腾#c++
【昇腾CANN训练营·进阶篇】极致融合:利用C++表达式模板(Expression Templates)实现算子“零开销”级联

摘要:2025年昇腾CANN训练营第二季提供系列课程,帮助开发者提升算子开发技能,完成认证可获奖励。文章重点探讨了深度学习算子融合技术,提出利用C++模板元编程构建惰性求值引擎,通过表达式模板技术实现算子自动融合。详细介绍了TensorWrapper包装类、操作节点定义及简易DSL实现方法,最终利用AscendC指令实现高效计算。该方案将数学逻辑与底层指令解耦,通过模板展开优化计算图,显著提升开发

文章图片
#昇腾#c++
【昇腾CANN训练营·进阶篇】上帝的骰子:在 AI Core 上实现高性能随机数生成与 Dropout 算子

摘要:2025年昇腾CANN训练营第二季提供从0基础到进阶的算子开发课程,完成认证可获得证书及奖品。本文重点解析AI芯片中随机数生成的工程难题,介绍Philox算法如何在确定性硬件上实现并行伪随机数生成,并以Dropout算子开发为例,展示AscendC实现过程,包括核心逻辑、代码实现及性能优化技巧。文章最后预告下期将探讨零代码算子融合技术。(149字)

#昇腾#人工智能
【昇腾CANN训练营·进阶篇】上帝的骰子:在 AI Core 上实现高性能随机数生成与 Dropout 算子

摘要:2025年昇腾CANN训练营第二季提供从0基础到进阶的算子开发课程,完成认证可获得证书及奖品。本文重点解析AI芯片中随机数生成的工程难题,介绍Philox算法如何在确定性硬件上实现并行伪随机数生成,并以Dropout算子开发为例,展示AscendC实现过程,包括核心逻辑、代码实现及性能优化技巧。文章最后预告下期将探讨零代码算子融合技术。(149字)

#昇腾#人工智能
    共 68 条
  • 1
  • 2
  • 3
  • 7
  • 请选择