logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于CANN开源算子库的二次开发实践:CrossEntropyLoss与Zloss融合

面对这一挑战,客户参考了昇腾CANN开源算子源码仓ops-nn中高性能CrossEntropyLoss算子的实现,该算子已经具备高性能的CE Loss交叉熵损失函数计算能力,客户在此基础上,融入了ZLoss和lseForZLoss计算,分别用于计算辅助损失ZLoss和ZLoss场景下输出给反向传播的值。这两个损失函数的原始实现存在显著的性能瓶颈——它们的计算由一系列串行的小Vector算子构成,导

#CANN
Ascend C算子性能优化实用技巧04——Tiling优化

什么是Tiling简介Ascend C是CANN针对算子开发场景推出的编程语言,原生支持C和C++标准规范,兼具开发效率和运行性能。使用Ascend C,开发者可以基于昇腾AI硬件,高效的实现自定义的创新算法。目前已经有越来越多的开发者使用Ascend C,我们将通过几期“Ascend C算子性能优化”专题分享,围绕开发者最为关心的算子性能优化环节,介绍Ascend C算子常用的优化技巧,帮助开发

文章图片
#c语言#性能优化#开发语言
一文教你如何调用Ascend C算子

介绍基于Ascend C算子编程语言完成自定义算子的开发和部署后,如何调用自定义算子验证算子功能。

文章图片
#人工智能
将TensorFlow模型快速迁移到昇腾平台

本文介绍将TensorFlow网络模型迁移到昇腾AI平台,并执行训练的全流程。然后以TensorFlow 1.15训练脚本为例,详细介绍了自动迁移、手工迁移以及模型训练的操作步骤。

文章图片
基于昇腾计算语言AscendCL开发AI推理应用

本文介绍了昇腾计算语言AscendCL的基本概念,并以示例代码的形式介绍了如何基于AscendCL开发AI推理应用,最后配以实际的操作演示说明如何编译运行应用。

文章图片
香橙派AIpro外设接口样例大全(附源码)

包括两个HDMI输出、GPIO接口、Type-C电源接口、支持SATA/NVMe SSD 2280的M.2插槽、TF插槽、千兆网口、两个USB3.0、一个USB Type-C 3.0、一个Micro USB、两个MIPI摄像头、一个MIPI屏等,预留电池接口。4. 重启后再次进入HDMI0测试程序所在路径,然后运行test.sh脚本就会播放一张图片到HDMI 显示器(默认显示 10 秒),并且同时

文章图片
技术干货 | HCCL集合通信常见问题定位思路

介绍集合通信运行的三个关键阶段,并介绍了这三个阶段对应的常见问题及定位思路。

文章图片
#人工智能
了解AscendCL数据预处理的两种方式:AIPP和DVPP

本文介绍了昇腾CANN提供的两种数据预处理的方式:DVPP和AIPP,介绍了两者的功能、差别及联系,并以具体代码示例介绍了如何使用DVPP和AIPP的功能。

文章图片
    共 182 条
  • 1
  • 2
  • 3
  • 19
  • 请选择