logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Ascend C 算子开发实战:从零写一个矩阵乘法

本文介绍了如何使用Ascend C语言在昇腾平台上开发自定义矩阵乘法算子。主要内容包括: 开发环境准备:安装CANN工具包并创建算子工程框架 算子原型定义:通过头文件和实现文件定义算子的输入输出及属性 核心算子实现: 使用GlobalTensor和LocalTensor管理内存 实现基本的矩阵乘法计算流程(GM->UB->计算->GM) 提供优化版本建议(使用Cube Unit加速) 文章详细展示

文章图片
#c语言#矩阵#开发语言
Ascend C 算子开发实战:从零写一个矩阵乘法

本文介绍了如何使用Ascend C语言在昇腾平台上开发自定义矩阵乘法算子。主要内容包括: 开发环境准备:安装CANN工具包并创建算子工程框架 算子原型定义:通过头文件和实现文件定义算子的输入输出及属性 核心算子实现: 使用GlobalTensor和LocalTensor管理内存 实现基本的矩阵乘法计算流程(GM->UB->计算->GM) 提供优化版本建议(使用Cube Unit加速) 文章详细展示

文章图片
#c语言#矩阵#开发语言
模型迁移不再踩坑:msadvisor 实战

摘要:本文介绍了使用昇腾工具msadvisor将PyTorch模型从GPU迁移到NPU的方法。该工具能自动扫描代码中的GPU调用(如.cuda()改为.npu()),覆盖90%的迁移场景,并生成报告提示需手动修改的部分(如apex.amp)。文章以ResNet50为例演示了迁移流程,包括自动替换、手动调整混合精度实现,以及批量迁移整个项目的方法。最后指出迁移后需进行语法检查、功能验证和精度对比,并

文章图片
#安全#性能优化#python +2
模型迁移不再踩坑:msadvisor 实战

摘要:本文介绍了使用昇腾工具msadvisor将PyTorch模型从GPU迁移到NPU的方法。该工具能自动扫描代码中的GPU调用(如.cuda()改为.npu()),覆盖90%的迁移场景,并生成报告提示需手动修改的部分(如apex.amp)。文章以ResNet50为例演示了迁移流程,包括自动替换、手动调整混合精度实现,以及批量迁移整个项目的方法。最后指出迁移后需进行语法检查、功能验证和精度对比,并

文章图片
#安全#性能优化#python +2
模型迁移不再踩坑:msadvisor 实战

摘要:本文介绍了使用昇腾工具msadvisor将PyTorch模型从GPU迁移到NPU的方法。该工具能自动扫描代码中的GPU调用(如.cuda()改为.npu()),覆盖90%的迁移场景,并生成报告提示需手动修改的部分(如apex.amp)。文章以ResNet50为例演示了迁移流程,包括自动替换、手动调整混合精度实现,以及批量迁移整个项目的方法。最后指出迁移后需进行语法检查、功能验证和精度对比,并

文章图片
#安全#性能优化#python +2
TensorFlow 模型迁移到昇腾:tf_adapter 实战

本文介绍了如何将TensorFlow模型迁移到昇腾NPU上运行。通过使用tf_adapter适配层,无需重写模型代码,只需添加少量适配代码即可实现。文章详细说明了环境准备步骤,并以ResNet50为例展示了迁移前后的代码对比和性能数据(NPU比GPU快25%)。同时提供了训练迁移方案、多卡训练示例以及常见问题解决方法(如算子不支持、精度偏差、显存不足等)。最后给出迁移检查清单,帮助开发者验证迁移效

文章图片
#tensorflow#neo4j#人工智能
TensorFlow 模型迁移到昇腾:tf_adapter 实战

本文介绍了如何将TensorFlow模型迁移到昇腾NPU上运行。通过使用tf_adapter适配层,无需重写模型代码,只需添加少量适配代码即可实现。文章详细说明了环境准备步骤,并以ResNet50为例展示了迁移前后的代码对比和性能数据(NPU比GPU快25%)。同时提供了训练迁移方案、多卡训练示例以及常见问题解决方法(如算子不支持、精度偏差、显存不足等)。最后给出迁移检查清单,帮助开发者验证迁移效

文章图片
#tensorflow#neo4j#人工智能
TensorFlow 模型迁移到昇腾:tf_adapter 实战

本文介绍了如何将TensorFlow模型迁移到昇腾NPU上运行。通过使用tf_adapter适配层,无需重写模型代码,只需添加少量适配代码即可实现。文章详细说明了环境准备步骤,并以ResNet50为例展示了迁移前后的代码对比和性能数据(NPU比GPU快25%)。同时提供了训练迁移方案、多卡训练示例以及常见问题解决方法(如算子不支持、精度偏差、显存不足等)。最后给出迁移检查清单,帮助开发者验证迁移效

文章图片
#tensorflow#neo4j#人工智能
CANN 学习路径:从入门到实战

本文系统介绍了昇腾CANN的学习路径,分为入门、进阶和实战三个阶段。入门阶段建议先理解CANN架构并跑通示例程序;进阶阶段重点学习算子融合、内存规划等底层原理;实战阶段推荐模型迁移、算子开发等实际项目。文章提供了官方文档、示例代码等学习资源,并指出避免直接读源码、只学不练等常见误区。强调动手实践和社区互动是掌握CANN的关键,建议通过跑代码、调模型、提issue等方式巩固学习效果。

文章图片
#学习#安全#性能优化 +1
CANN 学习路径:从入门到实战

本文系统介绍了昇腾CANN的学习路径,分为入门、进阶和实战三个阶段。入门阶段建议先理解CANN架构并跑通示例程序;进阶阶段重点学习算子融合、内存规划等底层原理;实战阶段推荐模型迁移、算子开发等实际项目。文章提供了官方文档、示例代码等学习资源,并指出避免直接读源码、只学不练等常见误区。强调动手实践和社区互动是掌握CANN的关键,建议通过跑代码、调模型、提issue等方式巩固学习效果。

文章图片
#学习#安全#性能优化 +1
    共 21 条
  • 1
  • 2
  • 3
  • 请选择