passion098 个人主页

@passion098

passion098

2025-11-22 21:17:38 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Ascend C 算子开发实战：从零写一个矩阵乘法

本文介绍了如何使用Ascend C语言在昇腾平台上开发自定义矩阵乘法算子。主要内容包括：开发环境准备：安装CANN工具包并创建算子工程框架算子原型定义：通过头文件和实现文件定义算子的输入输出及属性核心算子实现：使用GlobalTensor和LocalTensor管理内存实现基本的矩阵乘法计算流程（GM->UB->计算->GM）提供优化版本建议（使用Cube Unit加速）文章详细展示

#c语言 #矩阵 #开发语言

Ascend C 算子开发实战：从零写一个矩阵乘法

#c语言 #矩阵 #开发语言

模型迁移不再踩坑：msadvisor 实战

摘要：本文介绍了使用昇腾工具msadvisor将PyTorch模型从GPU迁移到NPU的方法。该工具能自动扫描代码中的GPU调用（如.cuda()改为.npu()），覆盖90%的迁移场景，并生成报告提示需手动修改的部分（如apex.amp）。文章以ResNet50为例演示了迁移流程，包括自动替换、手动调整混合精度实现，以及批量迁移整个项目的方法。最后指出迁移后需进行语法检查、功能验证和精度对比，并

#安全 #性能优化 #python +2

模型迁移不再踩坑：msadvisor 实战

#安全 #性能优化 #python +2

模型迁移不再踩坑：msadvisor 实战

#安全 #性能优化 #python +2

TensorFlow 模型迁移到昇腾：tf_adapter 实战

本文介绍了如何将TensorFlow模型迁移到昇腾NPU上运行。通过使用tf_adapter适配层，无需重写模型代码，只需添加少量适配代码即可实现。文章详细说明了环境准备步骤，并以ResNet50为例展示了迁移前后的代码对比和性能数据（NPU比GPU快25%）。同时提供了训练迁移方案、多卡训练示例以及常见问题解决方法（如算子不支持、精度偏差、显存不足等）。最后给出迁移检查清单，帮助开发者验证迁移效

#tensorflow #neo4j #人工智能

TensorFlow 模型迁移到昇腾：tf_adapter 实战

#tensorflow #neo4j #人工智能

TensorFlow 模型迁移到昇腾：tf_adapter 实战

#tensorflow #neo4j #人工智能

CANN 学习路径：从入门到实战

本文系统介绍了昇腾CANN的学习路径，分为入门、进阶和实战三个阶段。入门阶段建议先理解CANN架构并跑通示例程序；进阶阶段重点学习算子融合、内存规划等底层原理；实战阶段推荐模型迁移、算子开发等实际项目。文章提供了官方文档、示例代码等学习资源，并指出避免直接读源码、只学不练等常见误区。强调动手实践和社区互动是掌握CANN的关键，建议通过跑代码、调模型、提issue等方式巩固学习效果。

#学习 #安全 #性能优化 +1

CANN 学习路径：从入门到实战

#学习 #安全 #性能优化 +1

共 21 条

请选择