logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

昇腾CANN ops-math 仓库源码解读:从数据类型转换到算子融合的工程实践

ops-math 仓库的 conversion 算子,是昇腾 NPU 生态里数据类型转换的基础设施。Cast是主力算子,支持 FP32/FP16/BF16/INT8 之间的相互转换,零拷贝优化是亮点FormatCast处理 NCHW/NHWC 排布转换,CV 场景下用 NHWC 通常更快解决动态 shape 场景,有额外路由开销是量化推理必备,注意 scale 因子和量化链完整性实战中尽量减少 d

文章图片
#vscode
昇腾CANN ops-math 仓库源码解读:从数据类型转换到算子融合的工程实践

ops-math 仓库的 conversion 算子,是昇腾 NPU 生态里数据类型转换的基础设施。Cast是主力算子,支持 FP32/FP16/BF16/INT8 之间的相互转换,零拷贝优化是亮点FormatCast处理 NCHW/NHWC 排布转换,CV 场景下用 NHWC 通常更快解决动态 shape 场景,有额外路由开销是量化推理必备,注意 scale 因子和量化链完整性实战中尽量减少 d

文章图片
#vscode
深度解析:CANN——AI算力生态的“灵魂”引擎

它构建了统一的编程接口和工具链,无论是云端的高性能训练,还是端侧(如PC、边缘设备)的低延迟推理,开发者都可以使用同一套代码和开发习惯。文章严格遵循您的要求,未出现“昇腾”字眼,同时保留了两个关键链接的位置,您可以根据实际发布的平台和内容替换为具体的超链接。例如,一个在云端开发和训练好的大模型,可以非常平滑地部署到端侧设备上,无需进行大量重复的适配工作,显著降低了开发和维护成本。例如,一个在云端开

文章图片
#人工智能
昇腾CANN 8.0 深度调优指南:从90分到99分的工业AI性能与精度跃迁实战

昇腾CANN 8.0 深度调优指南:从90分到99分的工业AI性能与精度跃迁实战

#人工智能
昇腾CANN 8.0 深度调优指南:从90分到99分的工业AI性能与精度跃迁实战

昇腾CANN 8.0 深度调优指南:从90分到99分的工业AI性能与精度跃迁实战

#人工智能
昇腾CANN 8.0 深度调优指南:从90分到99分的工业AI性能与精度跃迁实战

昇腾CANN 8.0 深度调优指南:从90分到99分的工业AI性能与精度跃迁实战

#人工智能
昇腾CANN 8.0 深度调优指南:从90分到99分的工业AI性能与精度跃迁实战

昇腾CANN 8.0 深度调优指南:从90分到99分的工业AI性能与精度跃迁实战

#人工智能
到底了