Abin 个人主页

@weixin_62280685

Abin

2024-07-09 13:36:33 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

CANN Operator Developer工具详解：算子开发的一站式解决方案

编辑op.yamlinputs:- name: xoutputs:- name: yattrs:type: inttuning:double_buffer: true # 启用双缓冲优化内存带宽vectorize: true # 启用向量化指令生成结果# build/group_norm.py (自动生成)# 自动注入双缓冲优化# 分组归一化核心逻辑# 计算组内均值/方差# 归一化公式: (x -

#python

解析CANN中的msame工具：模型推理测试与性能评估利器

/ custom_verify.cpp - 自定义验证插件示例// 自定义验证函数：检查输出是否在合理范围const。

#python

解析CANN DVPP数字视觉预处理库：图像与视频编解码的硬件加速

CANN（Compute Architecture for Neural Networks）是华为为昇腾AI处理器打造的全栈AI计算软件平台，提供从底层硬件驱动到上层应用开发的完整生态支持。理解CANN的整体架构是把握DVPP定位的关键。fill:#333;important;important;fill:none;color:#333;color:#333;important;fill:none

#视频编解码

解析CANN DVPP数字视觉预处理库：图像与视频编解码的硬件加速

#视频编解码

解析CANN DVPP数字视觉预处理库：图像与视频编解码的硬件加速

#视频编解码

解析CANN的AMCT工具：模型压缩与量化加速的完整指南

量化技术体系：AMCT构建了完整的量化解决方案，涵盖静态量化、动态量化和混合精度量化。其创新的KL散度校准算法和敏感层保护机制，使INT8量化后的模型精度损失控制在1-2%以内，同时实现2-5倍的推理加速。特别值得一提的是，AMCT的量化实现严格遵循CANN硬件特性，确保量化参数与昇腾AI处理器的计算单元完美匹配，避免了跨平台量化常见的兼容性问题。剪枝与误差补偿：AMCT的结构化剪枝算法针对昇腾架

#python

解析CANN的AMCT工具：模型压缩与量化加速的完整指南

#python

解析CANN的AMCT工具：模型压缩与量化加速的完整指南

#python

CANN ATC工具深度解析：模型转换从框架到NPU的桥梁

/ 自定义算子实现// 在NPU上执行的核函数})// 编译为.so并加载ATC作为CANN生态的模型转换中枢效率提升：自动化优化流程节省70%部署时间硬件适配：统一接口屏蔽NPU硬件差异性能加速：通过融合/量化实现3倍以上推理加速动态结构支持：增强对可变输入尺寸的适应性稀疏计算集成：自动识别稀疏模式提升计算效率多芯片协同：支持OM文件跨NPU集群分发讨论问题如何平衡量化压缩与模型精度的trade

#python

CANN ATC工具深度解析：模型转换从框架到NPU的桥梁

#python

共 657 条

请选择