风指引着方向个人主页

@fengoffor

风指引着方向

2025-07-18 10:04:01 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

算子单元测试框架：CANN op-tester 的自动化验证

CANN 的op-tester 框架，将算子验证从“经验驱动”转变为“数据驱动”。它不仅是质量守门员，更是开发者的调试利器。通过标准化、自动化的测试流程，每一位开发者都能构建出高精度、高性能、高鲁棒性的昇腾算子，加速 AI 创新落地。📚立即体验自动化测试CANN 开源组织ops-nn 仓库地址在完整测试框架Swish/ROIAlign/TopK 等算子测试模板HTML 报告生成器CI/CD 集成

#单元测试 #自动化 #运维

算子单元测试框架：CANN op-tester 的自动化验证

#单元测试 #自动化 #运维

算子单元测试框架：CANN op-tester 的自动化验证

#单元测试 #自动化 #运维

算子精度调试实战：从 FP32 到 FP16 的量化之旅

不要盲目全 FP16：对LayerNormSoftmaxLog等算子保持警惕；优先使用混合精度：CANN 的可自动识别安全算子；epsilon 不小于 1e-4：确保在 FP16 中可表示；关键路径用 FP32：牺牲少量性能，换取精度稳定；善用 AIGC：让 Qwen3-Coder-Next 成为你的“精度顾问”。FP16 量化不是简单的“格式转换”，而是一场数值稳定性与硬件效率的精细博弈。

#人工智能

算子精度调试实战：从 FP32 到 FP16 的量化之旅

#人工智能

自定义算子开发入门：基于 CANN op-plugin 的扩展实践

可以把深度学习框架想象成一个大型厨房，内置算子就是常用的锅碗瓢盆——炒锅（卷积）、蒸笼（池化）、打蛋器（激活函数）都有现成的。但如果你想做一道“分子料理融合菜”，现有的厨具没法精准完成，就得自己打造专用工具，这就是自定义算子的意义。新算法落地：研究论文提出的新操作，框架还没支持；业务特化：例如工业检测中需要一种结合边缘检测的自定义滤波；性能调优：某些操作通过手写逻辑，可以比通用实现快很多；跨框架兼

#开发语言

自定义算子开发入门：基于 CANN op-plugin 的扩展实践

#开发语言

图编译优化全链路：CANN graph-engine 仓库技术拆解

CANN通过“图优化 → 算子融合 → 代码生成”三阶段流水线，实现了从通用计算图到昇腾 NPU 高效执行的转化。深度融合昇腾硬件特性，最大化计算密度；模块化设计，支持灵活扩展；端到端自动化，无需手动调优。未来，随着AI 编译器（如 MindCompiler）与技术的演进，将进一步向“全自动高性能图编译”演进，成为昇腾生态不可或缺的引擎。📌延伸阅读CANN 官方文档：https://www.hi

#c语言

图编译优化全链路：CANN graph-engine 仓库技术拆解

#c语言

图编译优化全链路：CANN graph-engine 仓库技术拆解

#c语言

共 15 条

请选择