logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

面向昇腾通算融合算子的最优Tiling搜索----以matmul_reduce_scatter为例

算子的最佳性能收到各种调优参数的影响,为了找到特定场景下最优的参数,实机暴力搜索得到的最优性能结果最为可靠。本文档主要记录了对matmul_reduce_scatter进行参数搜索的过程,方便后续对其他算子进行调优搜索工作。

#java#前端#服务器
面向昇腾通算融合算子的最优Tiling搜索----以matmul_reduce_scatter为例

算子的最佳性能收到各种调优参数的影响,为了找到特定场景下最优的参数,实机暴力搜索得到的最优性能结果最为可靠。本文档主要记录了对matmul_reduce_scatter进行参数搜索的过程,方便后续对其他算子进行调优搜索工作。

#java#前端#服务器
到底了