logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Intel DevCloud for oneAPI——并行矩阵乘法

页面中,“Get Free Access” 再次登录账号后,继续相关信息的填写。在ND-Range中的for循环中需要多次写入全局内存,所以可以考虑使用一个临时变量记录A和B矩阵work-group相乘的结果,在for循环执行结束后再写入C矩阵,这样就可以减少对全局内存的读写,也可以提高运行速度。由于要对矩阵乘法不断优化,所以选择写一个主函数,在主函数中记录运行时长,随后只需要为不同的方法实现矩阵

文章图片
#oneapi#矩阵#算法
到底了