logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

pytorch debug版本编译

有方案解决依赖分析算子dispatch流程,因此需要编译debug版本,方便跟踪dispatch流程。

文章图片
#pytorch#bug
pytorch FSDP特性

FSDP全称(Fully Sharded Data Parallel),是pytorch官方提出大模型切分的解决方案。类似于ZeRo3级别的并行优化,同时混合cpu offload。

文章图片
#pytorch#人工智能#python
到底了