logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从CUDA到DTK:一名大模型工程师的海光DCU迁移实战笔记

版本锁定:DTK版本、PyTorch版本、flash_attn版本、vLLM版本必须严格匹配,建议用官方文档推荐的组合。推理优先:目前海光DCU在推理场景最成熟,训练场景建议从小规模起步验证。迁移成本:如果你的代码只用PyTorch标准API,迁移成本很低。如果用到了cuDNN/cuBLAS等底层库,需要替换为海光对应实现。关注更新:海光的软件栈迭代很快,建议关注光合开发者社区的版本更新公告。

到底了