
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
从CUDA到DTK:一名大模型工程师的海光DCU迁移实战笔记
版本锁定:DTK版本、PyTorch版本、flash_attn版本、vLLM版本必须严格匹配,建议用官方文档推荐的组合。推理优先:目前海光DCU在推理场景最成熟,训练场景建议从小规模起步验证。迁移成本:如果你的代码只用PyTorch标准API,迁移成本很低。如果用到了cuDNN/cuBLAS等底层库,需要替换为海光对应实现。关注更新:海光的软件栈迭代很快,建议关注光合开发者社区的版本更新公告。
基础2:神经网络基础与感知机-反向传播
神经网络基础与感知机-反向传播

到底了







