登录社区云,与社区用户共同成长
邀请您加入社区
该用户还未填写简介
暂无可提供的服务
这种规模的大模型的并行训练需要至少256卡并行训练才是有意义的工业落地。可以做8(DP)*8(TP)*4(PP)的并行计算。