
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
Deepseek开源周之四——DualPipe & EPLB
从流水并行,数据并行,专家并行的角度来解释DualPipe和EPLB如何实现了Deepseek的并行训练加速

【NLP入门】Lab1.1 - 使用LSTM进行中文分词(附完整代码)
使用LSTM进行中文分词的完整流程,从数据集准备,模型构建到训练与测试

【论文蒸馏】Recent Advances in Speech Language Models: A Survey
对声学大模型综述Recent Advances in Speech Language Models: A Survey的详细整理

【手模手教程】注册Kimi大模型api-key
手摸手教会你如何获得Kimi大模型的api-key

Deepseek开源周之四——DualPipe & EPLB
从流水并行,数据并行,专家并行的角度来解释DualPipe和EPLB如何实现了Deepseek的并行训练加速

Deepseek开源周之四——DualPipe & EPLB
从流水并行,数据并行,专家并行的角度来解释DualPipe和EPLB如何实现了Deepseek的并行训练加速

【手模手教程】注册Kimi大模型api-key
手摸手教会你如何获得Kimi大模型的api-key

【论文蒸馏】DeepSeek_Math 总结
DeepSeekMath论文核心内容,包括DeepseekMath数据集的构建,模型预训练与后训练,以及关于强化学习的思考

【论文蒸馏】Deepseek_R1 总结
Deepseek-R1的论文概要总结

Deepseek开源周之四——DualPipe & EPLB
从流水并行,数据并行,专家并行的角度来解释DualPipe和EPLB如何实现了Deepseek的并行训练加速

到底了







