logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Deepseek开源周之四——DualPipe & EPLB

从流水并行,数据并行,专家并行的角度来解释DualPipe和EPLB如何实现了Deepseek的并行训练加速

文章图片
#开源
【NLP入门】Lab1.1 - 使用LSTM进行中文分词(附完整代码)

使用LSTM进行中文分词的完整流程,从数据集准备,模型构建到训练与测试

文章图片
#自然语言处理#lstm#中文分词
【论文蒸馏】Recent Advances in Speech Language Models: A Survey

对声学大模型综述Recent Advances in Speech Language Models: A Survey的详细整理

文章图片
#语言模型#人工智能
【手模手教程】注册Kimi大模型api-key

手摸手教会你如何获得Kimi大模型的api-key

文章图片
#人工智能
Deepseek开源周之四——DualPipe & EPLB

从流水并行,数据并行,专家并行的角度来解释DualPipe和EPLB如何实现了Deepseek的并行训练加速

文章图片
#开源
Deepseek开源周之四——DualPipe & EPLB

从流水并行,数据并行,专家并行的角度来解释DualPipe和EPLB如何实现了Deepseek的并行训练加速

文章图片
#开源
【手模手教程】注册Kimi大模型api-key

手摸手教会你如何获得Kimi大模型的api-key

文章图片
#人工智能
【论文蒸馏】DeepSeek_Math 总结

DeepSeekMath论文核心内容,包括DeepseekMath数据集的构建,模型预训练与后训练,以及关于强化学习的思考

文章图片
#人工智能#开源#神经网络
Deepseek开源周之四——DualPipe & EPLB

从流水并行,数据并行,专家并行的角度来解释DualPipe和EPLB如何实现了Deepseek的并行训练加速

文章图片
#开源
到底了