DeepSeek低调开源LPLB：用线性规划破解MoE训练负载均衡难题

**摘要：**DeepSeek低调开源LPLB项目，这是一个基于线性规划的MoE模型负载均衡器，旨在优化专家并行架构中的动态负载分配问题。LPLB通过动态重排序、构建副本和线性规划求解三个步骤，解决MoE训练中GPU资源利用不均的痛点。该项目目前处于研究阶段，支持多种拓扑结构，但存在求解延迟和非线性计算成本等局限。LPLB的创新在于利用数学工具优化实时分配，为MoE训练加速提供了重要参考。

中科创新烁智

148人浏览 · 2025-11-22 11:41:52

中科创新烁智 · 2025-11-22 11:41:52 发布

1.新项目：LPLB

在这里插入图片描述

前天，DeepSeek在GitHub上悄然发布了一个新的代码库：LPLB。

   (项目地址：https://github.com/deepseek-ai/LPLB）

与往常不同的是，这次发布异常低调——没有官方推文，没有公众号更新，仅有少数技术博主分享的相关推文也未引起太多关注。截至目前，该项目star数量尚未突破200。然而，仔细研究后我们发现，这个看似普通的项目实际上蕴含着重要价值。X平台网友@gm8xx8评论认为，这表明DeepSeek正在着力解决模型训练中的正确性和吞吐量瓶颈，为下一版模型发布做准备。

2.LPLB项目介绍
LPLB，全称Linear-Programming-Based Load Balancer（基于线性规划的负载均衡器），是一个专门为MoE（混合专家）模型设计的并行负载均衡器。

它创新性地利用线性规划算法来优化专家并行架构中的工作负载分配问题，具体通过三个核心步骤实现：

动态重排序：基于实时工作负载统计信息对专家进行智能重排序。
构建副本：结合静态拓扑结构创建专家副本。
求解最优分配：针对每个批次的数据，运用线性规划求解最优Token分配方案。

值得一提的是，LPLB的专家重排序过程由EPLB协助完成，而实时工作负载统计信息可以通过多种方式获取：用户提供、通过torch.distributed收集，或直接从Deep-EP缓冲区的内部通信器获取。

3.技术核心：解决MoE训练的关键痛点

LPLB瞄准的是MoE模型中长期存在的负载不均问题——在MoE模型中，某些“专家”可能比其他专家接收到更多的Token，导致部分GPU忙碌而其他GPU空闲的资源浪费现象。

X平台网友@big_goose指出，该方案与英伟达用于调度SM（Streaming Multiprocessor，英伟达GPU核心计算单元）的技术非常相似，只是将抽象层次提升到了pipeline级别。LPLB特别强调“单SM”，意味着其求解过程设计得极其轻量化，不会占用过多计算资源。

在这里插入图片描述