项目档案
Zero-Bubble Pipeline Parallelism
新型流水线并行训练效率优化
GitHub Stars
452
方向
流水线并行
目标
减少空泡
- 机构
- Sea AI Lab (SAIL)
- 分组
- 国际企业实验室
- 类别
- 训练效率优化
- 状态
- 研究开源
- 启动
- 2023-11
- 语言 / 形态
- Python
- 协议
- 未明确
- GitHub Stars
- 452
- 信息更新
- 2026-05-04
Zero-Bubble Pipeline Parallelism 是 Sea AI Lab 在大模型训练效率上的系统研究,目标是减少流水线并行中的空闲时间。
是什么
流水线并行会把模型切成多个阶段,在不同设备上顺序处理 micro-batches。问题是设备之间容易出现等待,也就是"bubble"。
Zero-Bubble 的思路是改进调度和反向传播安排,让设备更少空转,提高大模型训练吞吐。
与 AI 的关系
训练效率是基础模型竞争的隐藏战场。少一点空转,就意味着同样算力可以训练更多 token、更大模型或更快迭代。
这种系统论文和开源实现对大模型实验室很有实际价值。
与新加坡的关系
Sea AI Lab 做这类训练系统研究,说明新加坡本土企业实验室正在进入更底层的模型基础设施层,而不仅是应用层。
它和 Colossal-AI 一起构成新加坡开源生态中"训练系统"这一条线。
关键里程碑
- 2023-11Zero-Bubble 仓库创建