返回产学研开源生态 训练效率优化 研究开源

项目档案

Zero-Bubble Pipeline Parallelism

新型流水线并行训练效率优化

GitHub Stars
452
方向
流水线并行
目标
减少空泡
机构
Sea AI Lab (SAIL)
分组
国际企业实验室
类别
训练效率优化
状态
研究开源
启动
2023-11
语言 / 形态
Python
协议
未明确
GitHub Stars
452
信息更新
2026-05-04

Zero-Bubble Pipeline Parallelism 是 Sea AI Lab 在大模型训练效率上的系统研究,目标是减少流水线并行中的空闲时间。

是什么

流水线并行会把模型切成多个阶段,在不同设备上顺序处理 micro-batches。问题是设备之间容易出现等待,也就是"bubble"。

Zero-Bubble 的思路是改进调度和反向传播安排,让设备更少空转,提高大模型训练吞吐。

与 AI 的关系

训练效率是基础模型竞争的隐藏战场。少一点空转,就意味着同样算力可以训练更多 token、更大模型或更快迭代。

这种系统论文和开源实现对大模型实验室很有实际价值。

与新加坡的关系

Sea AI Lab 做这类训练系统研究,说明新加坡本土企业实验室正在进入更底层的模型基础设施层,而不仅是应用层。

它和 Colossal-AI 一起构成新加坡开源生态中"训练系统"这一条线。

关键里程碑

  1. 2023-11
    Zero-Bubble 仓库创建

资源入口

更多产学研项目