项目档案
OAT
LLM 在线对齐训练框架
GitHub Stars
652
方向
模型对齐
形态
训练框架
- 机构
- Sea AI Lab (SAIL)
- 分组
- 国际企业实验室
- 类别
- LLM 在线对齐框架
- 状态
- 活跃维护
- 启动
- 2024-10
- 语言 / 形态
- Python
- 协议
- Apache-2.0
- GitHub Stars
- 652
- 信息更新
- 2026-05-04
OAT 是 Sea AI Lab 的 LLM 对齐训练框架,面向强化学习、偏好学习等后训练环节。
是什么
OAT 是 Online Alignment Training 的缩写。它把 LLM 后训练里常见的强化学习、偏好优化、在线采样和评测流程封装成研究友好的框架。
它不是面向普通用户的产品,而是给模型研究和训练团队使用的工具。
与 AI 的关系
模型能力越来越取决于后训练。预训练决定基础知识,SFT、RLHF、DPO、在线强化学习等流程决定模型是否听话、稳定、有用。
OAT 的意义在于把这些复杂对齐实验做成可复用工程框架。
与新加坡的关系
OAT 说明 Sea AI Lab 不只做区域语言模型,也在做模型训练底层工具。这对新加坡本土科技公司参与基础模型竞争很重要。
未来可以追踪它是否被 Sailor 或其他 SAIL 模型训练管线采用。
关键里程碑
- 2024-10OAT 仓库创建