返回产学研开源生态 LLM 在线对齐框架 活跃维护

项目档案

OAT

LLM 在线对齐训练框架

GitHub Stars
652
方向
模型对齐
形态
训练框架
机构
Sea AI Lab (SAIL)
分组
国际企业实验室
类别
LLM 在线对齐框架
状态
活跃维护
启动
2024-10
语言 / 形态
Python
协议
Apache-2.0
GitHub Stars
652
信息更新
2026-05-04

OAT 是 Sea AI Lab 的 LLM 对齐训练框架,面向强化学习、偏好学习等后训练环节。

是什么

OAT 是 Online Alignment Training 的缩写。它把 LLM 后训练里常见的强化学习、偏好优化、在线采样和评测流程封装成研究友好的框架。

它不是面向普通用户的产品,而是给模型研究和训练团队使用的工具。

与 AI 的关系

模型能力越来越取决于后训练。预训练决定基础知识,SFT、RLHF、DPO、在线强化学习等流程决定模型是否听话、稳定、有用。

OAT 的意义在于把这些复杂对齐实验做成可复用工程框架。

与新加坡的关系

OAT 说明 Sea AI Lab 不只做区域语言模型,也在做模型训练底层工具。这对新加坡本土科技公司参与基础模型竞争很重要。

未来可以追踪它是否被 Sailor 或其他 SAIL 模型训练管线采用。

关键里程碑

  1. 2024-10
    OAT 仓库创建

资源入口

更多产学研项目