返回产学研开源生态 LLM 在线对齐框架活跃维护

项目档案

OAT

LLM 在线对齐训练框架

GitHub Stars

652

方向

模型对齐

形态

训练框架

机构: Sea AI Lab (SAIL)
分组: 国际企业实验室
类别: LLM 在线对齐框架
状态: 活跃维护
启动: 2024-10
语言 / 形态: Python
协议: Apache-2.0
GitHub Stars: 661
信息更新: 2026-05-04

OAT 是 Sea AI Lab 的 LLM 对齐训练框架，面向强化学习、偏好学习等后训练环节。

是什么

OAT 是 Online Alignment Training 的缩写。它把 LLM 后训练里常见的强化学习、偏好优化、在线采样和评测流程封装成研究友好的框架。

它不是面向普通用户的产品，而是给模型研究和训练团队使用的工具。

与 AI 的关系

模型能力越来越取决于后训练。预训练决定基础知识，SFT、RLHF、DPO、在线强化学习等流程决定模型是否听话、稳定、有用。

OAT 的意义在于把这些复杂对齐实验做成可复用工程框架。

与新加坡的关系

OAT 说明 Sea AI Lab 不只做区域语言模型，也在做模型训练底层工具。这对新加坡本土科技公司参与基础模型竞争很重要。

未来可以追踪它是否被 Sailor 或其他 SAIL 模型训练管线采用。

关键里程碑

2024-10
OAT 仓库创建

资源入口

更多产学研项目

Salesforce AI Research Singapore

LAVIS / BLIP

视觉语言基础模型

Salesforce AI Research

CodeGen

代码生成模型

ByteDance Seed (Singapore)

BAGEL

统一多模态模型

Alibaba DAMO-NLP-SG

VideoLLaMA3

视频理解多模态模型