返回产学研开源生态 东南亚语言模型 研究开源

项目档案

Sailor LLM

面向东南亚的开源语言模型

GitHub Stars
138
论文
EMNLP 2024
区域
东南亚
机构
Sea AI Lab (SAIL)
分组
国际企业实验室
类别
东南亚语言模型
状态
研究开源
启动
2024-02
语言 / 形态
Python / Models
协议
MIT
GitHub Stars
138
信息更新
2026-05-04

Sailor LLM 是 Sea AI Lab 的东南亚语言模型项目,和 SEA-LION 一样指向区域语言能力,但来自企业研究实验室。

是什么

Sailor 是一组面向东南亚语言的开源语言模型。它关注低资源语言、区域语料和多语言能力,试图让模型更适合东南亚真实文本环境。

这条路线和通用英文模型不同:它把区域语言覆盖当成核心指标。

与 AI 的关系

区域语言模型是全球大模型生态里的重要补位。通用模型在东南亚语言上看似可用,但细节、语气、地名、混语文本和本地知识经常不稳定。

Sailor LLM 让企业研究力量参与了区域模型建设。

与新加坡的关系

Sea 是新加坡最重要的本土互联网公司之一。SAIL 做 Sailor LLM,说明新加坡本土企业也在尝试基础模型和区域语言模型,而不是只消费美国或中国模型。

它应和 SEA-LION 放在一起追踪:一个是国家平台路线,一个是本土科技公司实验室路线。

关键里程碑

  1. 2024-02
    Sailor LLM 仓库创建
  2. 2024
    论文发表于 EMNLP 2024

资源入口

更多产学研项目