项目档案
SGNLP
新加坡 NLP 研究社区模型
GitHub Stars
37
安装方式
pip
核心场景
Singlish / code-switching
- 归属
- AI Singapore
- 类别
- 本地 NLP 工具包
- 状态
- 维护放缓
- 启动
- 2021
- 语言 / 形态
- Python
- 协议
- MIT
- GitHub Stars
- 37
- 信息更新
- 2026-05-04
SGNLP 是 AI Singapore 在 SEA-LION 之前的本地语言 AI 工具包,聚焦 Singlish、多语言代码切换和新加坡本地 NLP 任务。
是什么
SGNLP 是一个 Python 包,封装了若干来自新加坡 NLP 研究社区的模型。它关注的不是通用英文 NLP,而是新加坡语境:Singlish、英文/中文/马来语混用、地方实体和本地文本理解。
在 LLM 普及前,这类轻量模型更适合客服、社交媒体分析和政府文本处理。
与 AI 的关系
SGNLP 说明一个重要事实:语言 AI 的本地化不是从 SEA-LION 才开始的。新加坡英语和多语言混用让通用 NLP 工具经常失灵,轻量模型仍有边缘部署和实时处理价值。
它和 SEA-LION 的关系更像前后两代产品:SGNLP 是专项工具,SEA-LION 是通用区域大模型。
与新加坡的关系
SGNLP 是新加坡"语言主权"路线的早期工程化实践。它把本地语言现象当成产品问题处理,而不是等待全球模型自然覆盖。
这个页面未来适合继续补充:具体模型清单、demo 状态、是否仍被政府或企业系统使用,以及它与 SEA-LION embedding / ModernBERT 线的关系。
关键里程碑
- 2021SGNLP 开源发布