SEA-Guard

面向东南亚文化语境的安全分类与护栏模型

模型数

核心语言

输出形态

safe / unsafe

SEA-Guard 是 SEA-LION 生态里的安全护栏线，重点解决通用安全模型对东南亚语言、宗教、族群和文化语境不敏感的问题。

是什么

SEA-Guard 目前是一组安全分类模型。它把用户请求或模型回复判定为 safe / unsafe，并支持文本和部分图文场景。

它不是替代人类审核的万能安全系统，而是给东南亚应用开发者一个更本地化的第一层护栏：在接入通用 LLM 或 SEA-LION 时，可以先用 SEA-Guard 做区域语境下的风险过滤。

AI 安全模型往往在英文和美国文化语境上训练得最好。东南亚的现实问题更复杂：多宗教、多族群、多语言混用，本地冒犯和真实风险不一定出现在英文安全数据集里。

SEA-Guard 的意义在于把安全对齐也区域化。它让"本地语言模型"不只是会说本地话，也更懂本地边界。

SEA-Guard 把新加坡的两条 AI 路线接起来：SEA-LION 的区域模型路线，以及 AI Verify 的可信 AI 治理路线。

如果 SEA-LION 要进入政府、教育、医疗和金融等高敏场景，安全护栏不是附属品，而是落地前提。SEA-Guard 就是这个前提的模型层。