SGNLP
SGNLP는 AISG가 관리하는 「싱가포르 현지 NLP 도구 모음」으로, 싱가포르 영어(Singlish), 현지 명명된 엔티티, 다국어 코드 전환 등의 시나리오를 위한 사전 훈련된 모델과 도구를 포함합니다. SEA-LION이 나타나기 전에 NLP 영역에서 AISG의 주력 제품이었습니다.
📖 개요
SGNLP는 일련의 모델과 도구를 포함합니다:
- 싱가포르 영어 이해: Singlish 텍스트 정규화, 감정 분석
- 다국어 코드 전환: 텍스트의 일부에 혼합된 언어 식별(영어 / 중국어 / 말레이어 / 타밀어 혼합)
- 현지 명명된 엔티티: 싱가포르 지명, 인명, 기관명 식별
- 패러프레이즈 및 요약: 싱가포르 현지 뉴스/정부 텍스트 대상
SEA-LION의 등장과 함께 SGNLP의 역할은 점차 「주력 제품」에서 「전문 도구」로 변화합니다——범용 NLP 능력은 LLM에 양보하지만, Singlish 등 전문 시나리오는 여전히 독립적인 가치가 있습니다.
🤖 AI와의 관계
SGNLP가 해결하는 핵심 문제: 범용 NLP 도구가 싱가포르 영어에서 효과가 낮습니다.
싱가포르 영어(Singlish)는 영어, 말레이어, 중국어, 타밀어를 혼합하고, 독특한 문법(lah, leh, lor 같은 어조사)이 있어서 spaCy / NLTK / HuggingFace의 기본 제공 모델이 Singlish 텍스트에서 성능이 좋지 않습니다. SGNLP의 사전 훈련된 모델은 Singlish 데이터에서 특별히 미세 조정되었으며, 정확도가 범용 모델보다 현저히 높습니다.
SEA-LION과의 관계: SEA-LION은 LLM으로서 SGNLP의 능력을 부분적으로 포함하지만, SGNLP의 경량화된 모델(일부 < 100MB)은 에지 배포, 실시간 처리 시나리오에서 여전히 이점이 있습니다.
🇸🇬 싱가포르와의 관계
SGNLP는 싱가포르의 「언어 주권」 서사의 초기 실천입니다——LLM 시대 이전에 AISG는 이미 「싱가포르를 위해 맞춤형으로 만든 언어 AI」를 만들고 있었습니다.
「7개 전도 레버」 내에서:
- 레버 3(산업 응용): 현지 고객 서비스, 소셜 미디어 분석, 정부 텍스트 처리
- 레버 1(기초 연구): Singlish는 학술 연구 가치가 있는 「크리올 영어」 중 소수입니다.
관점: SGNLP의 존재는 SEA-LION에 「사상적 선구자」를 제공합니다——동일한 「현지 언어를 위한 전문 AI 만들기」철학으로, NLP 도구에서 LLM으로 업그레이드됩니다.
🗓️ 주요 마일스톤
- 2021SGNLP 오픈소스 공개
🔗 관련 리소스
관련 생태계 엔티티
출처
- SGNLP GitHub — 확인일 2026-05-02