📦 AI 제품 제품 / 도구 운영 중 설립 2021

SGNLP

소속
AI Singapore
공식 웹사이트
github.com/aisingapore/sgnlp
정보 업데이트
2026-05-02

SGNLP는 AISG가 관리하는 「싱가포르 현지 NLP 도구 모음」으로, 싱가포르 영어(Singlish), 현지 명명된 엔티티, 다국어 코드 전환 등의 시나리오를 위한 사전 훈련된 모델과 도구를 포함합니다. SEA-LION이 나타나기 전에 NLP 영역에서 AISG의 주력 제품이었습니다.

📖 개요

SGNLP는 일련의 모델과 도구를 포함합니다:

  • 싱가포르 영어 이해: Singlish 텍스트 정규화, 감정 분석
  • 다국어 코드 전환: 텍스트의 일부에 혼합된 언어 식별(영어 / 중국어 / 말레이어 / 타밀어 혼합)
  • 현지 명명된 엔티티: 싱가포르 지명, 인명, 기관명 식별
  • 패러프레이즈 및 요약: 싱가포르 현지 뉴스/정부 텍스트 대상

SEA-LION의 등장과 함께 SGNLP의 역할은 점차 「주력 제품」에서 「전문 도구」로 변화합니다——범용 NLP 능력은 LLM에 양보하지만, Singlish 등 전문 시나리오는 여전히 독립적인 가치가 있습니다.

🤖 AI와의 관계

SGNLP가 해결하는 핵심 문제: 범용 NLP 도구가 싱가포르 영어에서 효과가 낮습니다.

싱가포르 영어(Singlish)는 영어, 말레이어, 중국어, 타밀어를 혼합하고, 독특한 문법(lah, leh, lor 같은 어조사)이 있어서 spaCy / NLTK / HuggingFace의 기본 제공 모델이 Singlish 텍스트에서 성능이 좋지 않습니다. SGNLP의 사전 훈련된 모델은 Singlish 데이터에서 특별히 미세 조정되었으며, 정확도가 범용 모델보다 현저히 높습니다.

SEA-LION과의 관계: SEA-LION은 LLM으로서 SGNLP의 능력을 부분적으로 포함하지만, SGNLP의 경량화된 모델(일부 < 100MB)은 에지 배포, 실시간 처리 시나리오에서 여전히 이점이 있습니다.

🇸🇬 싱가포르와의 관계

SGNLP는 싱가포르의 「언어 주권」 서사의 초기 실천입니다——LLM 시대 이전에 AISG는 이미 「싱가포르를 위해 맞춤형으로 만든 언어 AI」를 만들고 있었습니다.

「7개 전도 레버」 내에서:

  • 레버 3(산업 응용): 현지 고객 서비스, 소셜 미디어 분석, 정부 텍스트 처리
  • 레버 1(기초 연구): Singlish는 학술 연구 가치가 있는 「크리올 영어」 중 소수입니다.

관점: SGNLP의 존재는 SEA-LION에 「사상적 선구자」를 제공합니다——동일한 「현지 언어를 위한 전문 AI 만들기」철학으로, NLP 도구에서 LLM으로 업그레이드됩니다.

🗓️ 주요 마일스톤

  1. 2021
    SGNLP 오픈소스 공개

🔗 관련 리소스

출처

같은 범주 📦 AI 제품