"전세계 81% 비영어권 위한 LLM"…투플랫폼, '수트라' 출시

최태범 기자 기사 입력 2024.03.28 23:30

URL이 복사되었습니다. 원하는 곳에 붙여넣기 해주세요.

공유하기
글자크기
[스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

생성 인공지능(Generate AI) 기반 소셜앱 '재피(ZAPPY)'를 운영하는 투플랫폼이 다국어 생성 AI 모델 '수트라(SUTRA)'를 출시했다고 28일 밝혔다.

수트라는 산스크리트어로 짧고 간결한 지혜를 엮은 격언집을 뜻한다. 다양한 언어의 정보들을 포괄해 빠르고 간편하게 원하는 정보를 얻을 수 있다는 의미다.

투플랫폼이 출시한 수트라는 △빠른 속도를 기반으로 응용프로그램에 최적화된 '터보' △다국어 대화에 이상적인 '라이트' △인터넷에 연결된 모델로 쿼리를 이해하고 웹을 탐색해 할루시네이션(환각 현상) 없이 최신 응답을 제공하는 '온라인' 등 3개의 모델로 구성됐다.

50개 이상의 언어를 지원하며 1000만건 이상의 대화 데이터를 학습하고 이를 미세조정(파인튜닝)해 일관적이고 지속적인 대화 형식의 정보 검색을 구현했다.

수트라는 주요 거대언어모델(LLM)들이 모두 영어 중심적이라는 문제의식에서 출발했다. 전세계 인구의 81%는 비영어권이라는 점에서 이들이 AI 사용 중 마주하는 언어의 장벽을 넘을 수 있도록 다양한 언어로 사용할 수 있는 LLM을 만들었다.

특히 인터넷 연결로 실시간 정보를 제공하는 온라인 모델은 실제 존재하지 않는 사실을 필터링할 수 있어 환각을 대폭 줄인다. 속도면에서도 GPT-3.5, 라마(Llama-70b)와 비교해 1.3~5배 빠른 초당 토큰 처리량을 나타낸다.

에너지 효율과 비용 절감 측면에서도 장점이다. 수트라는 초당 120개의 토큰을 처리할 수 있고 100만개 토큰을 처리하는 데 드는 비용은 1달러에 불과하다. 투플랫폼은 가격과 에너지 효율 측면에서 경쟁력을 확보한 만큼 기업 파트너와의 협업을 추진할 계획이다.

프라나브 미스트리 투플랫폼 대표는 "수트라는 영어로 훈련된 AI 모델로 인해 발생하는 언어 격차를 해소한다. 훈련된 말뭉치 데이터에서 벗어나 실시간 정보로 지식을 확장한다는 것에도 의의가 있다"고 했다.

이어 "우리는 모두를 위한 AI를 만들고 AI와 인간의 상호작용을 재정의한다는 미션을 위해 일하고 있다. AI의 대중적 접근성을 높인 수트라가 목표 달성에 중요한 발판이 될 것"이라고 덧붙였다.

[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']

'투플랫폼' 기업 주요 기사

관련기사

이 기사 어땠나요?

이 시각 많이 보는 기사