"알리바바보다 작고 성능은 강하다"…사전학습 LLM '솔라' 공개

최태범 기자 기사 입력 2023.12.14 20:30

URL이 복사되었습니다. 원하는 곳에 붙여넣기 해주세요.

공유하기
글자크기
[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

인공지능(AI) 스타트업 업스테이지가 사전학습 거대언어모델(LLM) '솔라(Solar)'를 공개했다고 14일 밝혔다.

솔라는 세계 최대 머신러닝 플랫폼 허깅페이스에서 운영하는 '오픈 LLM 리더보드'에서 1위를 차지한 바 있다. 오픈 LLM 리더보드는 개방형 AI 모델의 성능을 측정해 순위를 매기는 웹사이트다. 오픈소스 생성 AI 모델의 바로미터로 꼽힌다.

리더보드에서는 전 세계 500여개 오픈소스 모델들이 추론과 상식 능력, 언어 이해 종합능력 및 환각 현상 방지, 대명사 참조 및 수학 해결 능력 등 6가지 지표의 평균 점수로 경쟁, 공신력 있는 순위가 매겨진다.

솔라는 'Specialized and Optimized Llm and Applications with Reliability'의 약자다. 지난 8월 리더보드 최초로 GPT-3.5의 벤치마크 점수를 넘어 주목받았던 자체 모델을 기반으로 개발됐다.

솔라는 기업이 활용하기 좋은 '프라이빗 LLM'을 위해 작은 크기로 구성된 사전학습 모델이다. 업스테이지의 프라이빗 LLM은 특정 영역에 특화해 구축한 모델로 '세종대왕 맥북 던짐 사건'처럼 기존 LLM의 환각·보안 문제를 해소할 수 있다.

솔라는 리더보드 평가 기준 평균 74.2점을 기록하며 전체 1위를 차지했다. 알리바바의 큐원(Qwen), 메타의 라마2(Llama 2), 미스트랄AI의 미스트랄(Mistral) 사전학습 모델들을 모두 제쳤다. 특히 큐원의 6분의 1 크기임에도 성능이 더 높았다.

업스테이지 관계자는 "다양한 연구를 통해 작은 사이즈의 솔라 모델 성능을 최적화했다"며 "3조개가 넘는 토큰의 우수한 데이터를 통해 107억 매개변수를 완성해 크기와 성능의 최적의 조합으로 모델을 구축했다"고 말했다.

업스테이지는 아마존웹서비스(AWS), 투게터닷에이아이(Together.ai) 등 글로벌 플랫폼과 협력해 글로벌 생성 AI 시장에 본격 진출할 계획이다.

김성훈 업스테이지 대표는 "글로벌 기업보다 좋은 성능의 모델을 공개했다. 솔라가 모두를 위한 모델이 되길 바란다"며 "솔라 모델을 활용해 B2B(기업간거래) 시장에서의 협력도 추진하며 더 큰 격차를 벌릴 것"이라고 했다.

업스테이지  
  • 사업분야IT∙정보통신
  • 활용기술인공지능
  • 업력***
  • 투자단계***
  • 대표상품***


[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']

'업스테이지' 기업 주요 기사

관련기사

이 기사 어땠나요?

이 시각 많이 보는 기사