오픈AI·메타·구글 뛰어넘었다...모레, 한국어 LLM 오픈소스 공개

류준영 기자 기사 입력 2024.12.03 17:00

URL이 복사되었습니다. 원하는 곳에 붙여넣기 해주세요.

공유하기
글자크기
[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

AI(인공지능) 인프라 솔루션 기업 모레(MOREH)가 자체 개발한 한국어 LLM(거대언어모델) 파운데이션 모델(Llama-3-Motif-102B, 이하 Motif)를 AI 개발자 플랫폼인 허깅페이스에 오픈소스로 공개한다고 3일 밝혔다.

모레는 메타가 LLM 라마(Llama)를 오픈소스로 공개한 이후 전 세계 AI 생태계가 빠르게 확장된 것과 같이 고성능 한국어 LLM을 오픈소스로 배포해 한국 AI 생태계 성장에 기여한다는 계획이다. 이를 위해 AI 모델 사업을 본격 추진할 자회사도 설립할 예정이다.

이번에 모레가 공개한 Motif는 1020억 개 매개변수(파라미터)를 가진 한국어 LLM이다. 이는 AI의 전반적인 능력을 한국어 기준으로 평가하는 KMMLU 벤치마크에서 Motif(64.74점)는 오픈AI의 GPT-4(59.95점) 보다 높은 점수를 받았다.

관계자는 "KMMLU 벤치마크의 성능 비교표를 보면 Motif는 메타나 구글, 네이버의 LLM 보다도 뛰어난 한국어 처리 성능을 입증했다"고 설명했다.

Motif는 1870억 개에 달하는 방대한 양의 한국어를 학습했다. 웹상에서 수집 가능한 글뿐만 아니라, 공개된 국내 특허 및 연구보고서 등 전문 분야 문서를 학습 데이터로 활용했다.

모레는 이번 한국어 LLM 개발에 앞서 올해 초 영어 LLM도 선보였다. 700억 개의 매개변수를 가진 거대언어모델인 모레의 'MoMo-70B'은 허깅페이스에서 운영하는 '오픈 LLM 리더보드' 평가에서 77.29점이라는 높은 점수를 받았다.

모레 측은 "영어 LLM 개발 과정에서 얻은 노하우를 바탕으로 더 복잡한 문장을 학습하고, 대화에서 유려한 표현을 만들어내는 Motif를 완성할 수 있었다"고 말했다.

모레는 순수 국내 기술로 만든 최초의 슈퍼컴퓨터 '천둥' 개발 등 국내에서 슈퍼컴퓨팅 분야를 가장 오래 연구한 서울대 매니코어프로그래밍연구단 출신들이 주축이 돼 창업한 회사다. 2020년 9월 설립된 이래 현재 53명의 석박사급 연구진을 포함해 한국과 베트남에 120여 명의 전문 인력이 함께하고 있다.

조강원 모레 대표는 "독보적인 기술력을 바탕으로 끝없는 실험과 개발 여정을 통해 개발한 고성능 LLM을 누구나 활용할 수 있도록 오픈소스로 공개하는 것은 무엇보다 국내 AI 생태계가 보다 발전적인 방향으로 성장하도록 하기 위함"이라며 "우리와 같은 국내 AI 산업 발전을 위해 노력하는 스타트업 등 많은 기업들이 적극 활용해주면 좋겠다"고 말했다.

모레  
  • 사업분야IT∙정보통신
  • 활용기술인공지능, 클라우드
  • 업력***
  • 투자단계***
  • 대표상품***


[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']

'모레' 기업 주요 기사

관련기사

이 기사 어땠나요?

이 시각 많이 보는 기사