'미완' 기술로 구글·메타 꺾었다…'업스테이지 멀티모달' 6월 공개

최태범 기자 기사 입력 2025.04.16 15:30

URL이 복사되었습니다. 원하는 곳에 붙여넣기 해주세요.

공유하기
글자크기

업스테이지 "업무 특화 AI로 글로벌 시장 공략"
6월 자체 LLM '솔라 프로 1.5', OCR 결합한 '솔라 DocVLLM' 공개

[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

김성훈 업스테이지 대표 /사진=업스테이지 제공
김성훈 업스테이지 대표 /사진=업스테이지 제공
"AI(인공지능)를 통해 인류가 일하는 효율성이 5배, 10배, 100배 올라갈 수 있다. 압도적인 AI 기술력을 바탕으로 일하는 방법의 새로운 표준을 만들어 갈 것이다. 이는 한국에만 그치는 게 아니라 동남아시아·일본을 넘어 미국까지 글로벌로 확장하겠다."

김성훈 업스테이지 대표는 16일 서울 여의도 콘래드 호텔에서 미디어데이를 갖고 "업무용 AI를 통해 글로벌 AI 업무 표준을 주도해 나가 '일의 미래(Future of Work)'를 앞당길 것"이라며 이같이 말했다.

업스테이지는 홍콩과학기술대학 컴퓨터 공학부 교수이자 네이버 클로바 AI 헤드 출신인 김성훈 대표가 2020년 10월 설립한 스타트업이다. 시리즈A 라운드에서만 316억원, 시리즈B에서 1000억원 등 대규모 투자를 유치하며 IT 업계의 주목을 받았다.

특히 'AI 올림픽'으로 불리는 캐글(Kaggle) 대회에서 매번 금메달을 휩쓸어 업계 내에선 '국가대표 AI 기업'으로 불린다. 광학문자판독(OCR) 분야 최고 권위의 대회에서 아마존·엔비디아 등 글로벌 빅테크를 제치고 1위를 기록하는 등 기술력을 뽐냈다.


"오픈AI 필적하는 첫 추론 모델 공개"


업스테이지의 미디어 데이 현장 /사진=최태범 기자
업스테이지의 미디어 데이 현장 /사진=최태범 기자
업스테이지는 △AI 기반 OCR 문서 처리 기술 '다큐먼트 파스(DP)' △자체 개발한 LLM(거대언어모델) '솔라'를 통해 각 산업별 AI 전환을 가속화하고 업무 프로세스에 새로운 표준을 제시한다는 목표다.

DP는 복잡한 문서 구조를 분석해 정형화된 파일로 전환하는 차세대 OCR 모델이다. 김 대표는 "다단으로 구성된 사람이 읽기 좋게 만들어진 문서를 AI가 이해하기엔 어려웠지만 DP는 100% 정확하게 요약하고 정보를 추출해 답할 수 있다"고 했다.

솔라도 지속적으로 고도화 중이다. 업스테이지는 오는 6월 기존 220억(22B) 매개변수에서 330억 규모로 확장한 '솔라 프로 1.5' 버전과 함께 오픈AI의 'o 시리즈', 딥시크의 'R1' 모델에 필적하는 '생각 사슬(CoT)'을 구현한 첫 추론 모델을 공개할 예정이다.

김 대표는 "OCR부터 LLM까지 풀스택 AI 모델을 모두 자체 개발한 기업은 전세계적으로도 드물다. 어떤 형태의 문서도 AI 학습용 데이터로 전환할 수 있는 DP와 솔라를 앞세워 국내 AI 업무의 표준을 정립하고 이를 글로벌 시장으로 확산시키고 있다"고 했다.


문서 분야 멀티모달 엔진 1등 목표


OCR과 LLM을 통합한 멀티모달로도 확장을 도모한다. 6월 공개 예정인 비전언어모델(VLM) '솔라 DocVLLM'은 DP와 솔라를 결합해 정보 요약, 질의응답, 보고서 자동 작성 등 문서 기반의 다양한 LLM 작업을 단일 플랫폼에서 처리할 수 있다.

이 모델은 테스트 결과 메타의 '라마 4 스카우트', 구글의 '제미나이 2.5 프로' 보다 정확도가 높은 것으로 나타났다. 김 대표는 "멀티모달이 만들어지면 각각의 정보를 나눠서 하지 않고 통째로 할 수 있기 때문에 더 빠르고 정확한 일을 할 수 있다"고 말했다.

이어 "기존 모델은 텍스트만 입력할 수 있었지만 멀티모달에서는 이미지와 음성을 줄 수 있고 그것을 인식해 텍스트로 나온다"며 "업스테이지는 특히 문서를 특출나게 처리하는 모델을 만들고 있다. 문서에 목숨을 걸었고 문서 분야에서 1등을 할 것"이라고 덧붙였다.

개발 도중에 성능 평가한 결과가 메타·구글의 기술을 앞섰다는 점이 주목된다. 김 대표는 "문서 100장 이상을 동시에 읽기 위한 인코드를 완전히 새롭게 설계했다. 기존 멀티모달 엔진들은 몇 페이지만 줘도 벅차지만 지금 기준으로 우리는 20장까지 읽어도 무리가 없다"고 했다.


일본 진출 본격화…"현지서도 통할 것"


/사진=업스테이지 제공
/사진=업스테이지 제공
업스테이지는 글로벌 확장에도 속도를 낸다. 태국에 태국어 특화 LLM을 공급하며 국내 최초의 해외 소버린 AI 구축 사례를 만들었다. 또 미국에 이어 지난 3월 일본 도쿄에 현지 사무소를 개소하고 현지 특화 LLM 개발 및 파트너십 확대를 추진 중이다.

마츠시타 히로유키 업스테이지 일본 법인장은 "일본의 AI 솔루션 시장은 2030년 17조원 규모로 성장이 예상된다. 업스테이지의 기술력은 일본 시장에서도 성공할 것"이라며 "문서 처리 기술과 소형언어모델을 기반으로 현지 맞춤형 전략을 강화해 시장을 선도하겠다"고 했다.

김성훈 대표는 "생성형 AI의 발전으로 산업 전반의 업무 방식이 근본적으로 재편되고 있지만 여전히 많은 부분은 사람이 하고 있다"며 "국내 약 2900만 경제활동인구의 업무생산성이 단 1%만 향상돼도 연간 약 14조원 규모의 경제적 효과를 창출할 수 있다"고 말했다.

이어 "올해는 AI가 거의 모든 영역에서 인간을 넘어서는 해가 될 것"이라며 "업스테이지의 AI는 사람을 대체하는 게 아니라 더 가치 있는 일에 집중할 수 있도록 해 더 나은 일의 미래를 만드는 기술이다. 고성능 엔진을 기반으로 일의 미래를 만들어가는 데 집중하겠다"고 했다.

업스테이지  
  • 사업분야IT∙정보통신
  • 활용기술인공지능
  • 업력***
  • 투자단계***
  • 대표상품***


[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']

'업스테이지' 기업 주요 기사

관련기사

이 기사 어땠나요?

이 시각 많이 보는 기사