[MT리포트-국산AI '골든타임']
오픈AI의 '챗GPT'(생성형 AI)를 시작으로 구글·메타 등의 초거대 AI(인공지능) 플랫폼이 한국 시장을 공략한다. 이에 맞서 국내 기업들도 독창적인 기술력을 내세워 승부수를 띄웠다. 우리 정부와 민간의 지원도 단단하다. 미래 사회의 중추기술인 AI 주도권을 글로벌 빅테크(대형 IT기업)에 내주면 '디지털기술 주권'을 잃을 수 있다는 우려가 나오면서 국산 초거대 AI의 '골든타임'을 지키려는 각계의 노력을 조명한다.
[단독]"국산AI, 우리 기업이 활용해야"…금융사 나섰다
①KB금융, 네이버 '하이퍼클로바X' 활용 검토
KB금융 (98,400원 ▲1,100 +1.13%)이 그룹의 금융 특화 생성형AI(인공지능) 모델·서비스 개발 과정에서 네이버의 '하이퍼클로바X' 활용을 검토한다. 연초부터 국내 기업들이 앞다퉈 오픈AI의 챗GPT를 채택하는 가운데 KB금융은 앞으로 선보일 국산 AI 모델들도 폭넓게 살펴본다는 전략이다.
5일 금융권에 따르면 윤종규 KB금융지주 회장은 지난달 말 네이버(NAVER (190,000원 ▲300 +0.16%))의 초거대 AI 기초모델 ‘하이퍼클로바X’의 공개를 앞두고 그룹의 AI 관련 실무진에 '네이버를 포함한 국산 AI모델의 활용도 적극 검토해 보라'고 주문했다.
하이퍼클로바X는 네이버가 2021년 5월 선보인 '하이퍼클로바'를 고도화한 초거대 AI다. 오픈AI의 'GPT', 구글의 '팜2', 메타의 '라마' 등 글로벌 빅테크가 이끄는 시장에서 국산 AI로 승부를 보겠다는 야심작으로 지난달 24일 공개됐다.
앞서 KB국민은행은 생성형AI를 적용해 업무 생산성을 높이는 자체 플랫폼 'KB-GPT' 시범 사이트를 지난 4월 오픈했다. 챗GPT의 금융 비즈니스 적용 가능성을 검토하는 PoC(기술실증) 단계다. KB금융 관계자는 "(윤 회장의 주문에) 오픈AI와 네이버 뿐만 아니라 국내외를 가리지 않고 서비스 적용이 가능한 AI 모델을 모두 활용해 PoC를 하는 게 기본 방침"이라고 설명했다.
한국은 미국·중국·이스라엘과 함께 자체 초거대AI를 보유한 4개국 중 하나다. 하지만 오픈AI 등에 비해 후발주자고, 투자 규모 면에서도 밀린다. 챗GPT는 버전업에만 4조~5조원을 쏟아부었다. 네이버는 2017년부터 지금까지 초거대AI 개발에 1조원을 투자했다. 그럼에도 국내 기업들은 성능 면에선 밀리지 않겠다는 자신감을 피력한다. 네이버를 비롯해 LG (76,800원 ▲600 +0.79%)(엑사원 2.0)와 엔씨소프트 (216,500원 ▲3,500 +1.64%)(바르코)는 이미 특화 초거대AI 모델을 선보였고, KT (44,500원 ▲500 +1.14%)와 카카오 (36,050원 ▲900 +2.56%) 등도 연내 독자 모델 공개를 예고했다. SK텔레콤 (57,200원 ▲900 +1.60%)은 '에이닷' 기반의 상용화 서비스를 준비 중이다.
챗GPT 등장 이후 세계적인 AI생태계 선점경쟁에서는 일단 오픈AI와 구글이 앞선 모양새지만, '절대 강자'로 불릴 만큼의 플레이어는 아직 등장하지 않았다. 세계 검색시장을 차지한 구글, '윈도'로 PC 운영체제(OS)를 지배하는 마이크로소프트(MS), 스마트폰 OS를 양분한 애플과 구글처럼 시장의 주도권을 글로벌 빅테크에 내주면 회복하기 어렵다는 게 관련 업계의 우려다.
이에 우리 기업과 정부를 비롯한 각계의 국산 AI에 대한 지원이 필요하다는 목소리가 나온다. 윤 회장이 국산 초거대AI 모델의 활용에 특별히 관심을 쏟은 것도 같은 맥락이다. 그는 AI가 미래를 바꿀 핵심 전략기술인 만큼 '금융권을 포함한 우리 산업계가 후발주자인 국산 AI모델에도 충분한 기회를 제공해야 한다'는 지론을 평소 지인들에게 밝혀 온 것으로 알려졌다.
KB금융 외에도 챗GPT 등 해외 생성형 AI를 활용해 PoC 단계를 마친 금융지주사는 여럿이다. 이들도 국내 개발 초거대 AI의 가능성을 눈여겨 보고 있다. 금융업계 관계자는 "생성형 AI 활용을 준비 중이지만 아직 실용화하기에는 넘어야할 과제가 많다"며 "국내 기업이 개발한 생성형 AI도 PoC 를 검토 중"이라고 말했다.
"독도는 분쟁지역?"…토종 AI, 주권도 비밀도 지킨다
② 데이터 외부유출 및 비용문제 해결
글로벌 생성형 AI(인공지능) 대전이 B2B(기업간거래) 시장으로 확전했다. 오픈AI와 구글은 보안과 학습 문제를 해결한 기업용 생성형 AI 서비스를 출시하며 본격적인 수익화에 나섰다. 이에 국내 ICT(정보통신기술) 기업 긴장감도 커진다.
5일 업계에 따르면 네이버클라우드는 국내 기업 대상으로 오는 10월 출시되는 '뉴로클라우드' 영업에 나선다. 외산 생성형 AI의 공세 속에 한국 기업의 사정을 가장 잘 아는 서비스로 차별화한다. 뉴로클라우드란 클라우드와 온프레미스(On-premise·자체구축형)를 결합한 서비스로, 고객사 데이터센터에 서버 인프라를 직접 설치해 차세대 LLM(초거대언어모델) 하이퍼클로바X를 편하게 이용하되 민감정보의 외부 유출을 원천 차단한 게 특징이다.
앞서 오픈AI는 GPT-4로 기업용 챗GPT를 만들 수 있는 '챗GPT 엔터프라이즈'를 출시했다. 소비자용 유료 챗GPT보다 최대 2배 빠르게 4배 긴 문서를 처리한다. 기업 데이터를 학습시켜 맞춤형 AI 챗봇을 만들되, 모든 데이터와 대화는 암호화해 오픈AI가 활용하지 않는다. 구글도 다양한 LLM으로 기업별 생성형 AI를 만들 수 있는 '버텍스AI'를 고도화하며 "기업 데이터는 비공개로 유지된다. 데이터 저장위치와 사용여부·방식도 투명하게 확인할 수 있다"고 못 박았다.
기업이 생성형 AI를 쓰는 데 걸림돌이었던 학습·보안 문제를 해결했다는 설명이다. 이에 따라 생성형 AI를 도입하려는 기업도 급증할 전망이다. 이미 미국 경제전문지 포천이 선정한 글로벌 500대 기업(매출액 기준)의 80% 이상이 챗GPT를 이용 중이다.
국내에서도 관심이 뜨겁다. 한 IT업계 관계자는 "대다수의 금융사가 생성형 AI 도입을 위한 내년 예산을 대거 편성해 이를 잡기 위한 경쟁이 치열하다"고 귀띔했다. 자칫 B2B 시장마저 외산 생성형 AI에 주도권을 뺏기는 것 아니냐는 우려도 나온다.
그러나 전문가들은 여전히 국산 생성형 AI의 강점이 크다고 입을 모은다. 하정우 네이버클라우드 AI이노베이션 센터장은 "금융사를 비롯해 대부분의 기업은 데이터를 해외 클라우드에 올리는 것 자체를 꺼린다"라며 "외산 기업용 생성형 AI에 대한 우려가 근본적으로 해결되지 않았다"라고 꼬집었다. 이주열 LG CNS 수석연구위원도 "기업 데이터가 한국 영토를 벗어나는 건 크리티컬한 이슈"라며 "LLM을 온프레미스로 구축하는 사업을 강화할 예정"이라고 말했다.
"독도는 분쟁지역"이라는 외산 AI, 국방·국력 문제 될라 고가의 비용도 난제다. LLM은 '토큰'(AI가 인식하는 문자 데이터 단위) 단위로 과금하는데, 영어보다 한국어 사용 시 더 많은 토큰이 필요하다. 예컨대 3만2000개 토큰을 지원하는 챗GPT 엔터프라이즈는 영어로 2만5000단어를 쓸 수 있는 반면, 한글은 1만2800자에 그친다. 이 때문에 같은 양의 문서 처리 시 국내기업이 영어권보다 2배 비싼 사용료를 내면서도 속도는 더 느리다.
한국어에 최적화된 LLM이 필요한 이유다. 오픈AI가 운영하는 토크나이저에 따르면 GPT-3는 'That's OK' 9글자를 토큰 3개로 인식하지만 한글 '괜찮아'는 3글자인데도 9개 토큰을 쓴다. 자음과 모음을 모두 토큰으로 분류했다. 반면 한국어에 익숙한 국산 LLM은 띄어쓰기나 음절·형태소를 기준으로 토큰화해 비용이 훨씬 줄어들 수 있다. 단, 기업이 이용한 만큼 과금하는 클라우드 방식과 달리 온프레미스로 구축했을 때 구축비가 더 들 수는 있다.
구글·애플이 모바일 운영체제(OS) 시장지배력을 활용해 모든 앱 사업자에 영향력을 행사하듯, 글로벌 빅테크에 종속되지 않으려면 AI 주권을 확보해야 한다는 목소리도 있다. 서구문화 중심의 생성형 AI가 한국의 문화적 정체성을 약화할 수 있다는 지적도 나온다. 챗GPT는 독도에 대해 "한국·일본이 소유권 분쟁을 벌이는 지역"이라고 답하지만, 네이버 클로바X는 "한국 영토"라고 확답하는 게 대표적이다.
이에 대해 이광형 카이스트 총장은 최근 포럼에서 "AI는 독도를 일본 땅이라 하고 선생님은 한국 땅이라 하면 어린이들이 헷갈릴 것"이라며 "AI는 주권이자 국방, 국력과 직결된다. AI를 만든 국가의 지배를 받지 않으려면 한국형 AI를 육성해야 한다"고 강조했다.
'거시기' 알아 들을까?…네카오, 특화 서비스로 해외AI 넘는다
③공룡 빅테크 넘어라…국산AI '특화' 어떻게
국내 기업들의 초대형 AI(인공지능) 개발 경쟁에 가속도가 붙었다. 네이버(NAVER (190,000원 ▲300 +0.16%))가 하이퍼클로바X를 최근 발표한데 이어 카카오브레인이 올 4분기 중 기존 한국어 기반 AI 언어모델 KoGPT를 업데이트한 버전을 내놓는다. 전문 SW(소프트웨어) 기업이 아닌 곳들까지도 자체 초거대 AI모델 및 AI를 접목한 서비스 개발에 착수했다. 방대한 학습량에 의존한 해외 AI모델과 달리 한국어와 한국적 맥락, 실생활에 밀접하게 연계된 서비스가 국산AI 모델의 강점이 될 것이란 전망이 나온다.
LG·네이버·SKT·엔씨 등 출격…카카오·KT 등도 대기 LG AI연구원은 지난 7월 자체 개발 엑사원의 업그레이드 모델인 '엑사원 2.0'을 공개했다. 4만5000여건의 전문 문헌과 3억5000만장의 이미지를 학습한 것이 특징이다. 기존 엑사원 모델 대비 처리 시간이 25% 줄고 메모리 사용량도 70% 줄어드는 등 총 비용이 78% 줄었다는 게 LG AI연구원 측 설명이다.
네이버는 지난 달 기존 '하이퍼클로바'를 고도화한 '하이퍼클로바X'와 이를 활용한 사업모델을 소개했다. 챗GPT 대비 한국어 학습규모가 6500배에 이르는 등 외국 AI 모델에 비해 한국어 및 한국의 사회·문화적 배경을 훨씬 자세하고 정확하게 이해하는 모델이라는 점에서 눈길을 끌었다. 네이버는 하이퍼클로바X와 함께 검색 서비스인 'CUE:(큐)'를 비롯해 사용자·창작자용 솔루션, 판매자·광고주·기업용 솔루션 등을 잇따라 공개했다.
SK텔레콤 (57,200원 ▲900 +1.60%)은 자체 AI 브랜드 '에이닷'(A.)을 기반으로 도이치텔레콤, 싱텔 등 글로벌 텔코(통신사)들과 'AI 얼라이언스'를 결성하고 '텔코 AI 플랫폼'을 공동 개발해 AI와 통신 서비스를 접목한 솔루션을 내놓는 데 주력하고 있다.
엔씨소프트 (216,500원 ▲3,500 +1.64%) 역시 초거대 AI '바르코 LLM(대형언어모델)'을 공개했다. '바르코 스튜디오'라는 브랜드로 이미지, 텍스트, 디지털휴먼을 생성할 수 있도록 한 것을 비롯해 '바르코 LLM'을 게임 외에도 금융, 바이오, 교육 등 산업에 적용할 수 있도록 하겠다는 게 엔씨소프트의 포부다.
예고된 솔루션들도 많다. 카카오브레인은 올 4분기 KoGPT 2.0을 공개한다. 기존 KoGPT와 칼로(Karlo) 등 생성형 AI를 고도화한 버전이다. 기존 60억개 수준인 파라미터를 대폭 늘리고 여타 카카오 서비스와 접목한 AI 모델이 나올 것이라는 기대감이 나온다.
KT (44,500원 ▲500 +1.14%)는 이르면 10월 말 자체 개발 초거대 AI '믿음'을 내놓는다. 국내 최다 IDC(인터넷데이터센터)를 보유한 KT클라우드를 기반으로 AI반도체 전문기업 '리벨리온', AI소프트웨어 스타트업 '모레' 등과 파트너십을 체결해 기업들이 AI를 원하는 만큼 사용할 수 있도록 하는 풀스택(Full Stack) 서비스를 '믿음'(Mi:dm)이라는 브랜드로 제공하겠다는 것이다. 특히 공공·금융 등 높은 보안성을 요구하는 고객군에도 적용할 수 있는 보안성을 구축한 점 등이 장점이다.
국산AI의 무기는 '한국어'와 '서비스' 오픈AI의 챗GPT 출현 후 MS(마이크로소프트)가 자사의 주요 솔루션에 AI 기술을 접목하기로 하면서 국내외 빅테크들의 생성형 AI 경쟁이 가속화되고 있다. 구글, 메타, 아마존, 화웨이, 바이두 등이 파라미터(매개변수) 1조개 이상의 초대형 AI를 잇따라 내놨다. 국내 AI모델 개발사들에 비해 압도적인 학습량을 갖춘 모델들이다.
국산 AI는 다른 강점이 있다. 최승호 상상인증권 연구원은 최근 AI산업 전망 보고서를 통해 "우리가 플랫폼을 이용할 때 중요한 것은 플랫폼이 제공하는 데이터와 서비스"라며 "그걸 가장 잘 모아놓은 사이트가 네이버와 다음(카카오)이고 지난 23년간 누적된 UGC(이용자 생성 콘텐츠)는 국내 플랫폼들이 가지는 강력한 이점"이라고 했다.
그는 "코딩 등 복잡한 추론을 요구하는 수요에는 글로벌 LLM 기반 AI가 매력적인 선택지일 수 있다"며 "전문 데이터의 언어는 대부분 영어로 구성돼 있어 영어 데이터를 많이 학습한 글로벌 LLM에 우위가 있다"고 했다.
하지만 국내 생성형 AI에도 기회가 있다고 강조한다. 최 연구원은 "맛집찾기, 여행추천, 렌터카 예약 등 일상적 질문에서는 한국어 정보와 UGC, 한국 로컬기업과 제휴돼 있는 한국형 생성형 AI가 이점을 취할 가능성이 높다"며 "(전문적 데이터의 경우도) 국내 역사, 국내 학계 연구 등 한국어 데이터가 더 많은 경우는 국내 생성형 AI가 유리하다"고 했다.
'생성형AI' 후발주자 日·中, 어떻게 구글·MS에 맞서나
④'美 빅테크 추격'…日·中, 초거대AI 육성전략
오픈AI 챗GPT와 구글 바드 등 미국 IT기업들이 전 세계 생성형AI(인공지능)의 선두 싸움을 벌이는 동안 일본과 중국 등 후발주자들은 이들을 따라잡기 위해 속도를 내고 있다. 특히 마이크로소프트를 등에 업은 챗GPT나 공룡 구글과의 정면 승부를 택하기보다는, 비(非)영어권인 자국의 특성에 맞춘 서비스와 개별 산업군별로 특화된 모델을 내세우는 '틈새전략'을 추진한다.
일본 "일본어·기업 맞춤형 서비스로 승부" 5일 업계에 따르면 최근 NTT, 소프트뱅크 등 일본 기업들은 생성형 AI를 독자 개발하려는 움직임이 활발하다. 공통점은 일본어 대응력이 뛰어나고 금융 등 전문 분야에 특화한 모델을 개발해 일본 기업들이 즉시 현업에 활용할 수 있는 모델을 추구한다는 점이다.
요시자키 토시후미 NEC CDO(최고디지털책임자)는 지난 7월 6일 생성형 AI 설명회에서 "일본 시장용으로 전문성이 높은 생성형 AI를 제공할 것"이라고 밝혔다. NEC는 이를 위해 독자 LLM(거대언어모델)을 개발해 일본어 문장 이해력을 높였다. 일본 정보통신연구기관(NICT)은 챗GPT-3에 필적하는 양을 학습한 일본어 모델을 개발하는 중이다.
NTT는 오는 11월 금융·의료 등 전문분야에 특화한 생성형AI를 공개할 예정이다. 소프트뱅크 '거래처 기업'들의 업무에 특화된 생성형AI를 개발하고 있다. 미야카와 준이치 소프트뱅크 사장은 지난 6월 정기주총에서 "현 시점에서 오픈AI를 따라잡을 수 있다고는 생각하지 않는다"면서도 "각각의 서비스에 맞는 AI를 제공하면 된다"고 추진 방향을 밝혔다.
증국 "빅테크가 앞장서고 원천기술로 뒷받침" 지난 5월 베이징에서 열린 '2023 중관춘(中關村) 포럼'에 따르면 현재 베이징, 상하이 등 중국 14개 지역에서는 자체 파운데이션 모델을 만들기 위한 작업이 한창이다. 베이징(38개)과 광둥성(20개)에 프로젝트가 집중돼 있다.
바이두, 텐센트 등 중국의 글로벌 빅테크 기업들은 개별 분야에서 유의미한 모델들을 내놓고 있다. 바이두는 지난 3월 자체 AI대화 엔진 '플라토3'를 기반으로 한 챗봇 '어니봇'을 통해 그동안 쌓아온 AI기술력을 선보였다. 텐센트는 질병세포 등에 대한 현미경 판독을 사람이 아닌 AI가 대신하는 '줴우 강화학습 병리학자'를 공개했다.
중국의 생성형AI 산업을 뒷받침하는 것은 활발한 기초연구다. 중국 정보통신연구원에 따르면 지난해 중국이 신청한 AI 관련 글로벌 특허는 25만여건이다. 전 세계 AI특허 신규신청에서 중국이 차지하는 비중은 2012년 13%에서 지난해 60%까지 늘었다. 2013~2022년 전 세계에서 나온 100만여건의 AI 논문 중 28%를 중국인이 썼다.
투자부터 선제적 저작물 유권해석까지 지원 중국과 일본은 독자적인 생성형AI 개발에 정부가 전폭적인 지원에 나서고 있다. 중국은 2021년 3월 양회에서 통과된 '제14차 5개년(2021~2025년) 계획 및 2035년 장기 목표'에서 2035년까지 확보할 7대 첨단과학기술 중 으뜸으로 AI를 지정했다. 상하이시는 올해 5월부터 AI 프로젝트 건당 최대 1억위안(약 181억원)의 보조금을 지급한다. 베이징시도 지난 5월부터 생성형AI 등의 연구프로젝트에 2년간 각 6000만위안(108억원)을 주기로 했다. 또 관내 클라우드 공급업자들이 AI 스타트업 등에게 컴퓨팅 파워를 제공하라고 지시했다.
일본 총무성은 내년도 예산을 편성하면서 생성형AI 등의 개발 촉진에 589억엔(약 5400억원)을 요청했다. 일본어 중심 학습용 데이터 기반을 마련하고, 이를 민간기업에 개방할 방침도 밝혔다.
또한 일본 문화청은 최근 AI 개발 단계에서 저작물을 학습용 데이터로 활용하는 경우 저작권자의 허락 없이도 이용할 수 있다는 유권해석을 내려 관련 기업들의 활로를 뚫어줬다. 향후에도 발생할 생성형AI 관련 저작권 논란을 미연에 방지하기 위해 지속적으로 세미나를 열고 업계의 논점을 선제적으로 정리한다는 방침이다.
韓 정부 '초거대AI' 밀어주지만…"활용 위한 정책 지원은 부족"
⑤'국산AI 육성' 정부의 청사진은
'챗GPT' 등장으로 AI(인공지능)의 새로운 패러다임이 열리면서 한국 역시 새로운 도약 필요성이 대두되고 있다. 주무 부처인 과학기술정보통신부는 '초거대AI'를 구동하기 위한 AI반도체, 클라우드 등 생태계 조성에 나서고 있다. 그러나 이는 개발 환경 지원에 치중됐을 뿐, 국산 AI 파운데이션 모델 활용에 대한 지원책은 부족하다는 지적이 나온다.
과기정통부는 지난 4월 '초거대AI 경쟁력 강화방안'을 발표하고 초거대 AI를 미래 전략산업으로 육성하기 위해 올해 3901억원을 투입한다고 밝혔다. 초거대AI 플랫폼을 구축, 글로벌 시장을 공략하고 초거대 AI 응용 서비스 분야 세계 1위를 노린다는 목표다.
먼저 양질의 텍스트 데이터를 대규모로 확충한다. 분야별 특화 학습용 데이터와 비영어권 시장 공략을 위한 동남아·중동 등 언어 데이터를 2027년까지 200종(책 15만권 분량) 구축하고, 한국어 성능 향상을 위해 고품질 말뭉치와 한국어 응용말뭉치도 130종을 구축한다. AI반도체 기반 고성능·저전력 K-클라우드를 초거대 AI가 활용할 수 있도록 AI 반도체 소프트웨어와 데이터 가속처리 하드웨어도 개발한다.
초거대 AI 산업혁신 생태계 조성에도 힘쓴다. 우선 민간·공공영역에 초거대 AI를 선도적으로 접목한다. 법률, 의료, 예술 등 민간 전문영역에 초거대 AI를 접목, 전문가의 업무를 보조하는 '초거대 AI 5대 플래그십 프로젝트'를 추진한다. 공공기관의 내무업무와 대민서비스 등을 효율화하는 초거대 AI 응용서비스도 개발한다. 더불어 민간 차원의 투자, 신서비스 창출 등 협력 강화를 위한 '초거대 AI 협의회'를 구성하고, 전문인재 양성 및 국민의 초거대 AI 리터러시를 강화한다.
하지만 이는 AI 개발 환경 지원에 치중돼 있어 국산 AI 파운데이션 모델 활용의 정책적 지원은 여전히 부족하다는 주장이 있다. 파운데이션 모델이란 텍스트, 이미지, 음성, 영상 등으로부터 입력된 내용을 학습하고 새 데이터를 생성할 때 근간이 되는 AI를 의미한다. 네이버 '하이퍼클로바X', 카카오 '코GPT', KT '믿음', SK텔레콤 '에이닷', LG '엑사원' 등이 대표적이다.
이는 정부도 공감하는 바다. 박윤규 과기정통부 2차관은 최근 미디어데이에서 '하이퍼클로바X'에 대해 "그간 챗GPT 등에서 발견된 문제점들을 해결하고 진보된 모델이길 희망한다"면서도 "민간기업의 발표나 비즈니스를 적극적으로 지원하고, 정책적으로 호응할 부분들이 있는지 고민하고 있다"고 말했다.
아울러 전문가들은 국산 초거대AI 파운데이션 모델의 활용 확대를 위한 정부의 역할이 어느 때보다 중요하다고 입을 모은다. 김주호 KAIST(카이스트) 전산학부 교수는 "처음엔 파운데이션 모델 성능을 높이는 데 집중하지만 실질적인 가치나 성과를 내려면 어딘가에 적용되고 임팩트를 내야한다"며 "다양한 분야의 적용을 돕기 위해서는 원천기술 등 별도의 기술들이 필요한데, 그런 부분에 대한 정부의 정책 지원 등은 아직 부족한 거 같다"고 했다.
다만 일각에선 정부 개입이 아닌 민간차원에서 해결해야 한다는 입장도 있다. 유병준 서울대 경영학과 교수는 "국내외 기업의 경쟁이 있는 상태에서 국내 기업만을 위한 지원책을 내놓을 수는 없을 것"이라며 "특히 파운데이션 모델은 대기업 분야니까 민간부분에서 해결하되 정부의 지원이 꼭 필요한 부분이 있으면 모색 방안이나 의견이 나오지 않을까"라고 말했다.
"국산AI 키우려면…'성공률 높은' 일거리 줘야"
⑥인터뷰-고진 디지털플랫폼정부위원회 위원장
고진 디지털플랫폼정부위원회 위원장은 최근 서울 광화문 집무실에서 만나 국산 초거대AI 육성을 위한 과제로 "많은 일거리"를 첫손에 꼽았다.
일례로 네이버(NAVER (190,000원 ▲300 +0.16%))는 초거대AI 기본모델 '하이퍼클로버X' 개발에 2017년 이후 1조원 이상을 투자했다. 글로벌 빅테크에 비해선 적지만, 네이버의 연간 영업이익(지난해 기준 1조3047억원)을 오롯이 단일 사업에 쏟아붓는 셈이다. 다른 기업도 비용 부담은 마찬가지다. GPU 등 AI 관련 컴퓨팅 자원의 가격 급등으로 국내 대기업도 머지않아 한계에 부닥칠 수 있다.
고 위원장은 "결국 국산AI가 폭넓게 활용돼야 (수익을 올려야) 개발 비용을 감당할 수 있다"고 강조했다. 다만 "성공 가능성이 높은 일거리가 중요하다"고 강조했다. 이어 "정제된 데이터와 우수한 인적자원이 뒷받침하는 과제, 그에 부합하는 공공부문의 발주가 핵심"이라고 강조했다.
위원회와 과학기술정보통신부는 내년 정부 전용 초거대AI를 구축할 계획이다. 공공 부문의 데이터를 초거대AI가 학습해 정부 업무의 이해도가 높은 AI를 구현하는 것으로, 복수 민간 기업의 초거대AI 인프라를 활용한다. 네이버, LG (76,800원 ▲600 +0.79%), KT (44,500원 ▲500 +1.14%), SK텔레콤 (57,200원 ▲900 +1.60%), 카카오브레인 등이 도전할 전망이다.
고 위원장은 "국가 보안과 연관 있는 데이터, 또는 국민의 개인정보 데이터까지 포함해 정부가 보유한 민감 데이터를 학습하기 위한 정부 전용 초거대AI"라고 설명했다. 아무래도 글로벌 빅테크의 초거대 AI에 맡기기는 어려운 영역이다. 아울러 정부는 중소·벤처기업과 공공기관, 지방자치단체 등이 초거대AI를 주요 업무에 접목해 볼 수 있도록 '민간의 초거대 AI 활용지원 사업'도 추진 중이다.
고 위원장은 민간 기업들과 함께하는 정부 전용 초거대AI의 수출 모델도 제시했다. 고 위원장은 "민관 협력으로 현 정부 임기 내 공공부문의 생산성 향상 성과가 가시화될 것"이라며, 성과가 명시적인 숫자로 표시된다면 한국형 정부 AI 모델 수출의 물꼬를 틀 수 있다고 봤다. 주요 타깃은 중동을 비롯한 아시아권의 자체 언어를 쓰는 국가들이다. 자체 초거대AI를 보유한 미국·중국·이스라엘 등은 정치적 배경의 제약과 더불어 기술 및 운영 노하우 이전에 소극적인 데 반해 한국은 그렇지 않다는 게 그들의 판단이다.
고 위원장은 "초거대AI 모델의 수출은 구축 뿐만 아니라 파인튜닝(미세조정)과 뒤따르는 애플리케이션, 클라우드 등 AI생태계 참여자들과 함께 해야 한다"며 "관련 민간 기업들과 함께 우리의 초거대AI 생태계 자체를 수출하고, 그렇게 진출한 기업들은 글로벌 시장에서 새로운 비즈니스 기회를 창출할 수 있을 것"이라고 내다봤다.
이와 함께 고 위원장은 국산 초거대AI 육성을 위한 또 다른 핵심 과제로 데이터 관련 법·제도의 확립을 강조했다. 그는 "개인정보 및 저작권 이슈는 앞으로 초거대AI 활용이 확산될수록 점점 더 심각하게 제기될 수 있는 문제"라고 말했다.
[단독]"국산AI, 우리 기업이 활용해야"…금융사 나섰다
①KB금융, 네이버 '하이퍼클로바X' 활용 검토
KB금융 (98,400원 ▲1,100 +1.13%)이 그룹의 금융 특화 생성형AI(인공지능) 모델·서비스 개발 과정에서 네이버의 '하이퍼클로바X' 활용을 검토한다. 연초부터 국내 기업들이 앞다퉈 오픈AI의 챗GPT를 채택하는 가운데 KB금융은 앞으로 선보일 국산 AI 모델들도 폭넓게 살펴본다는 전략이다.
5일 금융권에 따르면 윤종규 KB금융지주 회장은 지난달 말 네이버(NAVER (190,000원 ▲300 +0.16%))의 초거대 AI 기초모델 ‘하이퍼클로바X’의 공개를 앞두고 그룹의 AI 관련 실무진에 '네이버를 포함한 국산 AI모델의 활용도 적극 검토해 보라'고 주문했다.
하이퍼클로바X는 네이버가 2021년 5월 선보인 '하이퍼클로바'를 고도화한 초거대 AI다. 오픈AI의 'GPT', 구글의 '팜2', 메타의 '라마' 등 글로벌 빅테크가 이끄는 시장에서 국산 AI로 승부를 보겠다는 야심작으로 지난달 24일 공개됐다.
앞서 KB국민은행은 생성형AI를 적용해 업무 생산성을 높이는 자체 플랫폼 'KB-GPT' 시범 사이트를 지난 4월 오픈했다. 챗GPT의 금융 비즈니스 적용 가능성을 검토하는 PoC(기술실증) 단계다. KB금융 관계자는 "(윤 회장의 주문에) 오픈AI와 네이버 뿐만 아니라 국내외를 가리지 않고 서비스 적용이 가능한 AI 모델을 모두 활용해 PoC를 하는 게 기본 방침"이라고 설명했다.
한국은 미국·중국·이스라엘과 함께 자체 초거대AI를 보유한 4개국 중 하나다. 하지만 오픈AI 등에 비해 후발주자고, 투자 규모 면에서도 밀린다. 챗GPT는 버전업에만 4조~5조원을 쏟아부었다. 네이버는 2017년부터 지금까지 초거대AI 개발에 1조원을 투자했다. 그럼에도 국내 기업들은 성능 면에선 밀리지 않겠다는 자신감을 피력한다. 네이버를 비롯해 LG (76,800원 ▲600 +0.79%)(엑사원 2.0)와 엔씨소프트 (216,500원 ▲3,500 +1.64%)(바르코)는 이미 특화 초거대AI 모델을 선보였고, KT (44,500원 ▲500 +1.14%)와 카카오 (36,050원 ▲900 +2.56%) 등도 연내 독자 모델 공개를 예고했다. SK텔레콤 (57,200원 ▲900 +1.60%)은 '에이닷' 기반의 상용화 서비스를 준비 중이다.
챗GPT 등장 이후 세계적인 AI생태계 선점경쟁에서는 일단 오픈AI와 구글이 앞선 모양새지만, '절대 강자'로 불릴 만큼의 플레이어는 아직 등장하지 않았다. 세계 검색시장을 차지한 구글, '윈도'로 PC 운영체제(OS)를 지배하는 마이크로소프트(MS), 스마트폰 OS를 양분한 애플과 구글처럼 시장의 주도권을 글로벌 빅테크에 내주면 회복하기 어렵다는 게 관련 업계의 우려다.
이에 우리 기업과 정부를 비롯한 각계의 국산 AI에 대한 지원이 필요하다는 목소리가 나온다. 윤 회장이 국산 초거대AI 모델의 활용에 특별히 관심을 쏟은 것도 같은 맥락이다. 그는 AI가 미래를 바꿀 핵심 전략기술인 만큼 '금융권을 포함한 우리 산업계가 후발주자인 국산 AI모델에도 충분한 기회를 제공해야 한다'는 지론을 평소 지인들에게 밝혀 온 것으로 알려졌다.
KB금융 외에도 챗GPT 등 해외 생성형 AI를 활용해 PoC 단계를 마친 금융지주사는 여럿이다. 이들도 국내 개발 초거대 AI의 가능성을 눈여겨 보고 있다. 금융업계 관계자는 "생성형 AI 활용을 준비 중이지만 아직 실용화하기에는 넘어야할 과제가 많다"며 "국내 기업이 개발한 생성형 AI도 PoC 를 검토 중"이라고 말했다.
"독도는 분쟁지역?"…토종 AI, 주권도 비밀도 지킨다
② 데이터 외부유출 및 비용문제 해결
글로벌 생성형 AI(인공지능) 대전이 B2B(기업간거래) 시장으로 확전했다. 오픈AI와 구글은 보안과 학습 문제를 해결한 기업용 생성형 AI 서비스를 출시하며 본격적인 수익화에 나섰다. 이에 국내 ICT(정보통신기술) 기업 긴장감도 커진다.
5일 업계에 따르면 네이버클라우드는 국내 기업 대상으로 오는 10월 출시되는 '뉴로클라우드' 영업에 나선다. 외산 생성형 AI의 공세 속에 한국 기업의 사정을 가장 잘 아는 서비스로 차별화한다. 뉴로클라우드란 클라우드와 온프레미스(On-premise·자체구축형)를 결합한 서비스로, 고객사 데이터센터에 서버 인프라를 직접 설치해 차세대 LLM(초거대언어모델) 하이퍼클로바X를 편하게 이용하되 민감정보의 외부 유출을 원천 차단한 게 특징이다.
앞서 오픈AI는 GPT-4로 기업용 챗GPT를 만들 수 있는 '챗GPT 엔터프라이즈'를 출시했다. 소비자용 유료 챗GPT보다 최대 2배 빠르게 4배 긴 문서를 처리한다. 기업 데이터를 학습시켜 맞춤형 AI 챗봇을 만들되, 모든 데이터와 대화는 암호화해 오픈AI가 활용하지 않는다. 구글도 다양한 LLM으로 기업별 생성형 AI를 만들 수 있는 '버텍스AI'를 고도화하며 "기업 데이터는 비공개로 유지된다. 데이터 저장위치와 사용여부·방식도 투명하게 확인할 수 있다"고 못 박았다.
기업이 생성형 AI를 쓰는 데 걸림돌이었던 학습·보안 문제를 해결했다는 설명이다. 이에 따라 생성형 AI를 도입하려는 기업도 급증할 전망이다. 이미 미국 경제전문지 포천이 선정한 글로벌 500대 기업(매출액 기준)의 80% 이상이 챗GPT를 이용 중이다.
국내에서도 관심이 뜨겁다. 한 IT업계 관계자는 "대다수의 금융사가 생성형 AI 도입을 위한 내년 예산을 대거 편성해 이를 잡기 위한 경쟁이 치열하다"고 귀띔했다. 자칫 B2B 시장마저 외산 생성형 AI에 주도권을 뺏기는 것 아니냐는 우려도 나온다.
그러나 전문가들은 여전히 국산 생성형 AI의 강점이 크다고 입을 모은다. 하정우 네이버클라우드 AI이노베이션 센터장은 "금융사를 비롯해 대부분의 기업은 데이터를 해외 클라우드에 올리는 것 자체를 꺼린다"라며 "외산 기업용 생성형 AI에 대한 우려가 근본적으로 해결되지 않았다"라고 꼬집었다. 이주열 LG CNS 수석연구위원도 "기업 데이터가 한국 영토를 벗어나는 건 크리티컬한 이슈"라며 "LLM을 온프레미스로 구축하는 사업을 강화할 예정"이라고 말했다.
"독도는 분쟁지역"이라는 외산 AI, 국방·국력 문제 될라 고가의 비용도 난제다. LLM은 '토큰'(AI가 인식하는 문자 데이터 단위) 단위로 과금하는데, 영어보다 한국어 사용 시 더 많은 토큰이 필요하다. 예컨대 3만2000개 토큰을 지원하는 챗GPT 엔터프라이즈는 영어로 2만5000단어를 쓸 수 있는 반면, 한글은 1만2800자에 그친다. 이 때문에 같은 양의 문서 처리 시 국내기업이 영어권보다 2배 비싼 사용료를 내면서도 속도는 더 느리다.
한국어에 최적화된 LLM이 필요한 이유다. 오픈AI가 운영하는 토크나이저에 따르면 GPT-3는 'That's OK' 9글자를 토큰 3개로 인식하지만 한글 '괜찮아'는 3글자인데도 9개 토큰을 쓴다. 자음과 모음을 모두 토큰으로 분류했다. 반면 한국어에 익숙한 국산 LLM은 띄어쓰기나 음절·형태소를 기준으로 토큰화해 비용이 훨씬 줄어들 수 있다. 단, 기업이 이용한 만큼 과금하는 클라우드 방식과 달리 온프레미스로 구축했을 때 구축비가 더 들 수는 있다.
구글·애플이 모바일 운영체제(OS) 시장지배력을 활용해 모든 앱 사업자에 영향력을 행사하듯, 글로벌 빅테크에 종속되지 않으려면 AI 주권을 확보해야 한다는 목소리도 있다. 서구문화 중심의 생성형 AI가 한국의 문화적 정체성을 약화할 수 있다는 지적도 나온다. 챗GPT는 독도에 대해 "한국·일본이 소유권 분쟁을 벌이는 지역"이라고 답하지만, 네이버 클로바X는 "한국 영토"라고 확답하는 게 대표적이다.
이에 대해 이광형 카이스트 총장은 최근 포럼에서 "AI는 독도를 일본 땅이라 하고 선생님은 한국 땅이라 하면 어린이들이 헷갈릴 것"이라며 "AI는 주권이자 국방, 국력과 직결된다. AI를 만든 국가의 지배를 받지 않으려면 한국형 AI를 육성해야 한다"고 강조했다.
'거시기' 알아 들을까?…네카오, 특화 서비스로 해외AI 넘는다
③공룡 빅테크 넘어라…국산AI '특화' 어떻게
국내 기업들의 초대형 AI(인공지능) 개발 경쟁에 가속도가 붙었다. 네이버(NAVER (190,000원 ▲300 +0.16%))가 하이퍼클로바X를 최근 발표한데 이어 카카오브레인이 올 4분기 중 기존 한국어 기반 AI 언어모델 KoGPT를 업데이트한 버전을 내놓는다. 전문 SW(소프트웨어) 기업이 아닌 곳들까지도 자체 초거대 AI모델 및 AI를 접목한 서비스 개발에 착수했다. 방대한 학습량에 의존한 해외 AI모델과 달리 한국어와 한국적 맥락, 실생활에 밀접하게 연계된 서비스가 국산AI 모델의 강점이 될 것이란 전망이 나온다.
LG·네이버·SKT·엔씨 등 출격…카카오·KT 등도 대기 LG AI연구원은 지난 7월 자체 개발 엑사원의 업그레이드 모델인 '엑사원 2.0'을 공개했다. 4만5000여건의 전문 문헌과 3억5000만장의 이미지를 학습한 것이 특징이다. 기존 엑사원 모델 대비 처리 시간이 25% 줄고 메모리 사용량도 70% 줄어드는 등 총 비용이 78% 줄었다는 게 LG AI연구원 측 설명이다.
네이버는 지난 달 기존 '하이퍼클로바'를 고도화한 '하이퍼클로바X'와 이를 활용한 사업모델을 소개했다. 챗GPT 대비 한국어 학습규모가 6500배에 이르는 등 외국 AI 모델에 비해 한국어 및 한국의 사회·문화적 배경을 훨씬 자세하고 정확하게 이해하는 모델이라는 점에서 눈길을 끌었다. 네이버는 하이퍼클로바X와 함께 검색 서비스인 'CUE:(큐)'를 비롯해 사용자·창작자용 솔루션, 판매자·광고주·기업용 솔루션 등을 잇따라 공개했다.
SK텔레콤 (57,200원 ▲900 +1.60%)은 자체 AI 브랜드 '에이닷'(A.)을 기반으로 도이치텔레콤, 싱텔 등 글로벌 텔코(통신사)들과 'AI 얼라이언스'를 결성하고 '텔코 AI 플랫폼'을 공동 개발해 AI와 통신 서비스를 접목한 솔루션을 내놓는 데 주력하고 있다.
엔씨소프트 (216,500원 ▲3,500 +1.64%) 역시 초거대 AI '바르코 LLM(대형언어모델)'을 공개했다. '바르코 스튜디오'라는 브랜드로 이미지, 텍스트, 디지털휴먼을 생성할 수 있도록 한 것을 비롯해 '바르코 LLM'을 게임 외에도 금융, 바이오, 교육 등 산업에 적용할 수 있도록 하겠다는 게 엔씨소프트의 포부다.
예고된 솔루션들도 많다. 카카오브레인은 올 4분기 KoGPT 2.0을 공개한다. 기존 KoGPT와 칼로(Karlo) 등 생성형 AI를 고도화한 버전이다. 기존 60억개 수준인 파라미터를 대폭 늘리고 여타 카카오 서비스와 접목한 AI 모델이 나올 것이라는 기대감이 나온다.
KT (44,500원 ▲500 +1.14%)는 이르면 10월 말 자체 개발 초거대 AI '믿음'을 내놓는다. 국내 최다 IDC(인터넷데이터센터)를 보유한 KT클라우드를 기반으로 AI반도체 전문기업 '리벨리온', AI소프트웨어 스타트업 '모레' 등과 파트너십을 체결해 기업들이 AI를 원하는 만큼 사용할 수 있도록 하는 풀스택(Full Stack) 서비스를 '믿음'(Mi:dm)이라는 브랜드로 제공하겠다는 것이다. 특히 공공·금융 등 높은 보안성을 요구하는 고객군에도 적용할 수 있는 보안성을 구축한 점 등이 장점이다.
국산AI의 무기는 '한국어'와 '서비스' 오픈AI의 챗GPT 출현 후 MS(마이크로소프트)가 자사의 주요 솔루션에 AI 기술을 접목하기로 하면서 국내외 빅테크들의 생성형 AI 경쟁이 가속화되고 있다. 구글, 메타, 아마존, 화웨이, 바이두 등이 파라미터(매개변수) 1조개 이상의 초대형 AI를 잇따라 내놨다. 국내 AI모델 개발사들에 비해 압도적인 학습량을 갖춘 모델들이다.
국산 AI는 다른 강점이 있다. 최승호 상상인증권 연구원은 최근 AI산업 전망 보고서를 통해 "우리가 플랫폼을 이용할 때 중요한 것은 플랫폼이 제공하는 데이터와 서비스"라며 "그걸 가장 잘 모아놓은 사이트가 네이버와 다음(카카오)이고 지난 23년간 누적된 UGC(이용자 생성 콘텐츠)는 국내 플랫폼들이 가지는 강력한 이점"이라고 했다.
그는 "코딩 등 복잡한 추론을 요구하는 수요에는 글로벌 LLM 기반 AI가 매력적인 선택지일 수 있다"며 "전문 데이터의 언어는 대부분 영어로 구성돼 있어 영어 데이터를 많이 학습한 글로벌 LLM에 우위가 있다"고 했다.
하지만 국내 생성형 AI에도 기회가 있다고 강조한다. 최 연구원은 "맛집찾기, 여행추천, 렌터카 예약 등 일상적 질문에서는 한국어 정보와 UGC, 한국 로컬기업과 제휴돼 있는 한국형 생성형 AI가 이점을 취할 가능성이 높다"며 "(전문적 데이터의 경우도) 국내 역사, 국내 학계 연구 등 한국어 데이터가 더 많은 경우는 국내 생성형 AI가 유리하다"고 했다.
'생성형AI' 후발주자 日·中, 어떻게 구글·MS에 맞서나
④'美 빅테크 추격'…日·中, 초거대AI 육성전략
오픈AI 챗GPT와 구글 바드 등 미국 IT기업들이 전 세계 생성형AI(인공지능)의 선두 싸움을 벌이는 동안 일본과 중국 등 후발주자들은 이들을 따라잡기 위해 속도를 내고 있다. 특히 마이크로소프트를 등에 업은 챗GPT나 공룡 구글과의 정면 승부를 택하기보다는, 비(非)영어권인 자국의 특성에 맞춘 서비스와 개별 산업군별로 특화된 모델을 내세우는 '틈새전략'을 추진한다.
일본 "일본어·기업 맞춤형 서비스로 승부" 5일 업계에 따르면 최근 NTT, 소프트뱅크 등 일본 기업들은 생성형 AI를 독자 개발하려는 움직임이 활발하다. 공통점은 일본어 대응력이 뛰어나고 금융 등 전문 분야에 특화한 모델을 개발해 일본 기업들이 즉시 현업에 활용할 수 있는 모델을 추구한다는 점이다.
요시자키 토시후미 NEC CDO(최고디지털책임자)는 지난 7월 6일 생성형 AI 설명회에서 "일본 시장용으로 전문성이 높은 생성형 AI를 제공할 것"이라고 밝혔다. NEC는 이를 위해 독자 LLM(거대언어모델)을 개발해 일본어 문장 이해력을 높였다. 일본 정보통신연구기관(NICT)은 챗GPT-3에 필적하는 양을 학습한 일본어 모델을 개발하는 중이다.
NTT는 오는 11월 금융·의료 등 전문분야에 특화한 생성형AI를 공개할 예정이다. 소프트뱅크 '거래처 기업'들의 업무에 특화된 생성형AI를 개발하고 있다. 미야카와 준이치 소프트뱅크 사장은 지난 6월 정기주총에서 "현 시점에서 오픈AI를 따라잡을 수 있다고는 생각하지 않는다"면서도 "각각의 서비스에 맞는 AI를 제공하면 된다"고 추진 방향을 밝혔다.
증국 "빅테크가 앞장서고 원천기술로 뒷받침" 지난 5월 베이징에서 열린 '2023 중관춘(中關村) 포럼'에 따르면 현재 베이징, 상하이 등 중국 14개 지역에서는 자체 파운데이션 모델을 만들기 위한 작업이 한창이다. 베이징(38개)과 광둥성(20개)에 프로젝트가 집중돼 있다.
바이두, 텐센트 등 중국의 글로벌 빅테크 기업들은 개별 분야에서 유의미한 모델들을 내놓고 있다. 바이두는 지난 3월 자체 AI대화 엔진 '플라토3'를 기반으로 한 챗봇 '어니봇'을 통해 그동안 쌓아온 AI기술력을 선보였다. 텐센트는 질병세포 등에 대한 현미경 판독을 사람이 아닌 AI가 대신하는 '줴우 강화학습 병리학자'를 공개했다.
중국의 생성형AI 산업을 뒷받침하는 것은 활발한 기초연구다. 중국 정보통신연구원에 따르면 지난해 중국이 신청한 AI 관련 글로벌 특허는 25만여건이다. 전 세계 AI특허 신규신청에서 중국이 차지하는 비중은 2012년 13%에서 지난해 60%까지 늘었다. 2013~2022년 전 세계에서 나온 100만여건의 AI 논문 중 28%를 중국인이 썼다.
투자부터 선제적 저작물 유권해석까지 지원 중국과 일본은 독자적인 생성형AI 개발에 정부가 전폭적인 지원에 나서고 있다. 중국은 2021년 3월 양회에서 통과된 '제14차 5개년(2021~2025년) 계획 및 2035년 장기 목표'에서 2035년까지 확보할 7대 첨단과학기술 중 으뜸으로 AI를 지정했다. 상하이시는 올해 5월부터 AI 프로젝트 건당 최대 1억위안(약 181억원)의 보조금을 지급한다. 베이징시도 지난 5월부터 생성형AI 등의 연구프로젝트에 2년간 각 6000만위안(108억원)을 주기로 했다. 또 관내 클라우드 공급업자들이 AI 스타트업 등에게 컴퓨팅 파워를 제공하라고 지시했다.
일본 총무성은 내년도 예산을 편성하면서 생성형AI 등의 개발 촉진에 589억엔(약 5400억원)을 요청했다. 일본어 중심 학습용 데이터 기반을 마련하고, 이를 민간기업에 개방할 방침도 밝혔다.
또한 일본 문화청은 최근 AI 개발 단계에서 저작물을 학습용 데이터로 활용하는 경우 저작권자의 허락 없이도 이용할 수 있다는 유권해석을 내려 관련 기업들의 활로를 뚫어줬다. 향후에도 발생할 생성형AI 관련 저작권 논란을 미연에 방지하기 위해 지속적으로 세미나를 열고 업계의 논점을 선제적으로 정리한다는 방침이다.
韓 정부 '초거대AI' 밀어주지만…"활용 위한 정책 지원은 부족"
⑤'국산AI 육성' 정부의 청사진은
'챗GPT' 등장으로 AI(인공지능)의 새로운 패러다임이 열리면서 한국 역시 새로운 도약 필요성이 대두되고 있다. 주무 부처인 과학기술정보통신부는 '초거대AI'를 구동하기 위한 AI반도체, 클라우드 등 생태계 조성에 나서고 있다. 그러나 이는 개발 환경 지원에 치중됐을 뿐, 국산 AI 파운데이션 모델 활용에 대한 지원책은 부족하다는 지적이 나온다.
과기정통부는 지난 4월 '초거대AI 경쟁력 강화방안'을 발표하고 초거대 AI를 미래 전략산업으로 육성하기 위해 올해 3901억원을 투입한다고 밝혔다. 초거대AI 플랫폼을 구축, 글로벌 시장을 공략하고 초거대 AI 응용 서비스 분야 세계 1위를 노린다는 목표다.
먼저 양질의 텍스트 데이터를 대규모로 확충한다. 분야별 특화 학습용 데이터와 비영어권 시장 공략을 위한 동남아·중동 등 언어 데이터를 2027년까지 200종(책 15만권 분량) 구축하고, 한국어 성능 향상을 위해 고품질 말뭉치와 한국어 응용말뭉치도 130종을 구축한다. AI반도체 기반 고성능·저전력 K-클라우드를 초거대 AI가 활용할 수 있도록 AI 반도체 소프트웨어와 데이터 가속처리 하드웨어도 개발한다.
초거대 AI 산업혁신 생태계 조성에도 힘쓴다. 우선 민간·공공영역에 초거대 AI를 선도적으로 접목한다. 법률, 의료, 예술 등 민간 전문영역에 초거대 AI를 접목, 전문가의 업무를 보조하는 '초거대 AI 5대 플래그십 프로젝트'를 추진한다. 공공기관의 내무업무와 대민서비스 등을 효율화하는 초거대 AI 응용서비스도 개발한다. 더불어 민간 차원의 투자, 신서비스 창출 등 협력 강화를 위한 '초거대 AI 협의회'를 구성하고, 전문인재 양성 및 국민의 초거대 AI 리터러시를 강화한다.
하지만 이는 AI 개발 환경 지원에 치중돼 있어 국산 AI 파운데이션 모델 활용의 정책적 지원은 여전히 부족하다는 주장이 있다. 파운데이션 모델이란 텍스트, 이미지, 음성, 영상 등으로부터 입력된 내용을 학습하고 새 데이터를 생성할 때 근간이 되는 AI를 의미한다. 네이버 '하이퍼클로바X', 카카오 '코GPT', KT '믿음', SK텔레콤 '에이닷', LG '엑사원' 등이 대표적이다.
이는 정부도 공감하는 바다. 박윤규 과기정통부 2차관은 최근 미디어데이에서 '하이퍼클로바X'에 대해 "그간 챗GPT 등에서 발견된 문제점들을 해결하고 진보된 모델이길 희망한다"면서도 "민간기업의 발표나 비즈니스를 적극적으로 지원하고, 정책적으로 호응할 부분들이 있는지 고민하고 있다"고 말했다.
아울러 전문가들은 국산 초거대AI 파운데이션 모델의 활용 확대를 위한 정부의 역할이 어느 때보다 중요하다고 입을 모은다. 김주호 KAIST(카이스트) 전산학부 교수는 "처음엔 파운데이션 모델 성능을 높이는 데 집중하지만 실질적인 가치나 성과를 내려면 어딘가에 적용되고 임팩트를 내야한다"며 "다양한 분야의 적용을 돕기 위해서는 원천기술 등 별도의 기술들이 필요한데, 그런 부분에 대한 정부의 정책 지원 등은 아직 부족한 거 같다"고 했다.
다만 일각에선 정부 개입이 아닌 민간차원에서 해결해야 한다는 입장도 있다. 유병준 서울대 경영학과 교수는 "국내외 기업의 경쟁이 있는 상태에서 국내 기업만을 위한 지원책을 내놓을 수는 없을 것"이라며 "특히 파운데이션 모델은 대기업 분야니까 민간부분에서 해결하되 정부의 지원이 꼭 필요한 부분이 있으면 모색 방안이나 의견이 나오지 않을까"라고 말했다.
"국산AI 키우려면…'성공률 높은' 일거리 줘야"
⑥인터뷰-고진 디지털플랫폼정부위원회 위원장
고진 디지털플랫폼정부위원회 위원장은 최근 서울 광화문 집무실에서 만나 국산 초거대AI 육성을 위한 과제로 "많은 일거리"를 첫손에 꼽았다.
일례로 네이버(NAVER (190,000원 ▲300 +0.16%))는 초거대AI 기본모델 '하이퍼클로버X' 개발에 2017년 이후 1조원 이상을 투자했다. 글로벌 빅테크에 비해선 적지만, 네이버의 연간 영업이익(지난해 기준 1조3047억원)을 오롯이 단일 사업에 쏟아붓는 셈이다. 다른 기업도 비용 부담은 마찬가지다. GPU 등 AI 관련 컴퓨팅 자원의 가격 급등으로 국내 대기업도 머지않아 한계에 부닥칠 수 있다.
고 위원장은 "결국 국산AI가 폭넓게 활용돼야 (수익을 올려야) 개발 비용을 감당할 수 있다"고 강조했다. 다만 "성공 가능성이 높은 일거리가 중요하다"고 강조했다. 이어 "정제된 데이터와 우수한 인적자원이 뒷받침하는 과제, 그에 부합하는 공공부문의 발주가 핵심"이라고 강조했다.
위원회와 과학기술정보통신부는 내년 정부 전용 초거대AI를 구축할 계획이다. 공공 부문의 데이터를 초거대AI가 학습해 정부 업무의 이해도가 높은 AI를 구현하는 것으로, 복수 민간 기업의 초거대AI 인프라를 활용한다. 네이버, LG (76,800원 ▲600 +0.79%), KT (44,500원 ▲500 +1.14%), SK텔레콤 (57,200원 ▲900 +1.60%), 카카오브레인 등이 도전할 전망이다.
고 위원장은 "국가 보안과 연관 있는 데이터, 또는 국민의 개인정보 데이터까지 포함해 정부가 보유한 민감 데이터를 학습하기 위한 정부 전용 초거대AI"라고 설명했다. 아무래도 글로벌 빅테크의 초거대 AI에 맡기기는 어려운 영역이다. 아울러 정부는 중소·벤처기업과 공공기관, 지방자치단체 등이 초거대AI를 주요 업무에 접목해 볼 수 있도록 '민간의 초거대 AI 활용지원 사업'도 추진 중이다.
고 위원장은 민간 기업들과 함께하는 정부 전용 초거대AI의 수출 모델도 제시했다. 고 위원장은 "민관 협력으로 현 정부 임기 내 공공부문의 생산성 향상 성과가 가시화될 것"이라며, 성과가 명시적인 숫자로 표시된다면 한국형 정부 AI 모델 수출의 물꼬를 틀 수 있다고 봤다. 주요 타깃은 중동을 비롯한 아시아권의 자체 언어를 쓰는 국가들이다. 자체 초거대AI를 보유한 미국·중국·이스라엘 등은 정치적 배경의 제약과 더불어 기술 및 운영 노하우 이전에 소극적인 데 반해 한국은 그렇지 않다는 게 그들의 판단이다.
고 위원장은 "초거대AI 모델의 수출은 구축 뿐만 아니라 파인튜닝(미세조정)과 뒤따르는 애플리케이션, 클라우드 등 AI생태계 참여자들과 함께 해야 한다"며 "관련 민간 기업들과 함께 우리의 초거대AI 생태계 자체를 수출하고, 그렇게 진출한 기업들은 글로벌 시장에서 새로운 비즈니스 기회를 창출할 수 있을 것"이라고 내다봤다.
이와 함께 고 위원장은 국산 초거대AI 육성을 위한 또 다른 핵심 과제로 데이터 관련 법·제도의 확립을 강조했다. 그는 "개인정보 및 저작권 이슈는 앞으로 초거대AI 활용이 확산될수록 점점 더 심각하게 제기될 수 있는 문제"라고 말했다.
- 기자 사진 변휘 기자
- 기자 사진 김남이 기자
- 기자 사진 윤지혜 기자
- 기자 사진 황국상 기자
- 기자 사진 최우영 기자
- 기자 사진 김승한 기자
<저작권자 © ‘돈이 보이는 리얼타임 뉴스’ 머니투데이. 무단전재 및 재배포, AI학습 이용 금지>