초거대 언어모델(LLM) 개발 진영이 오픈소스 기반의 무료 모델과 API( 응용 프로그램 인터페이스)나 프로덕트 판매 중심의 유료 모델로 양분되고 있다. 챗GPT가 연 생성형 AI 시대가 열리면서 기반이 되는 LLM 경쟁도 더욱 심화되고 있기 때문이다. 선발주자인 오픈AI와 구글은 상업화에 들어서며 폐쇄 전략을 택했고, 틈새시장을 노린 메타(구 페이스북)가 오픈소스 모델을 들고나왔다.
업계 노린 오픈AI·구글은 '폐쇄형 LLM' vs 학계 노린 메타는 '개방형 LLM' 지난해 말 챗GPT를 공개한 오픈AI는 LLM을 기반으로 한 생성형 AI 생태계를 리드하기 시작했고, 마이크로소프트(MS)와 협력을 강화하며 연구 중심에서 상업화 중심으로 운영 방식을 전환했다. 주도권을 잡았다고 판단한 오픈AI와 MS는 지난 3월 발표한 새 LLM 'GPT-4'의 기술적인 내용을 대부분 공개하지 않았다.
구글도 생성형 AI의 최근 LLM 관련 정보를 완전히 공개하지 않고 있다. 트랜스포머 모델을 완전 오픈소스로 내놓으며 AI 생태계 발전을 뒷받침하던 과거와 정반대되는 행보다. 구글은 지난 10일 구글 I/O(연례 개발자 대회)에서 선보인 최신 LLM 팜2(PaLM2)에 대한 기술적 정보도 자세히 공개하지 않았다.
이들은 편향이나 할루시네이션(환각) 등을 이유로 생성형 AI를 완전히 공개하는 것이 위험하다고 주장한다. 그러나 실상은 조금 다르다고 AI 업계는 보고 있다. 점점 심화되는 AI 경쟁 상황에서 자사 LLM을 오픈소스로 공개할 경우, 경쟁사에 금방 기술이 따라잡힐 수 있다고 판단했다는 것이다. 오픈AI와 구글은 대신 API를 유료로 판매하고 있다. 경쟁자로부터 멀리 도망도 가면서 막대한 개발·운영비를 충당할 수 있다는 판단에서다.
반면 후발주자인 메타는 오픈소스 진영을 대표하는 개발사다. 메타가 지난 2월 선보인 LLM 라마(LLaMA) 연구 목적에 한해 라마를 소스코드를 무료로 제공했다. 상업화와 함께 폐쇄 전략을 택한 구글과 오픈AI 사이 틈새시장을 공략한 것이다. 메타는 라마의 상업적 이용을 허락하지 않고 있다. 그러나 월스트리트저널(WSJ) 등 외신에 따르면 일부 개발자들은 라마를 상업용으로 사용할 수 있도록 해달라고 요청하고 있다.
이후 라마의 소스코드가 유출되기까지 하며 이를 활용해 만든 새 LLM도 속속 등장하고 있다. 스탠퍼드대 연구진이 만든 '알파카', 이미지 생성 AI로 유명한 스태빌리티AI의 '스태이블LM', 데이터브릭스의 '돌리' 등이 그 예다. 이들은 모두 소스코드를 공개한 상태다. 이미 AI 학계는 라마를 중심으로 돌아가고 있다. 하정우 네이버클라우드 AI 이노베이션 센터장은 "라마를 활용한 논문이 많이 발표되고 있고, 앞으로 나올 연구논문도 대부분 라마를 중심으로 나올 것 같다"고 설명했다.
1990년대 OS대결도 '개방 vs 폐쇄' 대결 구도…"오픈소스 결코 무시 못 해" 1990년대 벌어졌던 IT 시스템 간 대결에서도 이같은 '개방 대 폐쇄' 전략 싸움이 있었다. 당시 기업용 OS(운영체제) 시장은 오픈소스 전략을 취한 '리눅스'와 비오픈소스 전략을 택한 '유닉스'로 양분됐다. 처음에는 비싸지만 성능과 보안이 좋은 폐쇄형 OS 유닉스가 앞서 나갔지만, 개방형 OS 리눅스가 최신 기능을 빠르게 적용하고 보안 수준을 끌어올리면서 서서히 영향력을 키우고 있다.
한 AI 개발자는 "2020년께부터 윈도가 리눅스를 내장하기 시작했다"며 "결국 큰 회사들도 오픈소스를 무시할 수 없다는 사실을 보여준다"고 설명했다. 오픈AI가 개방형 전략을 취할 새 LLM을 만들고 있는 것도 오픈소스의 영향력을 간과할 수 없기 때문으로 풀이된다. 이 개발자는 "지금은 GPT와 PaLM이 주도권을 잡은 것처럼 보이지만, 리눅스처럼 라마도 일종의 지표 역할을 반드시 하게 될 것"이라고 덧붙였다.
- 기자 사진 배한님 기자
<저작권자 © ‘돈이 보이는 리얼타임 뉴스’ 머니투데이. 무단전재 및 재배포, AI학습 이용 금지>