[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.] 정무경 디노티시아 대표가 회사에 대해 소개하고 있다 /사진=고석용 기자"기업들이 AI(인공지능)를 도입하고 가장 크게 실망하는 부분은 AI가 딱 맞는 데이터를 찾지 못한다는 점입니다. 의미가 비슷해도 데이터의 키워드가 다르면 AI가 찾지를 못하니까요. 씨홀스는 이런 점을 해결한 솔루션입니다."
AI 및 반도체 스타트업 디노티시아가 의미·맥락 기반의 AI 솔루션 '씨홀스'의 베타버전을 출시하며 서비스 상용화에 나섰다. 디노티시아는 향후 솔루션을 고도화하고 최적화된 하드웨어들도 개발해 AI 대중화를 앞당기겠다고 밝혔다.
씨홀스는 사용자들의 다양한 데이터를 분석해 의미나 맥락에 따라 벡터데이터로 변환해 저장한 뒤 LLM(거대언어모델)이 이를 활용할 수 있도록 하는 솔루션이다. 의미가 같지만 용어·표현이 다른 경우, 이미지에서 스타일을 찾아내 활용하는 경우 등에 사용된다. 해외에서는 파인콘(Pinecone), 위비에이트(Weaviate), 밀버스(Milvus) 등도 관련 솔루션을 개발하고 있다.
노홍찬 디노티시아 CDO(최고데이터책임자)는 "많은 기업들이 내부 데이터를 활용하는 AI를 도입하고도 이를 제대로 사용하지 못한다"고 말했다. AI가 기업용 데이터와 사용자의 명령에서 의미와 맥락을 파악하지 못해서다. 예컨대 사용자가 AI에 '코로나19'로 보고서를 만들어달라고 하면 글자가 다른 '코비드19'로 입력된 자료는 인식하지 못하고, '코로나 맥주'는 글자가 같아 인식하는 경우가 발생하는 것이다.
노 CDO는 "AI는 데이터나 명령어의 키워드가 정확하게 일치하지 않으면 이해하는 데 한계가 있다"며 "반면 씨홀스는 기존 데이터들을 벡터데이터로 변환하기 때문에 인간의 사고처럼 의미적 유사성을 토대로 자료를 찾고 작업을 수행한다"고 말했다.
디노티시아는 이번 씨홀스를 SaaS(서비스형 소프트웨어) 형태로 내놨다. 누구나 웹 환경에서 구글드라이브, 컴퓨터 등의 데이터를 연동하면 해당 데이터를 기반으로 자료를 찾고 작동하는 LLM을 사용할 수 있다.
노 CDO는 "유출걱정 없이 데이터들을 활용해 LLM을 구동하고 싶은 기업들이 활용할 수 있다"며 "SaaS 형태로 제공하는 만큼 기업 뿐 아니라 개인도 자신의 컴퓨터 및 클라우드에 저장된 데이터를 활용해 LLM이 추론하길 원한다면 충분히 사용할 수 있다"고 말했다.
한편 디노티시아는 씨홀스의 성능을 극대화하기 위해 올해 하반기 전용 반도체인 'VDPU(벡터데이터 연산 반도체)'를 출시한다는 계획이다. 디노티시아는 팹리스 스타트업 사피온의 CTO(최고기술자) 출신인 정무경 대표가 설립한 회사로, 반도체 관련 기술력이 높고 설립 2년여만에 350억원의 투자를 유치해 개발자금도 확보된 상황이다.
노 CDO는 "SaaS 형태로 제공돼 일반적인 반도체를 사용하는 것보다 최대 10배 높은 성능을 구현하고 총 소유비용을 80% 이상 절감할 수 있다"며 "이를 토대로 개인화된 LLM 디바이스까지 출시할 예정"이라고 말했다.
정무경 디노티시아 대표는 "앞으로 AI가 생성하는 데이터가 사람이 생성하는 데이터보다 많아질 것"이라며 "AI가 사용하고 필요로 하는 데이터의 양 또한 사람이 소모하는 데이터를 넘어설 것"이라고 말했다. 그러면서 "디노티시아의 씨홀스와 전용 디바이스를 활용하면 AI가 데이터가 더 밀접하게 결합될 수 있을 것"이라고 말했다.