[스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]
음성 인공지능(AI) 기술을 개발하는 프레리스쿠너가 세계적 권위의 음성·음향·신호처리 학술대회 'ICASSP 2024'에서 논문이 채택되는 성과를 거뒀다고 19일 밝혔다.
국제 전기전자공학협회(IEEE)가 주최하는 올해 ICASSP에는 구글, 애플, 아마존, 삼성전자, 현대차 등 세계적 기업과 전세계 AI 분야 연구자 4000여명이 참석했다.
지난해 8월 설립된 프레리스쿠너는 온디바이스 음성 AI 기술과 개인정보보호 기술을 개발하고 있다. 법인설립 이후 2개월 만에 블루포인트파트너스에서 시드투자를 받았다.
이번에 채택된 논문(WAV2VEC-VC: VOICE CONVERSION VIA HIDDEN REPRESENTATIONS OF WAV2VEC 2.0)에는 화자에 대한 어떠한 사전 정보 없이도 음성 변조가 가능한 다중 화자 음성 변조 기술이 소개됐다.
예를 들어 A 화자의 음성을 B 화자의 목소리로 변환하고자 할 때 A 화자 음성에서 언어적인 정보를 추출하고 B 화자 음성에서 목소리 정보를 추출한 후 두 정보를 결합해 A 화자가 발화한 내용을 B 화자의 목소리로 발화한 음성으로 합성한다.
특히 메타에서 개발한 자기 지도 학습 음성 표현 'wav2vec 2.0'을 활용해 입력 음성에서 화자의 목소리와 언어적인 정보를 효과적으로 추출하는 데 성공했다.
김기연 프레리스쿠너 대표는 "이번 연구는 단순히 음성 변조 작업에만 국한되지 않고 여러 음성 작업(화자인식·화자분할·음질개선·음성인식 등)에 적용 가능하다"며 "사용자 간 음성 파일을 공유할 때 원본 화자의 목소리를 익명화해 개인정보 유출을 방지한다"고 했다.
[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']
음성 인공지능(AI) 기술을 개발하는 프레리스쿠너가 세계적 권위의 음성·음향·신호처리 학술대회 'ICASSP 2024'에서 논문이 채택되는 성과를 거뒀다고 19일 밝혔다.
국제 전기전자공학협회(IEEE)가 주최하는 올해 ICASSP에는 구글, 애플, 아마존, 삼성전자, 현대차 등 세계적 기업과 전세계 AI 분야 연구자 4000여명이 참석했다.
지난해 8월 설립된 프레리스쿠너는 온디바이스 음성 AI 기술과 개인정보보호 기술을 개발하고 있다. 법인설립 이후 2개월 만에 블루포인트파트너스에서 시드투자를 받았다.
이번에 채택된 논문(WAV2VEC-VC: VOICE CONVERSION VIA HIDDEN REPRESENTATIONS OF WAV2VEC 2.0)에는 화자에 대한 어떠한 사전 정보 없이도 음성 변조가 가능한 다중 화자 음성 변조 기술이 소개됐다.
예를 들어 A 화자의 음성을 B 화자의 목소리로 변환하고자 할 때 A 화자 음성에서 언어적인 정보를 추출하고 B 화자 음성에서 목소리 정보를 추출한 후 두 정보를 결합해 A 화자가 발화한 내용을 B 화자의 목소리로 발화한 음성으로 합성한다.
특히 메타에서 개발한 자기 지도 학습 음성 표현 'wav2vec 2.0'을 활용해 입력 음성에서 화자의 목소리와 언어적인 정보를 효과적으로 추출하는 데 성공했다.
김기연 프레리스쿠너 대표는 "이번 연구는 단순히 음성 변조 작업에만 국한되지 않고 여러 음성 작업(화자인식·화자분할·음질개선·음성인식 등)에 적용 가능하다"며 "사용자 간 음성 파일을 공유할 때 원본 화자의 목소리를 익명화해 개인정보 유출을 방지한다"고 했다.
[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']
관련기사
- AI로 짝퉁·불법콘텐츠 잡는 마크비전, 연간반복매출 130억 달성
- 커머스 넘어 스타일 포털로…에이블리, 코디 콘텐츠 26만개 확보
- 트위치 이용자 184만명 흡수한 '치지직'…아프리카TV MAU 위협
- "벤처투자 위축시 다양한 자금조달수단·매출다각화 고려해야"
- NCT 127 팝업 전시회 성료…스위트스팟 "사업영역 확장"
- 기자 사진 최태범 기자 bum_t@mt.co.kr 다른 기사 보기
<저작권자 © ‘돈이 보이는 리얼타임 뉴스’ 머니투데이. 무단전재 및 재배포, AI학습 이용 금지>