2024 엔젤투자리스트 최고위 과정 1기 모집

[IT썰]목소리 도용 논란됐던…GPT-4o 고급 음성 모드 서비스 시작

배한님 기자 기사 입력 2024.07.31 08:02

URL이 복사되었습니다. 원하는 곳에 붙여넣기 해주세요.

공유하기
글자크기
GPT-4o의 고급 음성 모드를 사용 중인 사람들. /사진=오픈AI 홈페이지 갈무리
GPT-4o의 고급 음성 모드를 사용 중인 사람들. /사진=오픈AI 홈페이지 갈무리

오픈AI가 배우 스칼렛 요한슨의 목소리를 무단 도용했다는 논란에 공개가 연기됐던 'GPT-4o 고급 음성 모드' 서비스를 일부 사용자를 대상으로 제공하기 시작했다.

30일(현지시간) 미 테크 전문지 테크크런치 등에 따르면 오픈AI는 최근 일부 챗GPT 유료 사용자를 대상으로 '고급 음성 모드'를 제공하고 GPT-4o의 '하이퍼 리얼리스틱 음성' 서비스를 사용할 수 있도록 했다. 오픈AI는 해당 기능이 오는 가을 모든 유료 사용자에게 제공될 것이라고 설명했다.

오픈AI는 지난 5월 GPT-4o의 음성 기능을 공개했다. 당시 빠른 반응과 실제 사람과 거의 동일한 목소리로 많은 사람이 찬사를 보냈다. AI(인공지능) 목소리와 사랑에 빠지는 영화 'HER'를 연상케 했다. 실제 스카이(Sky)라는 목소리는 HER의 여주인공이자 AI 역할을 했던 '스칼렛 요한슨'의 목소리와 유사해 더욱 관심을 받았다.

그러나 스칼렛 요한슨이 '스카이'가 자신의 목소리를 무단 도용했다고 주장하면서 논란이 일었다. 스칼렛 요한슨은 지난 5월 말 성명에서 "오픈AI의 CEO(최고경영자)인 샘 알트먼이 지난해 9월 시스템에 목소리를 빌려줄 의향이 있는지 물으며 기술에 익숙하지 않은 사람들에게 위로가 될 것이라고 말했다"면서 "공개된 데모를 들었을 때 오픈AI가 저와 아주 비슷하게 들리는 목소리를 사용한다는 사실에 충격과 분노를 느꼈다"고 비판했다. 요한슨은 목소리 사용에 동의한 적이 없다고 밝히며 법적 조치에 나섰다.

이에 오픈AI는 스카이 음성을 삭제하고 당초 6월 출시 예정이었던 GPT-4o의 고급 음성 모드 출시를 연기했다. 그리고 약 두 달 뒤, 일부 사용자에게 해당 서비스를 제공하기 시작했다. 음성 모드와 달리 고급 음성 모드는 '멀티 모달' 모델을 적용해 보조 모델의 도움 없이 빠르게 텍스트·사진 등을 인지하고 음성으로 변환해 대화에 사용한다. 아울러 슬픔·흥분 등 목소리 속 감정적 억양을 감지할 수 있다.

오픈AI는 무단 도용 논란 이후 안전 노력에 대한 다양한 노력을 기울였다고 강조했다. 오픈AI는 시연 후 몇 달간 45개의 언어를 사용하는 100명 이상의 외부 레드팀과 함께 GPT-4o의 음성 능력을 테스트했다고 설명했다. 테스트 결과가 담긴 안전 보고서는 오는 8월 초 공개될 예정이다.

  • 기자 사진 배한님 기자

이 기사 어땠나요?

이 시각 많이 보는 기사