딥엘, 무료 이용자 동의없이 데이터 수집·처리
개보위 "해외 사업자도 이용자 동의 등 없다면 법 위반" 조사 시사
챗GPT·구글번역보다 자연스러운 번역으로 인기인 독일 AI 번역기 '딥엘'이 이용자 동의없이 번역원문 등 데이터를 AI 학습에 활용한 것으로 나타났다. 개인정보보호위원회는 이용자 동의 등이 없이 개인정보를 수집·처리했다면 위법이라는 입장이다.
11일 업계에 따르면 딥엘은 무료 서비스 이용자가 입력한 텍스트와 문서, 번역문을 AI 학습에 활용한다. 야렉 쿠틸로브스키 딥엘 CEO는 최근 국내 기자간담회에서 "딥엘 무료 서비스는 이용자가 제공하는 데이터를 서버에 저정해 AI 학습에 활용한다"고 말했다.
딥엘 개인정보 처리방침도 "번역 서비스를 이용할 때는 당사 서버로 전송하고자 하는 텍스트만 입력해달라"라며 "당사는 뉴럴 네트워크(신경망)와 번역 알고리즘을 훈련·개선하기 위해 이용자의 텍스트, 업로드한 문서, 번역문을 제한된 기간 처리한다"라고 명시했다.
문제는 딥엘이 이용자 동의 없이 데이터를 수집·처리해왔다는 점이다. 개인정보보호법에 따르면 개인정보처리자는 정보 주체의 동의를 받거나 공공기관 업무 수행에 필요한 경우 등에만 개인정보를 수집·이용할 수 있다.
딥엘에 회원가입 하려면 이용자는 '딥엘에 콘텐츠를 저장·수정·처리·번역·전송할 수 있는 권리를 부여한다'는 이용약관에 동의해야 한다. 그러나 딥엘은 회원가입하지 않아도 PC 웹·앱, 모바일 앱을 이용하는 데 제한이 없다. 즉, 데이터 수집·처리에 대한 고지 및 동의절차도 없이 비회원의 개인정보를 수집해 AI 고도화에 활용해온 셈이다.
딥엘 CEO "AI 훈련에 고객 데이터 쓰면 기밀 유출 가능성 있어" 올 초 국내 진출해 무료 서비스만 선보였던 딥엘은 오는 8월 유료 서비스 '딥엘 프로' 출시를 알리며 강화된 데이터 보안을 강점으로 꼽았다. 무료와 달리 유료 서비스는 번역원문을 즉시 삭제하고 AI 모델 훈련에 사용하지 않는다는 설명이다. 쿠틸로브스키 CEO는 "고객 데이터를 AI 모델 훈련에 쓰면 기업 기밀정보나 내부정보가 유출될 가능성이 있다"라고 경고하기도 했다.
딥엘 측 설명대로라면 국내 대다수의 이용자가 본인도 모르게 개인정보 유출 위험에 놓인 셈이다. 회사에서 업무 보고서 작성 등을 위해 딥엘을 쓰는 이용자도 많았던 만큼 기업 내부정보 유출 가능성도 제기된다. 이에 쿠틸로브스키 CEO는 "모든 무료 기반 AI 번역기는 이용자의 데이터를 (포괄적으로) 사용한다"라고 해명했다.
그러나 네이버의 AI 번역기 '파파고'는 '번역을 요청한 내용을 파파고 품질 개선을 위해 삭제 없이 저장·활용하는 것에 동의한다'라는 품질개선 동의를 별도로 받는다. '동의' 설정을 별도로 해제할 수도 있다. 무엇보다 딥엘처럼 네이버에 로그인하지 않은 경우엔 '품질개선 미동의'가 기본값으로 설정된다.
개보위 "해외 사업자도 개인정보 적법처리 요건 갖춰야" 개인정보보호위원회는 이용자 동의 등 개인정보 처리요건을 미준수했다면 법 위반이라는 입장이다. 개보위 관계자는 "국내 법인이 없는 해외 사업자라도 국내에서 서비스하며 개인정보를 수집·처리한다면 개인정보처리자로서 국내법 적용을 받는다"라며 "이용자 동의 등 개인정보 적법 처리 요건을 갖추지 않은 경우에는 개보위가 조사 처분할 수 있다"라고 말했다. 딥엘이 이용약관 및 개인정보 처리방침을 모두 영어로 기재한 것에 대해서도 "개인정보처리자는 개인정보처리방침을 작성해 공개하되 한국 이용자를 위해 한국어판을 마련해야 한다"라고 강조했다.
이에 딥엘은 수집한 이용자 데이터는 자체 데이터센터에 저장하므로 외부 유출 위험이 없다는 입장이다. 동의절차 추가여부는 언급하지 않았다. 딥엘은 "개인정보보호 정책이 강한 유럽연합국의 기업으로서 데이터 보안을 매우 중시한다"며 "무료 서비스 이용자가 입력한 그 어떤 텍스트 데이터도 제3자에게 공유하지 않는다"라고 밝혔다. 다만 "민감한 정보가 딥엘 무료 버전에 사용 되는 것을 권장하지 않는다"라고 덧붙였다.
- 기자 사진 윤지혜 기자
<저작권자 © ‘돈이 보이는 리얼타임 뉴스’ 머니투데이. 무단전재 및 재배포, AI학습 이용 금지>