이루다 개발사 "DB 1억건 폐기" 이용자들 "카톡대화 100억건 전부 없애야"(종합)

손인해 기자 2021. 1. 15. 12:05
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

개인정보 취급·처리가 부적절했다는 논란에 휩싸인 인공지능(AI) 챗봇 '이루다' 개발사가 이루다의 데이터베이스(DB) 및 이루다의 학습에 사용된 딥러닝 대화 모델을 폐기하기로 했다.

그러면서 "이루다 DB는 비식별화 절차를 거쳐 개별적이고 독립적인 문장 단위로 이뤄져 개인 식별이 가능한 데이터는 포함돼 있지 않다. 또 딥러닝 대화 모델은 비식별화 절차를 거친 데이터를 토대로 대화 패턴만을 학습하고 AI는 데이터를 벡터값으로 기억하기 때문에 개인정보가 유출될 위험이 전혀 없다"면서도 "이용자들의 불안감을 고려해 이번 폐기를 결정했다"고 했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

연애의과학·텍스트앳 이용자들로부터 수집한 DB는 신청 받아 삭제
"적합한 동의 절차 없이 얻은 데이터 폐기해야..스캐터랩 말장난" 반발
인공지능(AI) 챗봇 이루다. 성희롱 및 장애인·성소수자 혐오발언에 이어 개인정보 취급·처리가 부적절했다는 논란에 휩싸이며 출시 3주만인 지난 12일 서비스를 잠정 중단했다. © 뉴스1

(서울=뉴스1) 손인해 기자 = 개인정보 취급·처리가 부적절했다는 논란에 휩싸인 인공지능(AI) 챗봇 '이루다' 개발사가 이루다의 데이터베이스(DB) 및 이루다의 학습에 사용된 딥러닝 대화 모델을 폐기하기로 했다.

하지만 이용자들은 이루다의 DB뿐 아니라 이루다 개발에 쓰인 카카오톡 대화 내용 전량을 폐기해야 한다고 맞서고 있다.

스캐터랩은 15일 "자사는 현재 개인정보보호위원회와 한국인터넷진흥원(KISA)의 조사를 받고 있으며 조사가 종료되는 즉시 이루다 DB와 딥러닝 대화 모델의 폐기를 진행한다는 방침"이라고 밝혔다.

이어 "기존 '연애의 과학'과 '텍스트앳'에서 이용자의 동의를 받고 수집됐던 기존 데이터는 데이터 활용을 원하지 않는 이용자로부터 신청을 받은 후 해당 이용자의 데이터를 모두 삭제할 예정이며 이는 향후 딥러닝 대화 모델에도 이용되지 않는다"고 덧붙였다.

이루다는 스캐터랩이 연애의 과학·텍스트앳 이용자들로부터 수집한 카카오톡 대화 내용 100억건에서 비식별화 과정을 거친 1억개의 문장을 말했다.

스캐터랩이 삭제한다는 건 이루다가 말한 1억개의 문장이고 이용자들로부터 수집한 카카오톡 대화 100억건은 해당하지 않는다는 의미다. 텍스트앳으로부터 수집한 카카오톡 대화 규모는 아직 알려지지 않았다.

회사는 "관련 후속 조치는 각 애플리케이션(앱) 공지를 통해 안내받을 수 있으며 향후 신규 가입 및 서비스 이용시에는 개인정보 수집과 이용 동의 절차를 강화할 계획"이라고 했다.

현재 스캐터랩은 연애의 과학 이용자들로부터 메일을 통해 삭제 신청을 받고 있으나 앞으로 앱 내에서 삭제가 가능한 별도의 메뉴를 설정할 예정이다.

그러면서 "이루다 DB는 비식별화 절차를 거쳐 개별적이고 독립적인 문장 단위로 이뤄져 개인 식별이 가능한 데이터는 포함돼 있지 않다. 또 딥러닝 대화 모델은 비식별화 절차를 거친 데이터를 토대로 대화 패턴만을 학습하고 AI는 데이터를 벡터값으로 기억하기 때문에 개인정보가 유출될 위험이 전혀 없다"면서도 "이용자들의 불안감을 고려해 이번 폐기를 결정했다"고 했다.

이용자들은 "적합한 동의 절차 없이 얻은 데이터이고, 그 데이터는 전부 폐기해야 한다. 스캐터랩의 입장은 말장난에 불과하다"며 데이터 전량 폐기를 요구하고 있다.

이용자들은 스캐터랩이 이용자들의 연인 간 사적 대화 내용을 제대로 된 고지 없이 수집·활용했고, 이루다를 통해 공개된 이 개인정보가 제대로 익명화(비식별화)되지 않았다며 데이터 전량 폐기를 주장해왔다.

스캐터랩은 실명을 포함한 민감정보가 그대로 노출된 카카오톡 대화 내용 1700건을 오픈소스 플랫폼에 15개월 동안 공유했다는 사실에 대해서도 인정하고 사과한 바 있다.

이루다는 성희롱 및 장애인·성소수자 혐오발언에 이어 개인정보 취급·처리가 부적절했다는 논란에 휩싸이며 출시 3주만인 지난 12일 서비스를 잠정 중단했다.

son@news1.kr

Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.

이 기사에 대해 어떻게 생각하시나요?