이루다 DB 폐기 '연애의 과학'은 제외..이용자들 "꼬리자르기, 전량 폐기 해야"

CBS노컷뉴스 김연지 기자 입력 2021. 1. 15. 14:42
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

성희롱 논란에 이어 혐오·차별 발언과 개인정보 유출 논란에 휩싸인 인공지능(AI) 챗봇 '이루다'가 사실상 폐기 수순을 밟는다.

스캐터랩 측은 "이루다 DB는 비식별화(익명화) 절차를 거쳐 개별적·독립적인 문장으로 이뤄져 있고, 딥러닝 대화 모델은 대화 패턴만 학습하기 때문에 개인정보 유출 위험은 전혀 없다"면서도 "이용자들 불안감을 고려해 폐기를 결정했다"고 설명했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

개발사 스캐터랩, '이루다' DB·딥러닝 폐기 결정
"원하는 이용자는 대화 데이터 삭제 할 수 있어"
'연애의 과학' 이용자들 "카톡 DB 전체 파기해야"
인공지능(AI) 챗봇 '이루다'. 연합뉴스
성희롱 논란에 이어 혐오·차별 발언과 개인정보 유출 논란에 휩싸인 인공지능(AI) 챗봇 '이루다'가 사실상 폐기 수순을 밟는다. '이루다' 개발사 스캐터랩이 이루다 DB와 이루다의 학습에 사용된 딥러닝 대화 모델을 폐기한다고 밝힌 것이다.

그러나 '이루다' 제작에 활용된 '연애의 과학' 데이터베이스(DB)는 폐기하지 않겠다는 입장을 고수했다. 삭제를 원하는 이용자만 DB를 삭제하겠다는 방침이다.

스캐터랩은 15일 보도자료를 내고 "이루다 DB와 이루다 학습에 사용된 딥러닝 대화 모델을 폐기하기로 결정했다"고 발표했다.

스캐터랩은 개인정보보호위원회·한국인터넷진흥원(KISA) 합동 조사가 종료되는 즉시 이루다 DB와 딥러닝 대화 모델을 폐기하기로 했다.

스캐터랩 측은 "이루다 DB는 비식별화(익명화) 절차를 거쳐 개별적·독립적인 문장으로 이뤄져 있고, 딥러닝 대화 모델은 대화 패턴만 학습하기 때문에 개인정보 유출 위험은 전혀 없다"면서도 "이용자들 불안감을 고려해 폐기를 결정했다"고 설명했다.

이들은 "기존 '연애의 과학'과 '텍스트앳'에서 이용자 동의를 받고 수집했던 데이터는 데이터 활용을 원하지 않는 이용자들이 신청할 경우 모두 삭제할 것"이라며 "이는 향후 딥러닝 대화 모델에도 이용되지 않는다"고 전했다.

이어 스캐터랩은 "향후 신규 가입 및 서비스 이용 시 개인정보 수집·이용 등의 절차도 강화하겠다"고 덧붙였다.

'AI 이루다' 개발한 스타트업 스캐터랩. 연합뉴스
스캐터랩은 챗봇 이루다를 만드는 과정에 연애 분석 앱 '연애의 과학' 이용자들의 카카오톡 데이터를 가져다 쓰면서 개인정보보호법을 어겼다는 의혹을 받고 있다.

개인정보보호위원회와 한국인터넷진흥원(KISA)이 현장에서 자료를 확보해 조사하고 있다.

연애의 과학 앱 이용자와 이용자의 연인에게 개인정보 이용·활용 동의를 제대로 받지 않은 점, 데이터를 이루다 재료로 쓰는 과정에 익명화(비식별화)를 제대로 하지 않은 점 등이 핵심이다.

연인들 대화 데이터를 사내 메신저에 부적절하게 공유한 직원이 있었다는 의혹도 받고 있으며, 제대로 익명화하지 않은 데이터를 오픈소스 공유 플랫폼 '깃허브'에 공유한 사실도 확인됐다.

연애의 과학. 구글플레이 홈페이지 캡처
연애의 과학 이용자들은 "이루다 DB가 아니라 카톡 데이터 전량을 파기해야 한다"고 요구하고 있다.

한 이용자는 "카톡 대화내용이면 대화 넘긴사람말고 대화를 했던 상대방은 모를수도 있는 건데 삭제요청 한 사람만 삭제해준다는 건 말이 안된다"고 지적했다.

또다른 이용자도 "이루다DB만 폐기한다는 것은 꼬리자르기"라면서 "다시 논란의 데이터 이용해서 개발하면 그만일 것"이라며 우려를 나타냈다.

누리꾼들은 "대충 넘어가지말고 제대로 처벌해야 앞으로 유사 범죄 막을 수 있다"면서 "양심적으로 운영되는 기업들에게 불똥튀는 것을 막기 위해서라도 이 일은 제대로 처벌돼야 한다"며 목소리를 높이고 있다.

스캐터랩은 연애의 과학으로 모은 카톡 데이터 약 100억건에서 1억건을 추려서 이루다 DB로 썼다고 밝힌 바 있다.

스캐터랩 관계자는 이날 MBC 라디오 '김종배의 시선집중'에 출연해 "개인정보 수집·이용 동의 과정의 경우 법률적 검토를 받았는데 법적으로 큰 문제가 없다고 들었다"며 "미흡했던 부분은 서비스 개선에 반영할 것"이라고 말했다.

▶ 기자와 카톡 채팅하기
▶ 노컷뉴스 영상 구독하기

[CBS노컷뉴스 김연지 기자] anc.kyj@gmail.com

Copyright © 노컷뉴스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?