개인정보 유출 논란에..'이루다' 개발사 "DB·딥러닝 모델 폐기"(종합)

이재은 2021. 1. 15. 16:25
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

인공지능(AI) 챗봇 '이루다'의 개발사 스캐터랩이 15일 이루다의 데이터베이스(DB)와 학습에 사용된 딥러닝 대화 모델을 폐기하기로 결정했다.

스캐터랩은 현재 한국인터넷진흥원(KISA)과 개인정보보호위원회의 조사가 종료되는 즉시 이루다 DB와 딥러닝 대화 모델의 폐기를 진행한다는 방침이다.

스캐터랩 관계자는 "이용자들의 불안감을 고려해 이번 인공지능 '이루다'의 DB 전량과 딥러닝 대화 모델을 폐기하기로 했다"고 말했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

개인정보보호위원회-KISA 조사 후 데이터 삭제 진행
"개인정보 유출 위험 없으나 이용자 불안감 고려해 폐기"
"삭제 원하는 이용자 신청 받은 후 데이터 모두 삭제 예정"

[서울=뉴시스] 이재은 기자 = 인공지능(AI) 챗봇 '이루다'의 개발사 스캐터랩이 15일 이루다의 데이터베이스(DB)와 학습에 사용된 딥러닝 대화 모델을 폐기하기로 결정했다.

스캐터랩은 현재 한국인터넷진흥원(KISA)과 개인정보보호위원회의 조사가 종료되는 즉시 이루다 DB와 딥러닝 대화 모델의 폐기를 진행한다는 방침이다.

스캐터랩 관계자는 "이용자들의 불안감을 고려해 이번 인공지능 '이루다'의 DB 전량과 딥러닝 대화 모델을 폐기하기로 했다"고 말했다.

스캐터랩 측은 다만 이루다 DB는 비식별화 절차를 거쳐 개별적이고 독립적인 문장 단위로 이뤄져 개인 식별이 가능한 데이터는 없다고 밝혔다. 또한 딥러닝 대화 모델은 비식별화 절차를 거친 데이터를 토대로 대화 패턴만을 학습하고, 인공지능은 데이터를 벡터값으로 기억하기 때문에 개인정보가 유출될 위험이 전혀 없다고 언급했다.

스캐터랩은 이루다 개발에 활용된 ‘연애의과학’과 ‘텍스트앳’에서 데이터 활용을 원하지 않는 이용자로부터 신청을 받은 후 해당 데이터를 모두 삭제할 예정이다. 이는 향후 딥러닝 대화 모델에도 이용되지 않는다.

관련 후속 조치는 각 어플리케이션 공지를 통해 안내 받을 수 있다. 향후 신규 가입과 서비스 이용시에는 개인정보 수집, 이용 동의 절차를 강화할 계획이다.

앞서 이루다는 20세 여성 캐릭처로 설정해 지난해 12월23일 출시됐다. 출시된 지 2주 만에 이용자 75만명을 기록하기도 했다. 하지만 온라인 커뮤니티 등에서 이루다에 대한 성희롱 논란이 휩싸였다.

게다가 동성애, 장애인 등 사회적 소수자에 대한 혐오발언에 이어 연애의 과학 이용자들의 카카오톡 대화를 학습하면서 사용됐던 데이터가 제대로 익명화되지 않아 개인정보유출 의혹까지 일자 지난 12일 서비스를 잠정 중단했다. 하지만 연애의과학 이용자들은 스캐터랩이 개인정보를 유출했다면서 집단소송을 준비하고 있다.

스캐터랩은 전날 "깃허브에 공개한 오픈소스에 내부 테스트 샘플이 포함된 사실이 확인됐다. 실명을 자동화 비식별 처리했는데, 필터링 과정에 걸러지지 않은 부분이 일부 존재했다”며 “데이터 관리에 신중하지 못했다. 민감할 수 있는 정보가 노출된 점에 진심으로 사과드린다"고 사과문을 냈다.

☞공감언론 뉴시스 lje@newsis.com

Copyright © 뉴시스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?