'이루다' 개발사, 실명 노출된 카톡 1700건 온라인에 공유했다

손인해 기자,김승준 기자 2021. 1. 13. 17:16
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

인공지능(AI) 챗봇 '이루다' 개발업체 스캐터랩이 비식별화 과정을 제대로 거치지 않은 카카오톡 대화 묶음 100건(1700건)을 오픈소스 플랫폼에 올려 논란이 일고 있다.

이 개발자는 "모두가 접근할 수 있는 곳에 고객의 사적인 대화 100건을 올리는 건 문제의 소지가 있는 듯 하다"며 "또 비식별화가 제대로 이뤄지지 않았다"고 말했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

텍스트 1700줄 분량 100여건 대화 묶음 비식별화 없이 공개
대화 상대방과 관계·기저 질환·생활반경 유추 가능한 정보
스캐터랩 측은 지난해 12월 이루다를 출시하며 이루다를 '가수 블랙핑크를 좋아하고, 일상을 기록하는 것을 취미가 있는 20살 여대생''으로 소개했다. (이루다 인스타그램)© 뉴스1

(서울=뉴스1) 손인해 기자,김승준 기자 = 인공지능(AI) 챗봇 '이루다' 개발업체 스캐터랩이 비식별화 과정을 제대로 거치지 않은 카카오톡 대화 묶음 100건(1700건)을 오픈소스 플랫폼에 올려 논란이 일고 있다.

개인정보 수집·활용 목적을 명확히 고지하지 않았다는 비판과 함께 개인정보 유출 문제가 본격 도마에 오를 것으로 보인다.

13일 업계에 따르면 스캐터랩은 지난 2019년10월부터 오픈소스 플랫폼 '깃허브'에 자사가 구현한 '문장 생성 모듈' 프로젝트를 오픈소스로 공개했다.

깃허브는 IT 개발자들이 컴퓨터 프로그램 소스를 공유하고 협업할 수 있는 공간이다.

문제는 해당 프로젝트 데이터셋으로 자사 애플리케이션(앱) '연애의 과학'에서 가져온 카카오톡 대화 내용을 비식별화 과정 없이 공개했다는 점이다.

100여건의 대화 묶음이 담긴 이 데이터에는 실명이 20여번 이상 필터링되지 않고, 대화 상대방과의 관계가 그대로 나온다. 해당 대화 묶음은 1700줄짜리 텍스트 분량이다.

스캐터랩이 지난해 오픈소스 플랫폼 '깃허브'에 공개한 '문장 생성 모듈' 프로젝트. 데이터셋으로 '연애의과학'에서 추출된 대화 데이터를 활용했다고 적시했다. © 뉴스1

뉴스1이 데이터셋 일부를 확인한 결과 "OO아, 오늘 몇시까지 놀 수 있어??" ,"OO씨~~비행기잘탔어요?" 처럼 실명이 그대로 노출된 사례가 발견됐다.

또 특정 커플의 대화가 15건 이상 수록돼 있었고, 개인 기저 질환을 유추할 수 있는 대화 내용이나 생활반경, 직장 관련 정보가 등장하기도 했다.

해당 데이터셋은 이날 오전 한 개발자가 페이스북 텐서플로우 커뮤니티에 관련 사실을 폭로한 지 15분 만에 삭제했다.

이 개발자는 "모두가 접근할 수 있는 곳에 고객의 사적인 대화 100건을 올리는 건 문제의 소지가 있는 듯 하다"며 "또 비식별화가 제대로 이뤄지지 않았다"고 말했다.

'이루다' 개발업체 스캐터랩이 오픈소스 플랫폼 '깃허브'에 올린 데이터셋 일부. 실명과 함께 "혈당을 뽑아서 측정한다"는 사실로 개인 기저 질환을 유추할 수 있다. 사진에서 등장하는 이름은 이름은 가명 처리했다. © 뉴스1

앞서 스캐터랩은 전날 개인정보 유출과 관련해 "개별 문장 필터링 조치에도 문맥에 따라 인물의 이름이 남아 있다거나 하는 부분이 발생한 점에 대해 사과드린다"고 밝힌 바 있다.

연애의 과학 이용자들은 스캐터랩이 명확한 고지 없이 연인 간 사적 대화를 AI 챗봇을 통해 공개되도록 했다며 집단 소송 움직임을 보이고 있다.

연애의 과학은 연인이나 호감 가는 사람과 나눈 카톡 대화 내용을 집어넣고 3000~5000원 비용을 지불하면 애정도 수치를 분석해주는 서비스다.

성희롱에 이어 혐오표현, 부적절한 개인정보 수집 과정 및 유출 논란을 겪은 이루다는 지난 12일 출시 3주 만에 서비스를 잠정 중단했다.

son@news1.kr

Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.

이 기사에 대해 어떻게 생각하시나요?