'이루다' 개발사, 실명 노출된 카톡 1700건 온라인에 공유했다
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
인공지능(AI) 챗봇 '이루다' 개발업체 스캐터랩이 비식별화 과정을 제대로 거치지 않은 카카오톡 대화 묶음 100건(1700건)을 오픈소스 플랫폼에 올려 논란이 일고 있다.
이 개발자는 "모두가 접근할 수 있는 곳에 고객의 사적인 대화 100건을 올리는 건 문제의 소지가 있는 듯 하다"며 "또 비식별화가 제대로 이뤄지지 않았다"고 말했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
대화 상대방과 관계·기저 질환·생활반경 유추 가능한 정보
(서울=뉴스1) 손인해 기자,김승준 기자 = 인공지능(AI) 챗봇 '이루다' 개발업체 스캐터랩이 비식별화 과정을 제대로 거치지 않은 카카오톡 대화 묶음 100건(1700건)을 오픈소스 플랫폼에 올려 논란이 일고 있다.
개인정보 수집·활용 목적을 명확히 고지하지 않았다는 비판과 함께 개인정보 유출 문제가 본격 도마에 오를 것으로 보인다.
13일 업계에 따르면 스캐터랩은 지난 2019년10월부터 오픈소스 플랫폼 '깃허브'에 자사가 구현한 '문장 생성 모듈' 프로젝트를 오픈소스로 공개했다.
깃허브는 IT 개발자들이 컴퓨터 프로그램 소스를 공유하고 협업할 수 있는 공간이다.
문제는 해당 프로젝트 데이터셋으로 자사 애플리케이션(앱) '연애의 과학'에서 가져온 카카오톡 대화 내용을 비식별화 과정 없이 공개했다는 점이다.
100여건의 대화 묶음이 담긴 이 데이터에는 실명이 20여번 이상 필터링되지 않고, 대화 상대방과의 관계가 그대로 나온다. 해당 대화 묶음은 1700줄짜리 텍스트 분량이다.
뉴스1이 데이터셋 일부를 확인한 결과 "OO아, 오늘 몇시까지 놀 수 있어??" ,"OO씨~~비행기잘탔어요?" 처럼 실명이 그대로 노출된 사례가 발견됐다.
또 특정 커플의 대화가 15건 이상 수록돼 있었고, 개인 기저 질환을 유추할 수 있는 대화 내용이나 생활반경, 직장 관련 정보가 등장하기도 했다.
해당 데이터셋은 이날 오전 한 개발자가 페이스북 텐서플로우 커뮤니티에 관련 사실을 폭로한 지 15분 만에 삭제했다.
이 개발자는 "모두가 접근할 수 있는 곳에 고객의 사적인 대화 100건을 올리는 건 문제의 소지가 있는 듯 하다"며 "또 비식별화가 제대로 이뤄지지 않았다"고 말했다.
앞서 스캐터랩은 전날 개인정보 유출과 관련해 "개별 문장 필터링 조치에도 문맥에 따라 인물의 이름이 남아 있다거나 하는 부분이 발생한 점에 대해 사과드린다"고 밝힌 바 있다.
연애의 과학 이용자들은 스캐터랩이 명확한 고지 없이 연인 간 사적 대화를 AI 챗봇을 통해 공개되도록 했다며 집단 소송 움직임을 보이고 있다.
연애의 과학은 연인이나 호감 가는 사람과 나눈 카톡 대화 내용을 집어넣고 3000~5000원 비용을 지불하면 애정도 수치를 분석해주는 서비스다.
성희롱에 이어 혐오표현, 부적절한 개인정보 수집 과정 및 유출 논란을 겪은 이루다는 지난 12일 출시 3주 만에 서비스를 잠정 중단했다.
son@news1.kr
Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.
- 손혜원 '양정철, 文이 쳐낸 사람 …또 기어 들어와 차기 주자에 접근할 것'
- 방송 중 발끈한 나경원 '저한테 물어보셔야지, 끝까지 안철수만…그만'
- 심은진·전승빈 결혼→전처 홍인영 의미심장글→'이혼 심은진 때문 아냐'(종합)
- '이휘재 아내' 문정원, 이웃 층간소음 항의에 사과→네티즌 비판→글 삭제
- 이준석 ''安잘알'은 모두 안철수에 부정적…겪어보면 안다'
- 전진 '김구라 아내 미인, 남편을 아기 다루듯…류이서와 2대2 만남'
- [N샷] 서정희, 60세에도 금발 완벽 소화…'은하철도999' 메텔 같네
- 권윤미 '이가형이 관계중 트월킹 시켜'…배윤정 '댄서와 잠자리 로망'
- '라스' 솔비, 케이크 논란 언급…'성형 충동적으로 하면 안돼' 깨달음도 고백
- '어! 뭐였더라' 비트코인 지갑 비번 잊어 2600억 날릴 위기