'이루다' 개발에 쓴 카톡 대화, 온라인에 그대로 공개됐다

윤민혁 기자 2021. 1. 13. 15:53
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

서비스 종료된 인공지능(AI) 챗봇 '이루다' 개발에 사용한 소스(프로그램 재료)가 온라인 오픈소스 플랫폼에서 15개월 간 공유돼 온 것으로 확인됐다.

공개된 소스에는 이용자 실명과 거주 지역 등이 그대로 드러나 있어 논란이 확산 될 전망이다.

스캐터랩이 공유한 소스에는 이루다 학습에 사용된 것으로 알려진 '연애의 과학' 앱 사용자들의 대화 내역 100건이 비식별화(익명화)되지 않은 채로 들어 있다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[서울경제] 서비스 종료된 인공지능(AI) 챗봇 ‘이루다’ 개발에 사용한 소스(프로그램 재료)가 온라인 오픈소스 플랫폼에서 15개월 간 공유돼 온 것으로 확인됐다. 공개된 소스에는 이용자 실명과 거주 지역 등이 그대로 드러나 있어 논란이 확산 될 전망이다.

13일 개발자 커뮤니티 텐서 플로우 코리아에 올라온 ‘이루다’ 개발 소스 내 카카오톡 대화. 실명과 장소는 개인정보 보호를 위해 비식별화했다. /텐서 플로우 코리아 캡처
13일 IT업계에 따르면 스캐터랩은 지난 2019년 10월부터 오픈소스 공유 플랫폼 ‘깃허브(GitHub)’에 카카오톡 대화를 활용한 인공신경망 소스를 공개해왔다. 깃허브는 개발자들이 프로그래밍 소스를 공유하는 대표적인 플랫폼이다.

스캐터랩이 공유한 소스에는 이루다 학습에 사용된 것으로 알려진 ‘연애의 과학’ 앱 사용자들의 대화 내역 100건이 비식별화(익명화)되지 않은 채로 들어 있다. 100건의 대화에 포함된 카카오톡 채팅은 총 1,700여 건에 달한다. 이 소스 내에선 연애의 과학 이용자 실명이 20번가량 노출된다. 대화 상대방이 연인 관계인지 친구인지도 구분돼 있다. 거주지역을 알 수 있는 내용은 물론 직장 정보도 등장한다. “혈당을 뽑아서 측정한다”는 등 건강 관련 정보도 눈에 띈다.

이 사실은 IT 개발자 소셜네트워크(SNS) 커뮤니티를 통해 알려졌다. 논란이 일자 스캐터랩은 이날 깃허브 게시물을 삭제한 상태다.

이루다는 스캐터랩이 지난달 23일 출시한 AI 챗봇이다. 출시 2주 만에 75만 명에 달하는 이용자를 모았지만 성희롱·사회적 약자 혐오 등 논란을 빚었다. 스캐터랩이 지난 2016년에 출시했던 연애의 과학 앱의 개인정보를 사용했다는 의혹도 일었다. 스캐터랩은 지난 12일 이루다 서비스를 종료했지만 이용자 반발은 잦아들지 않고 있다. 연애의 과학 이용자 300여 명은 집단소송을 준비하고 있다. 개인정보보호위원회는 한국인터넷진흥원(KISA)과 함께 스캐터랩이 개인정보보호법 등을 위반했는지에 관한 현장 조사에 나섰다. /윤민혁기자 beherenow@sedaily.com

Copyright © 서울경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?