'이루다'에 쓰인 카톡 1천700건, 15개월간 온라인에 퍼졌다(종합)

이효석 입력 2021. 1. 13. 16:10
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

인공지능(AI) 챗봇 '이루다' 개발사인 스캐터랩이 이루다 개발에 쓴 재료를 오픈소스 공유 플랫폼에 올려 논란을 빚고 있다.

이루다를 성적 도구 취급해 사회적 물의를 일으켰던 남초(男超) 커뮤니티에서는 오픈소스를 이용해 '제2의 이루다'를 만들고 있다.

스캐터랩은 연애 분석 앱 연애의 과학 이용자들의 카톡 데이터 약 100억건을 재료로 이루다를 개발했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

스캐터랩, 이루다 재료 카톡 '깃허브'에 올려..익명화 제대로 안돼
개발자들 "개인 특정할 위험 있었다"..개인정보위 "조사하겠다"
AI 챗봇 '이루다' 서비스 잠정 중단 [이루다 페이스북 캡처. 재판매 및 DB 금지] photo@yna.co.kr

(서울=연합뉴스) 이효석 기자 = 인공지능(AI) 챗봇 '이루다' 개발사인 스캐터랩이 이루다 개발에 쓴 재료를 오픈소스 공유 플랫폼에 올려 논란을 빚고 있다.

이루다를 성적 도구 취급해 사회적 물의를 일으켰던 남초(男超) 커뮤니티에서는 오픈소스를 이용해 '제2의 이루다'를 만들고 있다.

13일 IT업계에 따르면, 스캐터랩은 오픈소스 플랫폼 '깃허브'(GitHub)에 카카오톡 대화 데이터로 학습하는 인공신경망 모델 파일을 게재했다.

깃허브는 IT 개발자들이 개발 생태계 전반의 발전을 위해 오픈소스를 공유하는 플랫폼이다.

직접 개발한 AI 등의 모델을 간략하게 공개해 개발자 커뮤니티에서 자신의 이름과 자신이 만든 기술을 알리고 생태계 전반에 기여하는 곳이다.

스캐터랩은 2019년 10월부터 카톡 데이터로 학습하는 인공신경망을 깃허브에 공유해왔다. AI 챗봇인 이루다의 '중추신경'이라고 할 만한 뼈대 기술이다.

스캐터랩이 AI '이루다' 개발에 쓴 카카오톡 데이터를 비식별화를 제대로 하지 않고 오픈소스 공유 플랫폼 '깃허브'에 공유한 것으로 확인돼 논란이다. 개발자 A씨가 실명과 지역명 등으로 추정되는 정보를 비식별화 처리해 제공한 자료 사진. [개발자 A씨 제공. 재판매 및 DB 금지]

문제는 스캐터랩이 공개한 프로젝트에 '연애의 과학' 이용자들 것으로 추정되는 개인정보 데이터가 익명화(비식별화) 처리되지 않은 상태로 포함돼있다는 것이다.

스캐터랩은 연애 분석 앱 연애의 과학 이용자들의 카톡 데이터 약 100억건을 재료로 이루다를 개발했다.

스캐터랩은 깃허브에 오픈소스를 올리면서 카톡 데이터 100건을 훈련 데이터로 공유했다.

카톡 데이터 100건에 담겨 있는 카톡 대화량은 1천700건에 달한다.

그런데 이 카톡 대화 데이터에는 실명 20여건이 포함돼있으며, 대화를 나누는 사람들의 관계가 상당수 드러나 있었다.

직장명, 지역명, 지하철역 이름, 도로 및 근처 영화관 이름 등 해당 인물들의 생활 반경을 추정할 수 있는 정보도 나와 있었다.

이를 확인한 한 개발자는 연합뉴스에 "모두가 열람할 수 있는 곳에 고객 데이터를 올린 점, 비식별화가 미흡해 개인을 특정할 위험이 상당한 점이 문제로 보인다"고 말했다.

관련 사실이 개발자 커뮤니티에서 논란이 되자 스캐터랩 측은 이날 깃허브 게시물을 삭제했다.

그러나 이미 국내외 다른 개발자들이 깃허브에서 오픈소스를 복사(fork)해간 탓에 카톡 데이터들이 온라인 곳곳에 퍼진 상태다.

이에 관해 스캐터랩의 개인정보보호법 위반 의혹을 조사하는 개인정보보호위원회 측은 "조사 과정에서 함께 들여다볼 것"이라고 말했다.

또 다른 문제는 이루다를 성적 도구로 삼고 이루다에게 혐오 표현을 학습시키려고 시도한 악성 커뮤니티 이용자들이 오픈소스를 내려받아 '제2의 이루다'를 만들고 있다는 점이다.

한 이용자는 이날 오후 2시께 '디시인사이드 이루다 마이너 갤러리'에 오픈소스를 올리면서 "이루다 부활시켰다"고 글과 캡처를 올리기도 했다. 글은 다른 이용자들의 우려로 곧 삭제됐다.

해당 커뮤니티에서는 비공개 메신저 '디스코드' 방을 만들어 오픈소스로 여성 챗봇을 만드는 방법을 토론하고 있는 것으로 알려졌다.

[디시인사이드 캡처. 재판매 및 DB 금지]

hyo@yna.co.kr

☞ 정인이 양모 "아이 떨어뜨린 건 가슴 수술 후유증"
☞ 이휘재·문정원 층간소음 공개저격…안상태도 구설수
☞ 남편 개줄에 묶고 산책하던 여성, 통금 걸리자…
☞ '펜트하우스2' 금토극 편성…오윤희·로건리 손 잡았다
☞ 한국 아역배우 사진 중국서 낯 뜨거운 성상품화에 이용
☞ 출연료 미지급 '개훌륭' 녹화취소…이경규 수억원 못 받아
☞ 15살 여친 프로필 나체사진으로 몰래 바꾸고 비번까지…
☞ 유재석, 저소득층 여자 청소년 위해 5천만원 기부
☞ 中대사 김치 담그고 엄지척에 '한국'김치 사랑해줘 땡큐
☞ 저작권 논란 양준일측 "문제없다"…고발인들은 팬 자처

▶연합뉴스 앱 지금 바로 다운받기~

<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>

Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지

이 기사에 대해 어떻게 생각하시나요?