스캐터랩 "이루다 개인정보 유출 오해..카톡 의혹은 조사중"

문희철 2021. 1. 12. 16:04

번역beta Translated by kaka i

닫기

글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

매우 작은 폰트
작은 폰트
보통 폰트
큰 폰트
매우 큰 폰트

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

닫기

20대 여대생을 페르소나로 개발한 인공지능 챗봇 이루다. [페이스북 캡쳐]

인공지능(AI) 챗봇 서비스 ‘이루다’를 선보인 스타트업 스캐터랩이 12일 추가 입장문을 발표했다. 그간 언론에 등장했던 각종 의혹을 질의응답(Q&A) 형식으로 배포했다.

스캐터랩은 이 입장문에서 “개인정보 유출설은 오해”라고 해명했다. 알고리즘이 개별 문장 단위 대화에서 개인정보를 자동으로 비식별화한다는 주장이다. 스캐터랩 관계자는 “이루다가 사용한 대화 정보는 모두 분절화해 있다”며 “특히 숫자·이름과 주소·계좌번호·전화번호 등은 이루다 출시 당시부터 삭제됐었다”고 말했다.

이루다가 대화 도중 구체적인 은행·인물의 이름을 언급했다는 언론 보도가 있었다. 이에 대해서 스캐터랩은 “(이루다가 학습한 1억 개의 한국어 대화 데이터베이스에 들어있는) 개별 문장이 기계적으로 걸러지는 과정에서, 문맥에 따라 (분절화한 개인정보가) 남아 있는 부분이 발생했다”며 이에 대해 사과했다.

다만 이 정보는 분절화해 있어 특정 인물의 실명과 계좌번호는 아니라는 게 스캐터랩 측의 주장이다. “문장 내의 이름 정보가 다른 정보가 결합돼 이용되지 않았다”는 것이다. 예컨대 A라는 인물이 B라는 계좌번호를 카카오톡에서 언급했더라도, 이루다는 A가 아닌 C라는 인물이 B라는 계좌번호를 갖고 있다는 식으로 대화했다는 것이 스캐터랩 측의 주장이다.

스캐터랩은 향후 ▶실명 필터링 ▶한글 주소 비노출 ▶대화 데이터 변형 ▶민감 정보 노출 방지를 위해 기존 알고리즘을 전면 개선하겠다고 밝혔다.

━
“혐오적·차별적 대화를 시도하면 AI가 동조”

이루다는 소수자나 특정 집단을 비하하는 용어를 사용하기도 했다. 이에 대해서는 “이루다 서비스 출시 전부터 이에 대비해 혐오·비하 단어를 제거했지만, 시나리오를 벗어난 질문에 ‘자체 AI 알고리즘’을 기반으로 답변하다가 벌어진 사고”라고 밝혔다.

이루다의 자체 AI 알고리즘은 채팅하면서 상대방에게 적절한 방식의 문구를 선택한다. 구체적으로, 이루다는 이용자와 서로 주고받은 10차례의 대화 기록을 기반으로 다음에 할 말을 선택한다. 이때 상대방의 맥락과 표현 분위기나 말투, 대화 내용과 가장 비슷한 표현을 사용해 대답하는 경향이 있다고 한다. 따라서 이용자가 “맥락상 혐오적·차별적 대화를 시도하면, 이용자에게 공감하려는 AI 알고리즘이 이에 동조하는 것처럼 보일 수 있다”는 것이 스캐터랩의 설명이다.

이루다를 임의로 편향 학습시켰다는 주장에 대해서는 “불가능한 일”이라고 반박했다. “사용자가 이루다를 실시간 학습시킬 수 없기 때문”이다.

한편 스캐터랩 직원들이 가입자의 사적인 카카오톡 대화를 돌려봤다는 의혹에 대해선 자체 진상조사위원회를 꾸려 조사 중이라고 밝혔다. 스캐터랩은 “원 데이터에 접근할 수 있는 권한은 엄격하게 제한해 철저히 관리한다”며 “진상 조사 후 의혹이 사실로 드러나면 관련자들에게 엄중히 책임을 묻겠다”고 밝혔다.

스캐터랩은 이날 오전 11시부터 순차적으로 이루다 서비스를 중단했으며, 이날 오후 6시까지 서비스를 전면 중단할 예정이다. “현재 제기된 문제점을 모두 개선할 때까지 서비스를 중단한다”는 게 스캐터랩 측의 입장이다.

문희철 기자 reporter@joongang.co.kr

중앙일보에서 직접 확인하세요. 해당 언론사로 이동합니다.

IT/과학

스캐터랩 "이루다 개인정보 유출 오해..카톡 의혹은 조사중"