[일문일답] '이루다' 스캐터랩 입 열었다.. "내 정보 정말 유출됐을까?"

강소현 기자 2021. 1. 12. 16:41
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

스캐터랩의 인공지능(AI) 챗봇 '이루다'가 연일 화제를 모으고 있는 가운데 사측이 2차 공식 입장문을 게재했다. /사진=이루다 인스타그램
스캐터랩의 인공지능(AI) 챗봇 '이루다'가 연일 화제를 모으고 있는 가운데 사측이 2차 공식 입장문을 게재했다. 특히 스캐터랩 측은 최근 사내에서 직원들끼리 수집된 데이터를 돌려봤다는 의혹에 대해 "진상을 신속히 조사하고 의혹이 사실로 드러날 경우 관련자들에게 엄중히 책임을 묻고 조속히 필요한 조치를 하도록 하겠다"는 입장을 밝혔다. 

이하 스캐터랩 측의 일문일답 전문이다. 

Q1 이루다 서비스 중단 시점은 언제이며, 얼마만큼의 중단 기간을 가지는지?

오늘(12일) 오전 11시부터 순차적으로 중단, 오후 6시까지 전면 중단 완료했다. 현재 제기되고 있는 문제점들과 기존에 계획중이던 개선사항이 완비될까지 서비스 운영을 중단할 예정이다.  
Q2 개인정보보호를 위한 비식별화 조치들이 어떤 것들이 있었나? 향후 추가적으로 어떻게 조치할 예정인가? 

이루다는 DB에 수록되어 있는 문장에서 적절한 답변을 선택하여 응답하고 있다. 해당 DB에는 1억개의 문장이 개별적이고 독립적인 형태로 저장돼 있다. 이루다는 AI 알고리즘에 따라 가장 적절하다고 판단하는 문장을 선택해 답변하도록 설계돼 있기 때문에 루다의 답변 내용을 조합하여 개인을 특정할 수는 없다.

또 개별 문장 단위의 대화 내용에서는 알고리즘에 의해 비식별화 조치를 했다. 숫자와 영문, 실명 정보 등은 아래와 같이 기계적인 필터링을 거쳐 삭제했기 때문에 이루다의 최초 출시 당시부터 모두 삭제가 된 상태였다.

출시 이전에 개인정보보호를 위해 그동한 취한 비식별화 조치는 구체적으로 다음과 같다.
-숫자와 영문이 포함된 메시지 삭제: 주소, 계좌번호, 전화번호 등의 개인정보가 포함될 수 있는 메시지 제거
-특정 단어가 실명인지 판단하는 알고리즘을 이용하여 실명이 들어갔다고 판단되는 문장을 모두 삭제
-내부 테스트 및 베타 테스트를 통해 발견되는 실명을 리스트로 관리하여, 해당 실명이 들어간 문장들을 모두 삭제

위와 같은 조치에도 대화 내용 중에 은행 이름이나 인물 이름이 등장한다는 지적이 있었다. 1억건의 개별 문장을 사람이 일일이 검수하기는 어렵기 때문에 알고리즘을 통한 기계적인 필터링을 거쳤고 이 과정에서 되도록 많은 변수를 주려고 노력했으나 문맥에 따라 인물의 이름이 남아 있다거나 하는 부분들이 발생했다. 해당 사항에 대해 더욱 세심히 주의를 기울이지 못하고 인물 이름이 등장하게 된 점 사과를 드린다. 다만 문장 내의 이름 정보가 다른 정보가 결합되어 이용되지 않음을 말씀 드린다.

서비스 출시 이후 민감할 수 있겠다고 판단되는 부분들을 발견 즉시 내부 모니터링 팀을 통하여 필터링을 하며 대응 중이었다. 다만 한글 등을 이용한 변칙적인 방법으로 답변이 이루어진 경우에는 모두 걸러 내지 못한 부분이 있습니다. 이 부분에 대해서도 다시 한번 사과드린다.

향후에는 다음과 같이 더욱 고도화된 데이터 알고리즘 업데이트를 통해 대응할 예정이다. 
-실명 필터링 알고리즘을 강화하여 민감할 수 있는 정보가 노출되지 않도록 업데이트
-한글로 작성된 주소라도 노출되지 않도록 주소 필터링 알고리즘 업데이트
-대화 데이터 랜덤 변형을 통한 비식별화 조치 강화
-민감정보 노출 방지 알고리즘을 전면적으로 개선하여 개인정보 보호 강화

Q3 “사내 대화방에서 수집된 대화를 직원끼리 돌려봤다"는 증언이 나왔는데 이는 사실인가?

스캐터랩은 사용자들의 개인정보 보호를 회사의 중요한 사명으로 생각하고 있으며 이를 위하여 접근통제 조치 등 개인정보 보호법에 따른 제도를 마련하여 시행 중에 있다.

특히 개인정보와 관련된 원 데이터에 접근할 수 있는 권한은 엄격하게 제한하여 철저히 관리하고 있다. 그럼에도 불구하고 위와 같은 회사의 방침을 위반한 불미스러운 행동이 있었다는 언론보도가 있었다. 저희는 진상을 신속히 조사하고 만에 하나 의혹이 사실로 드러나는 경우에는 관련자들에게 엄중히 책임을 묻고 조속히 필요한 조치를 하도록 하겠다.

해당 이슈를 인지함과 동시에 사내에서 자발적으로 진상조사위원회가 구성되어 조사를 진행하고 있다. 조사위원회에서는 과거부터 현재까지 지속되고 있는 스캐터랩 전 팀원이 참여하고 있는 카카오톡의 대화의 조사를 완료했으며 당해년도 카카오 단톡에서는 해당 내용이 발견되지 않았다. 또 다른 사내 메신저 채널인 슬랙에 대해서는 다수의 대화 채널이 있는 관계로 현재 계속해서 조사를 진행중인 상태다. 조사 결과는 투명하게 공개하도록 하겠다.

조사 결과가 나올 때까지 확인되지 않은 사실에 대한 근거 없는 보도는 자제하여 주시기 바란다.

Q4 스캐터랩의 데이터 보안 환경은 어떤지?

스캐터랩은 망분리가 된 서버 환경 하에, 사내 보안 부문을 총괄하는 담당자를 지정하여 관리하고 있다. 그리고 본사가 제공하고 있는 서비스 데이터들은 모두 철저히 분리되고 통제된 환경에서 관리되고 있다.

연애의 과학의 원본 데이터는 지정된 한 명의 담당자(CTO)만이 접근할 수 있고 핑퐁 데이터는 개인 식별 정보가 제거된 상태로 분리하여 별도 보관하고 있다. 또 데이터 점검이 필요할 경우에는 데이터 샘플링을 통해 극히 일부의 데이터만으로 점검한다.

그렇기 때문에 일부 언론에서 제기하신 사이버 공격으로 인한 역코딩, 리버스 엔지니어링 등을 통한 데이터 복구 및 개인정보 유출과 악용은 일어날 수 없다.

Q5 스캐터랩 김종윤 대표의 현재 심정은?

쉽지 않은 3주 였다. 작은 스타트업 스캐터랩이 만든 이루다라는 AI에 많은 사용자가 몰리고 엄청난 언론의 주목을 받았던 믿기 어려운 시간이었다. 급격한 성장 속에서 저희가 제대로 대처하지 못한 부분도 있었고 미숙함이 적나라하게 드러나기도 했다. 저와 저희 팀도 스스로를 많이 돌아보게 되는 시간이었다. 지금 저희의 첫 걸음은 이렇게 멈췄다. 하지만 사람만큼 대화를 잘하는 친구 같은 AI를 만들겠다는 저희의 꿈을 멈추고 싶지는 않다. 이번에 이슈가 된 부분을 성찰의 기회로 삼아 기술적으로, 그리고 사회적으로 가치있는 스타트업으로 거듭나고 싶다. 많이 부족하고 거칠고 시행착오가 많지만 저희가 이 꿈을 이어갈 수 있게 응원 부탁드린다. 

[머니S 주요뉴스]
단체로 벗었다… 19禁 걸그룹 멤버들 '후끈'
속옷만 입은 커플, 방바닥에서… "못봐주겠다"
이세영, 쌍커풀 수술만 했다고?… "너무 예뻐"
앞만 가렸어요… 퀸화사, 매끈 등라인 '아찔'
"설마 누드야?"… 고준희 화보에 '난리'
양준혁 충격 "결혼, 이렇게까지 해야 하나?"
'21kg 감량' 김형석 다이어트, 수트핏 보니?
허경환·김지민, 50세에 정말 결혼하나?
이용식 딸 이수민, 외모 화제… 김학래 "며느리"?
'팽현숙 반찬가게'… 최양락 토끼탈 쓰고 홍보?

강소현 기자 kang4201@mt.co.kr
<저작권자 ⓒ '성공을 꿈꾸는 사람들의 경제 뉴스' 머니S, 무단전재 및 재배포 금지>

Copyright © 머니S & moneys.co.kr, 무단 전재 및 재배포 금지

이 기사에 대해 어떻게 생각하시나요?