스캐터랩 "이루다 논란, 성찰의 기회로 삼겠다..꿈 멈추고 싶지 않다"

송화연 기자 2021. 1. 12. 16:27
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

스캐터랩, 온라인 미디어 질의응답 통해 '이루다' 관련 이슈에 직접 답변
이루다 서비스 오후 6시 전면 중단.."개선 완료되면 재운영"
스캐터랩이 개발한 AI 캐릭터 '이루다' (스캐터랩 홈페이지 갈무리) © 뉴스1

(서울=뉴스1) 송화연 기자 = 소수자 차별·혐오 발언과 개인정보 유출 문제로 논란을 빚고 있는 인공지능(AI) 챗봇 '이루다'가 12일 오후 6시 서비스를 일시 중단한다. 김종윤 스캐터랩 대표는 "이슈가 된 부분을 성찰의 기회로 삼아 기술적으로, 그리고 사회적으로 가치 있는 스타트업으로 거듭나겠다"고 밝혔다.

이날 스캐터랩은 온라인 미디어 질의응답(Q&A)을 통해 현재 쟁점화되고 있는 사안에 대해 답변했다. 질문은 Δ이루다가 학습한 데이터의 범위 Δ향후 조치방안 Δ수집된 대화 데이터를 직원들이 돌려봤다는 논란에 대한 해명 Δ보안사항과 서비스 중단 기간 등으로 이뤄졌다.

먼저 스캐터랩은 이루다가 학습한 데이터에 대해 자사 '핑퐁' 서비스와 '연애의과학' 텍스트 데이터를 기반으로 했다고 답했다. 이루다는 약 10턴(이용자와 상호 주고받은 10회의 대화 기록)의 대화를 기반으로 가장 적절한 답변을 선택해 말하도록 학습됐다.

스캐터랩은 이루다에 혐오 단어 또는 특정 집단에 대한 비하 단어가 입력될 가능성을 서비스 출시 전 인지하고, 이에 대비해 키워드 중 혐오·비하 단어를 무조건적으로 제거했다. 이런 상황에서도 이루다가 특정 이용자의 혐오 질문에 동조한 데 대해 회사는 "시나리오가 마련되지 않은 상황에서 이루다는 AI 알고리즘에 의한 판단으로 대답을 하게 된다"며 "이용자와 대화를 매끄럽게 이어가는 과정에서 혐오, 차별 발언에 동조하는 것처럼 보일 수 있다"고 말했다.

이를 개선하기 위해 스캐터랩 측은 "현실적인 조치로 키워드 기반으로 대응을 했지만 장기적으로는 AI 알고리즘을 더 많은 정제된 데이터를 통해 학습시키고, 이를 통해 알고리즘이 옳고 그름을 배워나갈 수 있도록 하는 방안이 필요하다"며 더 많은 양의 정제된 데이터를 통해 AI 알고리즘을 학습시키겠다는 의지를 내비쳤다.

회사는 구체적으로 "이루다가 이번에 사용자와 대화하면서 불완전했던 데이터를 더욱 엄격한 레이블링 기준을 도입하여 학습시킴으로써 이루다가 사회 보편적인 가치를 담은 AI가 될 수 있도록 개선해나가겠다"는 목표를 제시했다.

스캐터랩은 개인정보 유출 논란에 대해서도 해명했다. 회사 측은 "이루다 데이터베이스는 1억개의 개별적이고 독립적인 형태로 저장돼있고 이루다는 AI 알고리즘에 따라 적절하다고 판단하는 문장을 선택해 답변하도록 설계돼 이루다의 답변 내용을 조합해 개인을 특정할 수는 없다"고 선을 그었다.

회사는 그동안 주소, 계좌번호 등 숫자와 영문이 포함된 메시지를 삭제했으며 알고리즘을 이용해 실명이 들어갔다고 판단되는 문장을 모두 삭제했다고 설명했다. 나아가 서비스 정식 출시 전 테스트를 통해 발견되는 실명은 리스트로 관리해 모두 삭제했다고 덧붙였다.

그러나 일부 정보가 노출된 데 대해 회사는 "1억건의 개별문장을 알고리즘으로 필터링하는 과정에서 일부 이름이 남아있는 경우가 있었고, 내부 모니터링을 통해 대응해왔지만 일부 걸러내지 못한 부분이 있었다"며 해당 부분을 시인하고 사과했다. 회사 측은 "향후 고도화된 데이터 알고리즘 업데이트를 진행하겠다"고 덧붙였다.

스캐터랩 측은 "연애의 과학 사용자 데이터는 사용자의 사전 동의가 이루어진 개인정보취급방침의 범위 내에서 활용했으나, 연애의과학 이용자 중 AI 학습에 데이터가 활용되길 원치않는 이용자는 DB삭제 등 향후 추가 조치를 진행하겠다"고 공언했다.

아울러 회사는 일부 언론에서 이용자들의 대화방을 내부 직원들이 돌려봤다는 질문에 대해 "진상을 신속히 조사하고 의혹이 사실로 들어난다면 엄중히 책임을 묻고 조속히 조치를 취하겠다"고 강조했다. 회사는 현재 해당 이슈를 인지하고 사내 진상조사위원회를 구상하고 조사를 진행 중이다.

이밖에도 일각에서 우려를 제기한 사내 보안환경에 대해 회사는 "망분리가 된 서버 환경하에, 사내 보안 부문을 총괄하는 담당자를 지정하여 관리하고 있다"며 "연애의 과학의 원본 데이터는 지정된 한 명의 담당자(CTO)만이 접근할 수 있고, 핑퐁 데이터는 개인 식별 정보가 제거된 상태로 분리하여 별도 보관하고 있어 사이버 공격으로 인한 역코딩, 리버스 엔지니어링 등을 통한 데이터 복구 및 개인정보 유출과 악용은 일어날 수 없다"고 말했다.

마지막으로 스캐터랩 측은 "스캐터랩은 사람들의 외로움을 덜어줄 친구같은 AI를 만들고 싶은 비전을 가진 청년들이 모인 스타트업"이라며 "여러 의견들과 지적들을 겸허히 받아들여 서비스 개선에 반영하고 로봇3원칙, AI 윤리 기준을 철저히 준수하며 AI 기술 개발업계 모두가 당면한 문제를 해결하기 위해 고민하겠다"고 역설했다.

김종윤 대표는 Q&A 말미에 현재의 심정을 전하기도 했다. 김 대표는 "급격한 성장 속에서 회사가 제대로 대처하지 못한 부분도 있었고, 미숙함이 적나라하게 드러나기도 했다"며 "회사의 첫걸음은 이렇게 멈추지만 '사람만큼 대화를 잘하는 친구 같은 AI를 만들겠다'는 꿈을 멈추고 싶지는 않다"고 호소했다.

이어 "이번에 이슈가 된 부분을 성찰의 기회로 삼아 기술적으로, 그리고 사회적으로 가치 있는 스타트업으로 거듭나고 싶다"며 "많이 부족하고 거칠고 시행착오가 많지만 스캐터랩이 꿈을 이어갈 수 있게 응원을 부탁한다"고 덧붙였다.

김 대표는 기존 이루다 이용자를 향해 "이용자가 공유해준 이루다와의 따뜻한 대화에서 회사는 AI가 정말로 사람에게 친구가 되어줄 수 있겠다는 희망을 봤다. 짧은 기간이었지만 이루다에게도 여러분에게도 행복한 시간이었기를 바란다"고 언급했다.

한편 스캐터랩은 이날 오전 11시부터 순차적으로 이루다 서비스를 중단, 오후 6시쯤 서비스를 전면 중단한다. 회사는 현재 제기되는 문제점과 기존 계획했던 개선사항이 해결되면 서비스 운영을 재개한다는 계획이다.

hwayeon@news1.kr

Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.

이 기사에 대해 어떻게 생각하시나요?