[정소영의 AI이야기] '이루다'는 왜 혐오 발언을 하게 됐나
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
편집자주현실로 성큼 다가온 인공지능(AI)시대.
얼마 전 '이루다'라는 AI 챗봇의 등장으로 실시간 검색어가 시끌시끌했다.
이루다는 '나의 첫 AI 친구'라는 콘셉럼 마치 실존하는 친구와 이야기하는 듯한 느낌을 준다.
이 중 이루다는 리트리벌 방식을 메인으로 사용하는데, 리트리벌 방식에서 가장 중요한 것은 대화의 맥락을 얼마나 정확히 이해하고 그에 적절한 답변을 데이터베이스 속에서 찾는가이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
정해진 답변하는 '심심이'와 달리
10회 문답까지 티키타카 가능한 '이루다'
편향된 인간의 언어를 학습했기 때문
편집자주
현실로 성큼 다가온 인공지능(AI)시대. 생활 속에 깊숙이 스며든 AI 이야기가 격주 토요일 <한국일보>에 찾아옵니다. 컴퓨터비전을 연구하는 정소영 서울여대 기초교육원 초빙교수가 쉽게 풀어드립니다.
얼마 전 ‘이루다’라는 AI 챗봇의 등장으로 실시간 검색어가 시끌시끌했다. 이루다는 ‘나의 첫 AI 친구’라는 콘셉럼 마치 실존하는 친구와 이야기하는 듯한 느낌을 준다. 예전에 출시되었던 수많은 챗봇은 몇 마디 나누다 보면 동문서답을 하거나 같은 말을 반복해서 실망스러운 경우가 많았다. ‘심심이’가 그 대표적인 예인데, 심심이는 사전에 인간이 정해준 규칙에 의해서만 대답을 하는 방식의 알고리즘 때문에 다소 기계 같은 느낌이 강했다. 하지만 이루다는 달랐다. AI 챗봇답게 진짜 사람과 대화하는 듯한 자연스러운 대화의 흐름과 친근한 말투는 ‘이거 알바 써서 채팅 시키고 있는 거 아냐?’ 하는 생각이 들 정도였다. 기술적으로 매우 훌륭했음에도 불구하고 이루다는 아쉽게도 여러 논란으로 인해 출시한 지 얼마되지 않아 서비스를 종료하게 됐다.
이루다가 처음 논란에 서게 된 것은 장애인, 성소수자 혐오 등 사회적으로 통용되는 가치와는 상반되는 부적절한 발언을 하면서부터다. 이루다는 단지 기계일 뿐인데 어떻게 증오나 혐오 등 편향적인 시각에서 의사표현을 할 수 있게 된 것일까?
챗봇을 만들 때에는 NLP(Natural Language Processing)를 사용한다. NLP는 자연어 처리 기술로, 인간이 사용하는 언어를 입력으로 받아 이를 분석해 최적의 결과값을 반복해 찾아낸다. 즉, 인간이 사용하는 언어를 통해 학습하고 결과를 내는 기술인 것이다. 이루다는 NLP를 사용한 대화 모델 중 ‘리트리벌(retrieval)’ 방식과 ‘제너레이션(generation)’ 방식을 함께 사용했다고 알려져 있다.
DB에서 답변 찾는 ‘리트리벌’ 방식과 즉각 답변 생성 ‘제너레이션’ 방식
리트리벌은 질문에 대한 답변을 미리 데이터베이스에 준비해두고 현재 대화 맥락에 맞는 답변을 찾아 선택하는 방식이고, 제너레이션은 대화에 맞춰 즉각적으로 스스로 답변을 생성하는 방식이다. 이 중 이루다는 리트리벌 방식을 메인으로 사용하는데, 리트리벌 방식에서 가장 중요한 것은 대화의 맥락을 얼마나 정확히 이해하고 그에 적절한 답변을 데이터베이스 속에서 찾는가이다. 특히 답변 데이터베이스에는 실제 사람이 한 말들이 들어있기 때문에 이 대화데이터 속에서 적절한 답변을 잘 찾기만 한다면 실제 사람과 같은 센스 있는 표현이 가능하게 된다.
또 이루다는 기존의 챗봇보다 긴 맥락의 대화를 더 잘 이해하는 기술이 들어있는데, 이 때문에 이루다와의 대화에서 ‘티키-타카’가 잘 된다고 느껴질 수 있다. 기계의 입장에서 긴 문맥을 이해하려면 현재의 대화 맥락이 어디서 나온 것인지 이전 몇 문장에서 찾아내야 하는데, 이 때 몇 문장까지 기억할 수 있는지가 얼마나 긴 호흡의 대화를 유지할 수 있는가를 결정하게 된다. 이루다는 10번 주고 받는 대화까지 연속적으로 이해할 수 있어 좀 더 구체적이고 자연스러운 흐름의 대화가 가능했다.
이루다는 리트리벌 방식을 메인으로 사용하기 때문에 스스로 답변을 생성하기 보다는 상대방이 보낸 문장의 맥락을 이해한 뒤 그에 적합도가 높은 답변을 데이터베이스 속에서 선택해 비슷하게 가공·생성한 답변을 한다. 그래서 만약 이루다가 편향적이고 부적절한 발언을 했다면 실제 사람들 간의 대화에서 그와 비슷한 내용이 오고 갔음을 의미할 수 있다. AI 이루다는 우리 사회가 현재 어떤 시각을 가지고 있는지 전반적으로 보여주는 것 아닐까?
우리는 AI가 기계이기 때문에 중립적일 것이라고 기대한다. 하지만 그렇지 않다. AI는 사회의 편향된 시각을 그대로 흡수한 뒤 가공해 제공하기 때문에 오히려 차별과 편견을 더 강화할 수 있다. AI 챗봇을 학습시키기 위해서는 실제 사람들 간의 대화데이터가 필요하고, 대화 속에는 필연적으로 그 사람의 가치관이 섞이기 마련이다. AI 챗봇을 좋은 친구로 만들기 위해서는 우리의 가치관 먼저 바로잡아야 하지 않을까?
정소영 서울여대 기초교육원 초빙교수
Copyright © 한국일보. 무단전재 및 재배포 금지.
- 경찰, 정종선 피해자 진술 대필 가담…그 뒤 유사강간 추가됐다
- 한동훈, 유시민 사과에도 "거짓선동으로 이미 큰 피해"
- 결혼할 때 남자가 집 해 오는 건 차별 맞다, 여성 차별
- 법무부 압수수색 영장 피의자란에 ‘성명불상자’ 기재한 검찰
- 주로 불륜 뒷조사? 실종사건도 척척 '한국판 셜록 홈스들'
- '與 3룡'의 승부수, 정세균 '보상' ·이낙연 '공유' ·이재명 '보편'
- 김종인 대신 안철수 편드는 이유, 단지 서울시장 선거 이기려고?
- 김정희부터 역대 대통령들까지 아낀 ‘명품 벼루’
- 4월 보궐 선거 때도 비닐장갑 2,200만장 써야 하나요?
- '7억 한남동 연립' 정의용, '4억 목동 반전세' 황희...장관 후보자 재산 보니