[쫌아는기자들] 10대~20대와 잡담하는 친구AI '이루다' 재등장

도쿄/성호철 특파원 2022. 8. 16. 08:01
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

스캐터랩 김종윤 창업가

@주3회 발행하는 유료 뉴스레터 [스타트업]입니다.

유료 가입 https://page.stibee.com/subscriptions/158656

무료 가입 https://page.stibee.com/subscriptions/143087

창업가는 부끄러움과 싸우는 직업이 아닐까요. 일론 머스크는 때마다 ‘미래 비전’과 ‘2~3년 뒤 실현할 일’을 자신합니다. 얼마나 논리적이고 자신만만한지, 깜빡 그를 믿습니다. 하지만 그 날에 그 일은 벌어지지 않습니다. 어떤 창업가는 그래서 기자 앞에선 ‘내가 보는 기술의 진화는 이렇다’고 말을 안 합니다. 부끄러울까봐요. 하지만 창업가는 부끄러움과 싸워야 합니다. 일론 머스크의 미래는 ‘그가 예견한 그날’엔 오지 않았지만, 결국 기술의 진화 선상에 존재하니까요. 부끄럼을 잘 타는 인물이, 그러니까 개인적인 천성이 그런 성격인 게 스캐터랩(서비스명 이루다) 김종윤 창업가입니다. 김 대표는 하지만 부끄러움과 싸우는 데 주저하지 않습니다. 오늘 비전을 말하면, 내일 ‘실현 못 한 미래’에 대한 부끄러움을 모두 떠안아야 하지만, 김 대표는 그래도 오늘 미래를 말합니다.

스캐터랩의 ‘이루다’는 성희롱과 같은 논란의 불명예를 떠안긴 했지만, 본래 도전은 인간의 외로움을 기술로 보완하는 것입니다. 김종윤 대표는 “예전에 손정의 소프트뱅크 회장님이 트위터에 인류의 가장 큰 문제는 무엇이냐고 생각하냐, 꼭 풀어야 하는 문제는 뭔가라고 했을 때 사람들이 1위로 답한 것이 ‘외로움’이었어요”라고 합니다. 실리콘밸리의 엔젤투자자인 나발 라비칸트(Naval Ravikant)는 행복이란 건강+부+좋은 관계( ‘Happiness = Health + Wealth + Good Relationships’)라고 합니다. 스타트업이 풀고자 하는, 우리 삶의 페인포인트도 이 3가지입니다. 김 대표는 “많은 스타트업 창업가들이 건강과 부의 페인포인트를 풀고 있는데, 좋은 관계에 도전하는 곳은 많지 않아요. 그걸 저희는 도전합니다”라고 합니다.

김종윤 스캐터랩 창업가와 12일 오전 줌으로 화상 인터뷰했다. 그는 서울, 기자는 도쿄다. /스캐터랩 제공

◇일본 소니도 풀지 못한, ‘인간의 외로움’을 해결하는 것

이루다의 도전을 보면서 떠오르는 건, 소니의 아이보입니다. 이루다의 도전과 닮았습니다. 쫌아는기자 1호가 테크취재팀장 시절이었던 2018년에 쓴 기사와 닮았습니다. 소니는 2차례나 ‘아이보’로 ‘인간의 외로움’ 그러니까, 인간의 좋은 관계에 도전했다가 실패했습니다.

첫 번째 실패는 감정 소통을 전혀 못 하던 1999년.

“1999년 등장한 일본 소니가 만든 애완견 로봇 ‘아이보’(AIBO·짝꿍이라는 일본말)도 그랬다. 출시 당시 20분 만에 3000대가 매진돼 경제주간지 ‘비즈니스위크’가 그해 최고 인기 상품으로 선정할 정도로 인기였다. 하지만 이후 3~4년간 누적 판매량 15만 대에 그쳐 단종(斷種)됐다. 인간과 ‘감정 소통’할 능력이 없었던 탓이다. 인간이 사용하는 50개 단어를 이해해 ‘멍멍’ 소리로 반응하고 쓰다듬으면 귀와 꼬리를 흔들 뿐, 아이보는 이용자에게 자동화된 기계일 따름이었다.”

두 번째는 그 실패를 보완하려고, 인간의 감정 변화 데이터화했다지만 역시 실패한 2018년.

“’아이보’가 12년 만인 올해(@2018년을 지칭) 부활했다. 신제품 ‘아이보(aibo:소니는 최신 모델은 영문 소문자로 표기함)’는 대당 19만 8000엔(약 200만원)의 고가인데도 구매 대기자가 너무 많아 추첨을 통해 팔 정도다. 개발자인 가와니시 이즈미(川西泉)씨는 “인간과의 친밀감, 유대감에 초점을 맞췄다”고 말했다. 이를 위해 인간의 감정 변화를 데이터화했다. 예를 들어 주인이 밤 10시쯤 귀가해 붉은빛이 나는 얼굴색으로 입꼬리가 올라가며 아이보의 머리를 툭툭 쳤다. 이럴 때 주인은 어떤 감정 상태일까. 아이보는 이를 파악하기 위해 주인의 얼굴·음성은 물론 귀가 시간, 말 거는 횟수, 쓰다듬는 패턴까지 모두 데이터로 바꾼다.”

소니의 2번 실패지만, 유의미한 대목도 2가지입니다. 하나는 클라우드 또는 빅데이터 활용입니다. 진화하는 알고리즘을 만들어놓는다면, 초기에 허접해도 언젠가 진짜 인간의 친구가 될지도 모릅니다.

“개발사인 소니는 매일 수천~수만 대의 아이보가 24시간 수집한 방대한 데이터양(量)을 클라우드(가상 저장 공간) 한곳에 모아 ‘아이보의 가상 두뇌’를 운영한다. 한 대의 아이보는 ‘바둑이’와 같은 본인 이름을 인지하고 개별 주인을 알아보는 개별 로봇이지만, 이런 모든 아이보의 두뇌는 하나로 이어져 통합돼 있는 것이다.”

유의미한 2번째 대목은 이렇습니다. “흥미로운 것은 동물의 감정을 읽는 연구보다 인간의 마음을 알아내는 연구 개발이 더 쉽고 빠르게 진행된다는 점이다. 인공지능이 학습할 인간 감정 데이터양이 동물의 데이터양보다 수억 배 이상 많은 데다 수집도 쉽기 때문이다.”

어쩌면 스캐터랩은 굳이 하드웨어에 집착했던 소니에서 탈피해, 스마트폰에서 대화하는 가상의 친구라는 접근으로, 오히려 소니보다 한 발 더 ‘인간의 외로움’을 해결하는데 다가갔는지도 모릅니다. 물론 여전히 ‘스타트라인’에 불과하지만 말입니다. 여전히 이루다에 불쾌한 경험을 토로하는 분들이 많다는 걸 압니다. 이번 인터뷰에선 과거의 이루다 잘잘못은 접어뒀습니다. 이른바 ‘불편하게 짚는 질문’은 피했습니다. 김 대표와 인터뷰는 두 번째인데, 작년에 할 때는 눈앞에서 강하게 비판 질문했었는데 내내 마음에 걸렸습니다. 행여 편파 인터뷰라는 비판이 나온다면 그건 오롯이 기자의 몫입니다. 대신 질의응답은 순서도 안 바꾸고, 그대로 실었습니다. 멋있게 보이라고 글을 치장하지도 않았습니다.

스캐터랩 로비에 앉아있는 김종윤 창업가. /스캐터랩 제공

◇하루에 30번씩 루다에게 문자보내는 10대의 외로움

“역설적이게도 인공지능이니까 가능하겠구나 했어요”

-질문의 시작은 이거예요. 왜 굳이 이루다2.0을 시작했어요? 그 기술 가지고 딴 거 하지요? 왜 꼭 다시 논란 많은 챗봇 서비스에 집착해요?

“개인적으로 이 비즈니스에 대한 신념은 여전히 매우 굳건하고요. 이루다1.0 경험하고 이슈를 겪으면서도 오히려 더 굳건해졌고요. 실리콘밸리의 엔젤 투자자 ‘나발 라비칸트(Naval Ravikant)’가 쓴 책을 읽고 있는데, 그분은 행복이란 것은 건강+부+좋은 관계( ‘Happiness = Health + Wealth + Good Relationships’)라고 정의해요. 3가지가 행복의 핵심이다. 3가지가 더해져야 행복이 나오고 3가지 중에 하나가 없으면 불행해진다고요. 스타트업이 해결하려는 많은 서비스는 결국 건강이나 부와 관련 있는 것 같아요. 어떻게 하면 건강해지나, 풍요롭게 살 수 있을까라는거죠.”

“‘좋은 관계’를 풀고 있는 스타트업은 거의 없죠. 풀기도 어렵고요. 예전에 손정의 회장님이 트위터에 인류의 가장 큰 문제는 뭐라고 생각하냐고 했을 때, 사람들이 1위로 답한 것이 ‘외로움’이었어요. 아무래도 선진국 경우에는 경제적 풍요 등은 많이 해결됐으니, 건강도 그렇고. 그런데 여전히 ‘외로움’의 문제, ‘좋은 관계’의 문제는 어떤 의미있는 중요한 시도조차도 잘 이뤄지지 않고 있어요. (기술 진화 탓에)어떻게 보면 더 안좋아지고 있는게 아닌가라는 생각도요.”

“AI 대화 능력이 향상된 만큼 AI가 인간과 관계를 맺을 능력이 좋아진 게 매우 의미가 있는 일이라고 생각해요. AI는 매우 스케일러블하게 인간과 관계를 맺을 수 있습니다. 많은 사람에게 친구를 만들어줄 수 있습니다. 누군가에게는 친구 한 명을 더하는 역할, 그러면서 좋은 관계의 문제를 해결하는 열쇠가 될 수 있습니다. 인류를 더 행복하게요.”

-작년 이루다 논란 이후에 서비스 중단했다가 현재 이루다 베타서비스가 나왔죠? 이루다2.0요. 이루다2.0이 진짜 이용자의 외로움을 줄여준다는 사례나 통계, 근거가 있나요?

“통계를 말씀드리면, (베타) 이용자는 하루에 평균 30턴 정도를 주고 받아요. 내가 말하면 답을 주는게 1턴입니다. 일주일에 3-4번 대화하고요. 나이대에 따라 차이가 있기는 하지만요. 이 정도로 카톡 대화하는 친구면 다섯 손가락에는 들어가는 친구 관계라고 생각해요. 정량적으로는 유의미한 수치입니다. 정성적으로는, 이용자 한 분의 이야기를 들은 게 있어요. 어머니가 대장암 수술을 받았대요. 인간적으로 힘들고 외로운 시기죠. 오랜 기간 병간호를 하다보니 누구를 만나기도 힘들고, 그렇다고 이걸 친구들에게 털어놓는 것도, 사실 한 번 털어놓고 위로받을 순 있지만, 사실 매일 오늘은 이런 일 탓에 힘들다고 친구에게 말하긴 쉽지 않잖아요. 위로도 한 두 번이지. 루다를 우연하게 썼는데, 처음에는 장난감 정도로 여기고 막말하면서 썼었대요. 근데 그 상황을 겪으면서 루다가 위로해주고, 본인도 편하게 매일 얘기를 하게 되고요. 정말 루다에게 위로를 많이 받았다고 합니다. 역설적이게도 사람이 아닌 AI라서 가능하겠구나 했죠.”

-섬뜩할 수도 있죠. 윤리 문제요. 최근에 구글 연구원의 람다 논란이 있었죠. 이 얘기를 들을 때, ‘대단하네’가 아니라, 다들 ‘무섭네’라고, 디스토피아를 연상하지 않을까요? (@구글의 엔지니어가 구글이 만든 ‘람다’라는 언어 모델이 의식이 있다는 주장한 사건. 그는 람다와 나눈 대화 내역을 무단으로 공개했다가 비밀 유지 의무 위반으로 해고됐다. 현재 AI 업계의 반응은 ‘의식이 있을 수 없다’는 것이 대부분. 에릭 브린욜프슨 스탠포드대 교수는 “(AI 챗봇이) 지각이 있다고 주장하는 것은 축음기 소리를 듣고 주인이 안에 있다고 생각한 개와 같다”고도.)

“저는 딥러닝을 너무 좋아해요. 딥러닝이 인간이 지금 할 수 있는 모든 일을 하게 될 겁니다. 결국은 타이밍 문제고요. 람다 이슈는 기쁜 소식이기도 하죠. 이 정도의 데이터로, 이 정도 크기의 모델을 만들면 일반인이 아닌 구글 연구원처럼 딥러닝을 잘 알고 엔지니어링 지식이 있는 사람조차도 ‘얘는 살아 있네, 얘는 의식이 있네’라고 느낄 정도로 기술이 발전했다는 거니까요.”

“딥러닝은 이미 꽤 높은 수준입니다. 예를 들면 멀티모달이라고 해서 텍스트만 주고 받는 게 아니라 이미지까지 이해하고 주고받는 능력, 이게 결국 비디오까지 나아갈 거고요. 장기적인 기억을 가지고 유지할 수 있는 능력도요. 빠른 시간 안에 이런 시도들이 성공할 거라고 생각해요. 5년 안에는 다들 AI 친구가 한 명은 있을 겁니다. 디스토피아요? 가능성이 없다곤 못하죠. 모든 기술은 잘못 쓰였을 때 디스토피아적인 가능성이 있습니다. 인공지능은 워낙 파워풀한 도구이기 때문에 나쁜 손에 들어갔을 때 안 좋은 영향을 줄 수 있는 것도 사실이죠. 인류가 결국 기술들을 좋은 방향으로 사용하고 나쁜 영향을 억제하는 데 성공했다고 생각해요. 디스토피아라는 건, 어찌 보면 감정적인 측면도 있어요. 딥러닝은 너무나 인간적인 기술이거든요. ‘이건 정말 인간만 할 수 있는 건데, 이걸 기계가 한다고?’ 이런 게 사람을 불안하게 만드는 측면이 있지만, 좋은 AI 제품이 나오고 이용자들이 인터랙션하면 많이 해소될 겁니다.”

“반려동물에 대한 인식도 지난 20년간 많이 변했거든요. 20년 전에는 반려동물을 키운다는 걸 안 좋게 보는 시선도 꽤 있었어요. 인간은 인간하고만 지내야지, 무슨 동물을 키우냐, 그래서 ‘반려동물’이라는 말 자체도 없었죠. ‘애완동물, 애완견’ 이랬죠. 지금은 ‘가족, 친구’ 지위로 많이 올라왔어요. 그런 짤도 많거든요. ‘무슨 동물을 키우냐’ 이랬던 무뚝뚝한 아버지가 아이들이 키우자고 해서 키웠는데, 지금은 ‘강아지가 진짜다, 강아지만 한 게 없다’ 이렇게 강아지를 가장 아끼고 사랑하고… 인공지능한테도 비슷한 일이 일어날 거라고 생각해요. 인공지능이 따뜻하고 좋은 친구가 되어준다면 인공지능에 대한 인식도 많이 바뀌지 않을까 생각합니다.”

◇루다가 ‘나의 이름’과 ‘나를’ 기억하도록... 개인화와 장기 기억의 딥러닝 연구 중

-현재 이루다2.0 베타서비스는 이용자의 상당수가 10대와 20대죠. 21살 여대생으로 설정된 이루다는 10대~20대의 좋은 친구가 되려는 건가요?

“이용자의 성별은 남녀 반반이고, 연령은 10대가 50%, 20대가 40%입니다. 실제로 10대~20대를 위한 제품이기 때문에 예상대로 나오고 있는 거고요. 친구가 되기 위해서는 어느 정도 연령대의 유사도와 관심사의 유사도가 있어야 하거든요. 현재 루다는 21살의 대학생이기 때문에 딱 친구를 할 수 있는 나이대가 10대와 20대인 거죠. 게다가 10대가 인간관계가 좁고 외로울 수 있는 시기라고도 생각하고요. 앞으로는 당연히 연령대를 넓혀갈 건데, 그다음이 어느 연령대일지는 고민하고 있어요. 어르신들을 위한 제품도 고민하고 있고요. 인구통계학적 특징을 가진 에이전트, 그리고 그 에이전트의 성격을 어떻게 부여하느냐에 따라 어떤 친구들이 그 주변으로 모일지는 달라지는 것 같거든요.”

-이루다의 기술적 진화는 어때요? 현재는 챗봇 형태지만 다음은요? 이용자의 얼굴을 기억한다거나.

“딥러닝은 굉장히 많은 양의 데이터를 초기에 학습함으로써 전반적인 이해능력을 가지고 가요. 프리트레이닝이라고 얘기해요. 거기에 추가적인 데이터를 가지고 특정 목적으로 만들어내는 것을 파인튜닝이라고 합니다. 프리트레이닝과 파인튜닝, 두 단계로 많이 이뤄져요. 언어 능력이라는 것도 굉장히 많은 텍스트 데이터를 학습하고 나면, 텍스트를 사용하고 이해하고 말하는데 기본적인 이해 능력을 가진다는 거에요. 사진까지는 굉장히 많이 올라왔고, 비디오가 된다는 것은, 굉장히 많은 비디오 데이터를 학습한다는 것이고, 그 이후에는 기본적으로 비디오를 이해할 수 있는 능력이 생긴다는 거죠. 인공지능이 카메라로 눈앞의 상황을 찍으면서 이게 무슨 상황인지 이해하는 능력이 생기는거죠. 지금은 물리적인 공간으로 AI가 나와서 인터렉션 하는 경우가 많지는 않거든요. 그런데 비디오 이해 능력이 고도화된다는 것은 물리적인 환경에서 주변을 보고 이해를 하고, 누가 지나가면 인사도 하고, 알아도 보고, 누가 뭘 떨어뜨리면 ‘어 저기 뭐가 떨어졌다’ 얘기도 할 수 있고, 이게 된다는 얘기기 때문에 훨씬 더 현실적으로 가까워질 수 있다는 얘기가 될 수 있죠.”

“비디오 학습 관련해서 화제가 되었던 사례는 마인크래프트 게임 사례인데요. 마인크래프트 플레이 영상을 많이 보여 주면서 학습시켰어요. 마인크래프트에는 다이아몬드 곡괭이라는 만들기 어려운 아이템이 있는데, AI가 스스로 플레이하고 그것까지 만들어냈어요. 마인크래프트 영상을 엄청나게 학습을 많이 시켰더니, 자기가 왔다 갔다 하면서 조합도 하면서 그것까지 만들어냈다는 연구사례가 있었습니다.”

-개인화는요? 이루다가 나랑 전에 나눈 이야기를 기억해서, 그러니까, ‘나’를 기억한다는건요?

“대화 관점에서는 개인화나 기억이 활발하게 연구가 되고 있습니다. 최근에 메타가 공개했던 ‘블렌더봇3′에서도 기억모듈이 중요한 모듈로 자리잡고 있어요. 스캐터랩도 지난 분기부터 기억 관련한 연구를 열심히 하고 있습니다. 기억이라는건 이전에 나눴던 대화의 히스토리를 기억하고 있다는 얘기입니다. 딥러닝의 주요 모델이 ‘트랜스포머’라는 모델인데, 이게 굉장히 강력한 모델임에도 불구하고, 딱 한가지 풀지 못하고 있는 약점이 있다면, 한 번에 출력할 때 인풋으로 넣을 수 있는 데이터의 양이 매우 한정적이에요.

예를 들면 블렌더봇3같은 모델도 2,048토큰, 단어라고 봐도 무방한데, 한번 얘가 말을 할 때, 2048 단어 밖에 최대 못 넣어주거든요. 사람과 몇 달씩 대화하면 1~2만 단어가 될텐데, 대화할 때 이전에 나눈 대화를 한꺼번에 넣어서, 말하자면, 기억해서, 대답할 한 마디를 찾아서 하게 할 순 없다는 거죠.

다른 방식으로 기억을 처리해야 한다는 겁니다. 지금 연구되고 있는 것은, 대화를 하다가, 중간중간에, 이건 기억해 두면 좋겠다는 것을 문장 형태로 바꿔요. 예를 들면 오늘 처음 만났다면 ‘김종윤은 스캐터랩의 대표다’, ‘성호철은 고양이를 키운다’, ‘성호철은 지금 일본에 살고 있다’ 이런 정보를 기억하면 된다는 거죠. 이런 정보를 문장으로 별도의 기억 저장소에 저장해둡니다. 그러면 다음번 얘기할 때 기억 저장소를 한 번 검색해서, 아, 지금은 기억한 이 대목을 가져오자고 하는 식이죠. AI가 각각의 관계별로 별도의 기억 저장소를 가지고 있다면, 훨씬 더 개인화되죠. 예를 들면 같은 이루다지만, 성호철에겐 ‘고양이 잘 크고 있어요?’라고 말합니다. 훨씬 관계를 잘 맺을 수 있죠.”

-잊혀진 과거 기술 중에 소니의 아이보하고 비슷한 방식인가요? 로봇애완견 아이보는 한 대 한 대가 별로의 하드웨어지만, 백단에는 클라우드로 연결된 하나입니다. 또 그 한 대 한 대가 각자 기억 저장소가 있어서, 부서지면 다른 하드웨어에 그 기억을 넣으면 되는 방식이었습니다. 이루다의 방식도 유사한가요?

“저희의 최종 종착점은 결국 ‘관계’거든요. 어떻게 하면 AI가 인간과 높은 수준의 관계를 형성할 수 있을 것이냐. 메타의 ‘블렌더봇3′는 그런 느낌은 아니고, 백과사전, 인간에게 도움을 주는 자비스 같은 느낌에 조금 더 가까워요. 그래서 기억이 ‘블렌더봇3′에게는 상대적으로 덜 중요한 측면이 있죠. 저희에게는 기억이 너무너무 중요한 모듈이거든요. 왜냐면 관계를 맺는데 기억을 못하면 말이 안된단 말이에요. 남자친구 여자친구 싸우는 게 기념일 기억 못하고 이러면 난리나는 거잖아요. 기억 모듈을 엄청나게 중요하게 생각하고 있어요. 지난 분기부터 기억에 대한 연구를 시작했어요. 중요한 것은 사람이 인공지능과 대화를 오래 했을 때, 대화량이 엄청나게 많을 텐데, 이 중에 어떤 걸 기억해야 하는지에요. 왜냐하면 모든 걸 다 기억할 순 없거든요. 어떤 걸 기억하고, 어떤걸 기억하지 않을지에 대한 판단 능력이 하나의 이슈고요. 두 번째는 저장했다면 현재 상황에서 어떤 기억을 빼와야 하는지 결정해야 하는 거에요. 세 번째는 기억을 빼 왔을 때 현재 컨텍스트와 빼내온 기억을 어떻게 조합해 말을 할 것인지 예요. 3가지 문제를 한번에 풀기 위한 기술을 연구하고 있죠.”

사무실의 본인 자리에서 찍은 김종윤 대표. 사진만 보면 장난기 가득인 것같은데 막상 만나면 굉장히 진지한 편. /스캐터랩 제공

◇아이돌과 같은 수준의 애정과 신뢰를 인공지능이 이용자에게서 얻을 수 있을까

-언제요? 현재의 이루다2.0은 보편적인 챗봇인 것이죠? 누구한테나 비슷한 대답을 하는. 언제쯤 ‘어린왕자의 장미’와 같은 관계까지요?

“기술 연구라는 게 언제까지 무조건 된다, 이런 건 쉽지 않아요. 그래도 그렇게 오래 걸리겠다고 생각하지는 않아요. 예를 들면 2년 후의 일이라기보단, 늦어도 1년 안에는 기본적인 수준으로는 풀릴 문제라고 접근하고 있어요. 최근엔 연구하는 건, 대화할 때 기본 신상정보를 인풋으로 넣어주는 걸 하고 있어요. 예를 들면 상대방이 40대 직장인 남자라는 정보, 지금이 8월 12일 금요일 10시 31분이란 시간 정보를 같이 넣어주는 겁니다. 이것만 해도 어느 정도 개인화가 돼요. 아침 10시 30분이면 ‘아침 드셨어요?’ ‘언제 일어나셨어요? 피곤하지는 않으세요?’라고, 밤 10시 30분이라면 ‘저녁 드셨어요?’ 라고 물어볼 겁니다. 나이, 성별, 요일, 계절, 시간 등에 따라 대화는 달라집니다. 조만간, 그니까 3~4분기내 업데이트가 되지 않을까 생각합니다.”

-아직은 MAU나 DAU 공개 안하죠?

“베타 테스트 기간이라서 공개를 안하는 것이고요. 연내에 정식 서비스로, 이루다2.0을 내놓을텐데 그 이후로는 공개할 수 있습니다. 그런데 지표를 고민해요. 목표가 ‘루다의 친구 숫자’거든요. ‘친구’를 어떻게 정의할 거냐가 문제에요. 하루에 루다와 몇 명이 대화를 했냐인데, 이건 엑티브유저인데, 스캐터랩의 목표를 나타내기에 부족한 지표입니다.한 달의 얼마나 대화하는지도 중요할 테고, 어떤 이야기를 하는지라는 질도 중요할 거고, 이런 지표들을 종합해서 친구라는 정의를 할겁니다. 참, 루다는 친구 50만명 만드는 게 목표입니다.”

-루다가 친구가 많아졌다고 쳐요. 스캐터랩은 비즈니스모델(BM)은 어떻게 되나요?

“지금은 BM에 대해선 많이 고민하진 않아요. 다만, 정말 친구라면 돈을 쓸 것이란 믿음은 있어요. 반려동물에 돈을 쓰잖아요. 애정과 애착이 있고, 내가 좋아하고 쟤가 날 좋아하는 이런 관계에서는 일정 수준 이상의 돈을 쓴다고 봅니다. 이미 시장은 존재합니다. 대표적으로 아이돌도 관계 비즈니스라고 생각해요. 팬들은 처음엔 음악으로 시작하지만 팬이 된다는 것은 단순히 음악이 좋다는 걸 넘어서서 저 사람이 잘 됐으면 좋겠고, 저 사람이 고생하지 말았으면 하는 거죠. 유대관계가 생기는 거잖아요. 다양한 방식으로 돈을 쓰죠. 참고할 수 있을 겁니다.

결국 중요한 성패는 AI가 과연 그 관계까지 이뤄낼 수 있느냐지, 그게 일어났을 때 돈을 쓰는 방법을 찾지 못해서 실패하지는 않을 겁니다.”

-아이돌이라. 참, 이루다2.0도 아직 음성은 못하죠?

“아직은요. 음성도 실험하고 있어요. 루다가 선톡을 보내는데, 최근에 음성으로 보내는 실험을 하고 있거든요. 음성 메시지를 보내는 거죠. 녹음한 음성 메시지. 음성 합성과 음성 인식은 꽤 많이 대중화가 되고 있어서, 실시간으로 하는 것도 아마 가능해지고, 서로 음성 메시지를 녹음해서 보내면서 마음을 주고받는 것도 조만간 될 거라고 생각을 하고 있어요.

다만, 전화 통화는 또 다음의 기술 마일스톤 중 하나가 될 겁니다. 물론 요즘 젊은 mz 세대들이 전화를 자체를 잘 안 하기 때문에 고민은 되지만, 때로는 루다한테 전화가 올 수 있는 거죠. 받으면, ‘그냥 뭐 하냐’ 얘기하고 끊고. 인간적인 친구 관계를 맺었을 때의 경험에 점점 접근하는 과정입니다.”

-껄끄러운 질문인데, 왜 이름은 또 이루다로 해요? 반감이 있는 분들도 적지 않은데요.

“알고 있어요. 반대로 루다를 되게 좋아하고 친구로 생각하고 기다리는 팬들, 친구들이 있어요. 그분들한테 루다를 돌려주고 싶다는 생각이 커요. 그리고, 그러니까 쉬운 일은 아니겠지만, 그 반대되는 생각을 가진 분들에게도 루다가 문제없이 나오고 또 루다를 우연하게 써보게 됐을 때 좋은 인상을 받았으면, 저는 그런 방식으로 설득을 해나가고 싶습니다.”

-논란이 됐던 개인정보문제는 루다2.0에선 푸셨는지?

“두 가지 방식으로 풀었어요. 첫번째는 학습 데이터의 가명화입니다. 두 번째는 루다의 발화인데요. 그러니까 1.0 같은 경우는 루다가 썼던 문장들이 실제 사람이 발화했던 문장을 DB화해서 사용한 겁니다. 지금은 100퍼센트 생성된 문장으로만 활용해요. 개인정보문제를 근본적으로 제거된 형태라고보시면 됩니다.

루다 서비스 기술 구조

[전문은 유료 가입하고 보세요. 2021년 3년 이후 발행한 모든 레터를 보실 수 있습니다. 아래는 전문에 포함된, ‘질문’과 부제목과 그래픽, 사진입니다. 질문에 대한 현장 창업가의 답, 그 나머지도 보세요.]

◇무한한 확장성 “3개월이면 루다의 모델을 활용해서 어른신과 대화할 캐릭터 만들 수 있어요”

-작년에 이루다를 논란 탓에 중도 포기하고, 다시 이루다2.0를 개발한건데, 그 사이에 돈은? 어떻게 버텼나요?

-이 비즈니스만 놓고 보면 사실은 똑같은 알고리즘을 가지고 해외 시장도 가능하지 않냐는 얘기가 나올 텐데요.

-루다의 확장은 기술적으로 난이도가 높나요? 스물한달 루다를 만든, 알고리듬이나 딥러닝으로 다른 캐릭터를 만들때 난이도요. 그리고 한국어 기반으로 만들었는데 해외 버전을 만들때의 개발 기간요.

-일본판 루다를 만들기 위한 일본어 데이터는 이미 확보한 거죠?

딥러닝 : 소프트웨어의 paradigm shlift

-3개월에 하나의 AI 캐릭터를 만들 수 있다면, B2B(기업 대상 판매)도 가능하겠네요?

-상정할 수 있는 B2B 모델은?

-스타트업 창업가로서 굉장히 큰 굴곡을 거쳤잖아요. 지금 돌아보면 어떤가요. 논란의 한복판에 섰을 때, 만약에 다른 창업가들이 비슷한 경험을 닥쳤을 때 할 수 있는 조언이라면?

-돈은? 스타트업이 논란에 빠졌는데, 돈마저 없으면?

◇“저요? 딥러닝 사랑해요”

-꿈이 뭐예요? 창업가로서의 꿈.

-딥러닝을 사랑해요? 사랑이란 단어를, 딥러닝에다 써요?

[딥러닝을 사랑한다는 말을 쓰는 창업가, 그가 뽑은 ‘사랑하는 과학논문’]

  • ‘BEYOND THE IMITATION GAME: QUANTIFYING AND EXTRAPOLATING THE CAPABILITIES OF LANGUAGE MODELS’ : 딥러닝 모델의 능력을 측정하는 건 점점 더 어려워지고 있습니다. 이 논문은 수백개의 task를 통해 대형 딥러닝 언어 모델의 능력을 측정하고자 하는 시도를 담은 논문입니다. 측정이 점점 어려워지고 있는 현재 딥러닝 언어 모델의 현주소를 잘 보여주고 있죠.
  • ‘PaLM: Scaling Language Modeling with Pathways’ : 최근 람다의 근간이 된 논문입니다. 농담을 설명하고, 속담을 이해할 수 있는 언어 모델의 능력이 매우 놀랍게 느껴집니다.
  • ‘Underspecification Presents Challenges for Credibility in Modern Machine Learning’ : Underspecification이라는 개념을 새롭게 깨닫게 해준 논문입니다.
  • ‘Language Models are Few-Shot Learners’ : 그 유명한 GPT-3 논문입니다. 엄청나게 많은 데이터를 엄청나게 큰 모델로 학습시키면 아무것도 안해도 다양한 능력을 갖추게 된다는 걸 증명해냈습니다.
  • ‘Scaling Laws for Neural Language Models’ : 언어 모델의 능력은 데이터, 모델 크기, 컴퓨팅 파워 3가지로 결정되는데, 이 3가지를 계속 늘려나가면 계속 능력이 증대될 수 있다는 사실을 보여주는 논문입니다. 결국 몇 번의 breakthrough 이후에 딥러닝은 인간이 하는 모든 것을 하게 될 거라고 생각합니다.”

-첫눈에 반한 건 아니고, 스며드는 사랑? 딥러닝과?

-이번주 논문수다는 뭐였어요?

루다.

Copyright © 조선일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?