[손현덕 주필의 사람과 현장]

손현덕 기자(ubsohn@mk.co.kr) 2023. 8. 13. 16:18
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

'챗GPT 단초' 10쪽짜리 논문 보고 온몸에 전율
"지금 움직이지 않으면 우린 죽는다" 작업 시작
토종 초거대언어모델 개발주역
'네이버 AI 투톱' 하정우·성낙호

◆ 매경 포커스 ◆

서울대 컴퓨터공학과 97학번 동기인 하정우(왼쪽)와 성낙호. 그들은 대학 때부터 서로 다른 길을 걷다가 8년 전 판교 AI 모임에서 우연히 만났다. 그러곤 한국어 기반의 거대언어모델 개발에 착수했다, 하이퍼클로바X는 그렇게 탄생했다. 김호영 기자

2015년 가을, 판교에 소재한 SK플래닛에 동네에서 인공지능(AI) 좀 한다는 사람들이 모였다. 알파고와 이세돌의 세기적 바둑 대결이 벌어지기 5개월 전이었다. 그날 모임은 소위 테크기업들이 AI와 관련돼 무엇을 하는지를 서로 공유하고 업무에 도움을 얻자는 취지에서 서울대 AI연구소 초대 소장을 지낸 장병탁 교수 등이 주도해 마련한 자리였다. 네이버, 카카오, NC소프트, SK플래닛 등에서 10여 명의 젊은 연구직 직원들이 각자 자신이 하는 업무를 발표하고 저녁 뒤풀이까지 이어졌다. 그들은 AI의 거대한 쓰나미가 몰려올 것임을 직감했다.

이 모임에 네이버에선 하정우 책임연구원(현 네이버클라우드 AI혁신센터장)이, NC소프트에선 성낙호 부장(현 네이버클라우드 하이퍼스케일 AI 기술총괄)이 있었다. 8년 후 대한민국의 초거대 언어모델인 하이퍼클로바X를 탄생시킬 주인공들의 만남은 이렇게 시작됐다.

사실 두 사람은 서울대 컴퓨터공학과 97학번 동기다. 정원이 90명으로 그리 많지 않았는데도 대학 때는 서로 말도 섞어보지 못한 사이였다. 각자 그도 그럴 것이 고등학교도 부산과 서울에서 나온 데다 두 사람 모두 학업엔 그다지 뜻이 없었기 때문이다. 하정우는 2학년 1학기를 마치고 군대를 갔고, 성낙호는 컴퓨터보다는 음악에 관심이 많아 밴드를 한다고 홍익대 근처에서 놀다가 대학교 때 창업을 했기 때문에 마주칠 기회가 거의 없었다.

하정우는 그날 모임에서 만난 성낙호에 대해 "어디서 본 듯한 정도의 느낌이었다"며 "AI를 적용한 게임에 대한 프로젝트 한 꼭지를 발표하는 것이 놀라웠다"고 기억한다. 대학 동기임을 확인한 것은 좀 시간이 흐른 뒤였다. 반면 성낙호는 "기술 담당 총책임자였던 우원식 부사장이 뭐 하나 들고 가보라 해서 후다닥 하나 만들어 나간 자리라 아무 생각이 없었다"고 당시를 회고했다. 우 부사장은 아래아한글의 주 개발자인 우리나라 3대 천재 프로그래머 중 한 명으로 업계에선 정평이 나 있다.

이날 이후 하정우는 마음속으로 성낙호를 '찜'해뒀다. 네이버에서 본격적으로 AI에 대해 드라이브를 걸게 될 때를 대비해 고수 10명 정도 리스트를 작성했는데 거기에 성낙호를 1순위로 올렸다. 최고경영진의 영입 허가가 떨어진다. AI 초창기인 2017년 초 네이버는 이 분야 최고 인재를 영입하는 것이 경쟁력 확보의 핵심이라는 인식을 했다. 그의 직계 보스는 신중호. 네이버와 소프트뱅크의 합작사인 'Z홀딩스' 대표로 일본 내 외국인 중 연봉 1위였던 화제의 인물. 그와 현재 업스테이지 대표로 있는 김성훈 씨와 함께 스카우트에 나선다. 성낙호는 게임업계에서 내로라하는 고수인데, 이 게임이라는 게 AI를 적용하기 가장 적합한 분야다. 알파고를 만든 구글 딥마인드의 데미스 허사비스도 어렸을 때 게임회사를 창업한 인물이며, 요새 없어서 못 판다는 엔비디아의 AI 반도체 그래픽처리장치(GPU)도 게임 때문에 나왔다. 성낙호를 영입하기 위해 네이버는 그렇게 공을 들였고, 결국 6월 그는 네이버에 합류한다.

성낙호가 네이버에 합류하고 보름 정도 지난 2017년 6월 12일. 하정우·성낙호 두 사람은 그날 아침 AI와 관련된 독특한 논문 한 편을 접하게 된다. 늘 습관처럼 아침이면 "뭐 신기한 게 올라왔나"하고 들여다보는데 이날 구글이 소위 '어텐션'이란 논문을 발표한다. 원제목은 '어텐션은 당신이 필요로 하는 모든 것(Attention is all you need)'. 문병로 서울대 컴퓨터공학부 교수 표현을 빌리자면 "어텐션을 무지무지 열심히 하다 보면, 그러니까 서로의 관계를 무지무지 열심히 캐다 보면 언어가 생성된다는 것"이며 그게 지금의 챗GPT 시발점이었다.

다음날 네이버 AI 팀원 모두 그 논문을 읽고 한자리에 모였다. 논문이라고 해봐야 결론까지 10쪽, 부록(Appendix)까지 해서 15쪽짜리였다. 하정우의 회고. "자연어 처리라는 게 순서대로 입력하는 건데 이놈은 그거 없이 어텐션만 있으면 된다는 거였죠. 좀 전문적으로 말하면 순서대로 넣지 않고 위치 정보만 주면 소위 어텐션 연산으로 인코딩(글 내용 이해)도 되고 디코딩(글쓰기)도 된다는 겁니다. 그리고 키(Key), 밸류(Value), 질문(Query) 같은 기존 AI 분야에서는 안 나오는 용어를 사용했습니다. 도대체 정체가 뭐야? 그렇게 하면 그동안 제대로 풀지 못했던 자연어 처리가 가능하다고? 이런 분위기였습니다."

일반인이야 이런 논문의 공개조차 알 리가 없었다. 설사 전문가라고 해도 호기심 정도. 이론적으로 가능할지는 몰라도 실제 결과가 나온 건 아니었기 때문이다. 그러나 프로들에겐 느낌이 왔다. "곧 새로운 세상이 열릴지 모른다"는.

그들의 예상은 맞아떨어졌다. 1년4개월이 흐른 뒤 자연어 처리의 역사를 뒤흔드는 거작이 나온다. 제목은 'BERT'. 이 역시 구글에서 개발한 자연어 처리 모델인데 어텐션 논문에서 나온 트랜스포머(Transformer) 기법을 적용한 것. 그 트랜스포머의 첫 영문글자 T가 챗GPT의 T이다. 그야말로 전 세계가 난리가 났다. 물론 AI 전문가 세계에서지만.

어텐션이 나왔을 때의 호기심이 충격으로 변하는 순간이었다. 하정우·성낙호 그들은 이렇게 말한다. "자연어 처리도 여러 분야가 있습니다. 두 문장을 주고 이게 비슷한 건지 아닌지를 판단하는 것. 질문을 던지면 적절한 답을 찾는 것. 긴 문장을 주면 그걸 요약하는 것. 인간이 말하는 언어를 처리하는 데 이렇게 각각 조금씩 다른 부분이 있고 그 부분마다 1등을 하는 AI 모델이 있었습니다. 우리는 아직 어느 특정 분야에서는 내가 1등을 해야지 하는 목표를 갖고 연구하고 있었지요. 그런데 이 BERT가 그걸 다 깨버린 겁니다. 전 분야 1등입니다. 영어도 1등, 수학도 1등, 사회도 1등, 물리·화학도 1등, 체육도 1등인 무시무시한 놈이 나온 것입니다."

하정우는 "네이버에 바로 적응시켜야겠다는 결심은 이때 이뤄졌다"고 말한다. 행동 개시에 들어간다. 우선 데이터를 가공해야 한다. AI가 학습할 수 있도록 데이터를 새로 만들어야 한다는 것. 예를 들어 우리가 50년간 출간된 책을 도서관에 모아놓았다 해도 이걸 AI가 학습할 수 있는 건 아니다. 쉽게 말하면 그건 데이터가 아니다. 그 책들을 AI가 소화할 수 있는 음식으로 만드는 작업. 그게 데이터 가공이다. 이 동네 표현으로 '손에 흙을 묻히는 일'이다. 어마어마한 수작업이 필요하다.

둘째, 반도체가 필요하다. 여기에 쓰는 반도체가 이른바 GPU다. 과거 AI 모델을 실험할 때는 1~2장 정도면 충분했는데 BERT가 나온 후로는 4~8장 정도가 필요하고, 그걸 넘어 8장짜리 서버 여러 대를 동시에 학습에 활용하는 상황이 됐다. 그게 다 돈이다. 대학 입시를 준비하기 위해 과거엔 학교에서 수업만 들었는데 이제 학원에 다니고 족집게 과외라도 시켜야 할 판이다.

셋째, 장비를 구입해야 한다. 모델을 키우고 많은 데이터를 학습시키기 위해서는 그에 버금가는 컴퓨팅 인프라스트럭처를 구축해야 하고 기존 설비도 업그레이드해야 한다.

그리고 넷째, 가장 중요한 게 있다. 사람이었다.

하정우는 "네이버에 클로바라는 AI 연구조직이 생긴 건 2016년이었는데 실질적으로 회사 차원에서 관심이 집중되고 투자가 진행된 건 BERT 출현 때문이라고 봐야 할 것"이라면서 "AI에서 새로운 성장 동력을 찾는 작업이 이곳으로 방향을 잡고 본격화됐다"고 말한다.

네이버는 통상 매출의 25%를 연구개발(R&D) 투자에 쓰는데 그 R&D의 절반이 AI 몫이다. 이런 큰 전략적 결정이 소위 C레벨에서 이뤄졌다.

그렇다고 그들 앞에 양탄자가 깔리지는 않았다. 전략적 투자 결정은 이뤄졌지만 세부적으로 들어가면 곳곳이 지뢰밭이었다. 투자는 이뤄지나 그 투자가 돈이 된다는 보장은 없다. 그러다 보니 내부에서 부정적인 의견도 나왔다. 늘 악마는 디테일에 있는 법.

하정우의 회고

"AI 투자, 그건 오케이입니다. 그런데 서비스 입장에서 보면 각 분야에서 필요한 투자를 결정해 내재화하는 게 맞는다는 의견이 대세였습니다. 부서마다 각각 서로 다른 AI 모델과 기법이 필요하다고 생각한 겁니다. 그런데 우리 생각은 달랐던 거죠. 한 군데 몰빵을 해서 규모를 키워야 퀀텀점프를 할 수 있다는 논리였습니다. 그게 거대언어모델이고요."

이런 고민은 심지어 챗GPT 직전 버전인 GPT3가 나왔던 2020년 5월까지도 지속됐다.

성낙호의 회고

"이 당시만 해도 주변 동료를 포함한 대다수 AI 연구자들 분위기는 '소 왓(So what)?'이었습니다. 규모를 키운다고 기능이 강력해진다는 걸 믿기 어려웠죠. 솔직히 무시가 대세였습니다. 그리고 가장 큰 이유는 한국어 글쓰기가 잘 안된 거죠. GPT의 능력을 체감하지 못한 겁니다. 그러나 정우와 나는 충격 쪽이었고 바로 만들자고 한 겁니다. 프로젝트를 제안했는데 그게 하이퍼클로바였습니다." 최초의 한국어 기반 초대규모 AI는 이렇게 탄생하게 된다. 전 세계 세 번째. 그게 이듬해인 2021년 5월이었다.

성낙호는 그때 처음으로 18년 동안 몸담았던 게임업계를 떠나 AI로 발을 디딘 게 헛되지 않았다는 확신을 하게 된다. "진행 속도도 상당히 빠를 것이라고 기대했습니다. 소수의 훌륭한 천재적인 연구자에 의한 혁신이 아니었거든요. 이건 마치 반도체에 있어 무어의 법칙처럼 규모에 의존하는 기술의 발전이었습니다."

그들은 안다. 이때 경영진을 설득해 빠르게 레이스에 진입하지 않았다면 하이퍼클로바X는 아직 탄생하지 않았을 것이고, 어쩌면 영원히 나오지 못했을지 모른다고. 천운(天運)이었다.

작년 11월 챗GPT3가 세상에 나온다. 그때까지만 해도 일반인은 AI 세상에서 거대한 쓰나미가 몰려오는지를 눈치채지 못했다. 반면 전문가들은 다 알았다. 하정우와 성낙호는 "더 이상 껌을 팔지 않아도 됐다"고 한다. 그때부터는 전사적 차원에서 '올인'이었다.

물론 네이버의 각종 서비스에 하이퍼클로바 기술 접목을 시도하긴 했다. 네이버 쇼핑의 55만 소상공인 판매자를 위한 마케팅 문구 생성기, 기획전 이벤트 타이틀 생성기, 선물하기의 메시지 멘트 자동 생성기, 구매자 리뷰 3줄 요약 등이 대표적 사례. 또 작년에는 자연스러운 대화를 통해 독거노인 안부를 묻는 '네이버 클로바 케어콜'을 선보였다. 이 서비스는 휴먼 테크놀로지 어워드 대상을 받기도 했다. 그러나 이런 것들은 앞으로 열흘 후면 공개될 하이퍼클로바X의 예고편에 지나지 않는다.

두 가지 의문이 든다.

첫 번째. "왜 이렇게 늦게 나오지?" 그렇게 오래전에 시작했으면 벌써 나왔을 법도 한데 말이다. 하정우의 답. "시간을 좀 더 들여서라도 잘 준비해서 내놓는 게 중요하다고 생각합니다. 그게 지난 2월 구글이 바드를 공개했을 때의 교훈입니다. 잘 준비한다는 건 성능의 문제가 아니라 서비스 내용의 문제입니다."

두 번째 질문은 "그러면 뭐가 다른데"다.

하정우는 "하이퍼클로바X는 클라우드 기반이라 B2B로 드라이브를 많이 걸게 될 것"이라며 "그건 전문 분야에 특화된 초거대 AI이며 챗GPT나 바드와 차별화되는 지점"이라고 말한다.

"과연 우리가 공룡 같은 글로벌 빅테크 기업을 이길 수 있을까"라는 두려움을 안고 시작한 AI 프로젝트. 그러나 지금은 "이겨야 한다"로 바뀌었다. 이기지 못하면 그건 네이버 입장에선 상품 공급자(Provider)가 아니라 상품 사용자(User)가 된다는 것. 비단 그건 일개 기업의 문제가 아니다. 국가적으로도 그렇다. 대한민국은 어쩌면 글로벌 초거대 AI 경쟁에서 방관자로 머무를 수밖에 없을 것이다. 시간이 흐를수록 방관자는 노예로의 길을 걷게 되고.

사람과 현장은…

머리보다는 가슴, 가슴보다는 발로 쓰는 글을 좋아한다. 경제기사가 따분한 이유는 발로 쓰지 않고 머리로 써서 그렇다. 발품을 팔아 사람을 만나고 현장을 쏘다니다 보면 글이 나온다.

[손현덕 주필]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?