졸지에 다 갖게 된 일본, 이제 한국의 '이것'만 뺏으면 된다? [스프]

김종원 기자 2024. 6. 2. 09:03
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[귀에 빡!종원] 라인 사태와 AI, 그리고 데이터

 
영원히 함께일 것 같던 네이버와 소프트뱅크

매일매일 나오는 단편적인 기사들을 쭉 이어놓고 보면 흐름이 보일 때가 많다. 한국의 네이버와 일본의 소프트뱅크 사이도 그렇다. 이 둘은 AI라는 단어가 예능성 아이템에 그쳤던 스피커 형태로 나오던 시절인 2019년부터 AI 협력을 이야기한다.
     
우리는 양사 통합을 달성한 뒤, 일본은 물론 아시아로부터 세계를 리드하는 AI 회사를 목표로 하고자 합니다.
-가와베 겐타로ㅣ야후재팬 사장 (2019년 11월 라인·야후재팬 통합 당시)
     
이후 2021년에는 두 회사가 AI 개발에 착수한다는 기사가 나오기 시작했다. 기술과 인력을 네이버가 대고, 투자를 소프트뱅크가 한다는 것이다. 2023년 챗GPT의 등장으로 AI가 이제는 예능이 아닌 실제 우리 삶을 송두리째 바꿔 놓을 수 있는 신사업이라는 사실을 전 세계가 알고 난 뒤 두 회사의 협력은 더욱 강화된다. 지난해 3월 두 회사는 네이버가 개발한 AI인 '하이퍼클로바X' 개발에 협력한다는 발표를 한다.
 
 
네이버는 '하이퍼클로바X'의 두뇌 역할을 할 대형 언어 모델, LLM을 만들기 위해 한국어와 일본어 데이터를 수집했다. 단어가 많아 언어를 배우기가 까다롭다는 일본어 학습을 위해 신문으로 따지자면 2,700년에 해당하는 분량을 공부시켰다. 이렇게 개발된 한국어와 일본어 LLM을 탑재한 하이퍼클로버X는 한국에서는 네이버, 일본에서는 라인야후가 서비스를 하기 시작한다. 이러다 보니 실제로 한국어와 일본어 이해도에 있어서는 네이버의 AI가 챗GPT와 구글 AI를 뛰어넘는다는 평가가 지배적이다. 소프트뱅크는 이때까지만 해도 4,500억 원을 지원해 가며 성의를 보였다.
하지만 이상 기류가 감지되기 시작한 건 올초부터다. 자신들의 돈까지 투자해 가며 네이버와 함게 개발한 AI 모델이 있음에도, 소프트뱅크는 사내 업무에 활용하는 AI에서 네이버를 철저히 배제했다. 클라우드 역시 라인이 네이버 클라우드를 사용하고 있지만, 소프트뱅크는 구글의 클라우드를 활용했다. 최수연 네이버 대표는 얼마 전 "라인야후 관련해 소프트뱅크와 주주와 기술적 파트너였지만 긴밀한 협력은 이뤄지지 않고 있다"며 서운함을 표하기도 했다. 2023년 3월 네이버와 AI 협력을 발표하며 돈까지 투자했던 소프트뱅크가, 1년여 뒤인 2024년 5월 돌연 지분 매각을 압박하고 나선 이유는 무엇일까?
 

미국의 대규모 일본 투자와 맞아떨어지는 네이버 축출 시도

올 1월부터 줄줄이 쏟아진 미국 거대 IT 기업들의 일본 AI 사업 투자와 무관치 않다는 분석이 나온다. 일본의 투자 유치 타임라인을 살펴보자. 1월, 아마존이 일본 AI 데이터센터 증축을 위해 21조 원 투자를 발표한다. 2월에는 대만의 TSMC 반도체 공장이 일본에서 개소식을 가졌고, 2공장도 현재 건설 중에 있다. 일본과 대만의 반도체 협력은 계속 강화할 것으로 보인다.

이후 일본의 '라인 강탈' 사태가 본격적으로 수면 위로 올라오기 직전인 4월에는 마이크로소프트가 4조 원, 오라클이 11조 원 대규모 투자를 발표했고, 챗GPT 개발사인 오픈AI는 일본에 아예 아시아본부를 차리기로 결정했다. 그리고 5월 우리나라에서는 일본이 라인을 강탈해 가려 한다는 뉴스가 터져 나왔다.
 

 
네이버와 손잡고 이미 개발해 놓은 AI가 있으니, 미국의 투자를 받은 후 이를 활용하면 더욱더 시너지 효과가 나는 게 아니냐고 반문할 수 있다. 하지만 일본은 AI 패권으로 향하는 길에서 한국을 완전히 배제시킬 생각인 듯하다. 네이버가 개발 중인 하이포클로버X는 '소버린 AI'라고 불린다. 소버린(Sovereign)의 사전적 의미는 '자주적인, 독립된'으로, 한 나라가 자국의 기술과 자국의 인력, 자국의 데이터로 AI를 구축하는 걸 '소버린 AI'라고 말한다. 요즘 자주 논의되는 데이터 주권·AI 주권과 관련이 있다.

하지만 이런 의지는 있어도 이를 직접 개발까지 할 수 있는 나라는 많지 않다. 따라서 네이버는 자신들이 개발한 소버린 AI 기술을 원하는 국가에 수출하겠다는 계획을 가지고 있는데, 그 첫 협력 사례가 바로 일본이었던 것이다. 하지만 그 일본에게서 팽을 당하게 된 것인데, 일본 입장에서는 미국과 손잡고 적어도 아시아 AI 패권만은 오롯이 우리가 가져가겠다는 계산이 깔려있었을 거란 분석이 나오고 있는 대목이다.

또 한 가지는, AI야말로 '위너 테익스 올', 즉 1인자가 다 차지하는 시장이다. 어찌 보면 각 나라가 '소버린 AI'를 개발하는 게 무의미해질 수 있는 부분인데, 실제로 그러하다. AI 분야에 있어 세계 1위가 미국이고 2위가 중국인데 그 이후 3위부터는 순위가 의미가 없는 수준이라는 것이 전문가들의 중론이다. 네이버의 대규모 언어 모델과 AI 수준이 세계 10위 안에 들어 6위~7위를 왔다 갔다 한다는 말이 있는데, 이 자체가 아무 의미가 없다는 얘기이다.

이러다 보니 일본 입장에서는 한국 네이버와 손잡고 AI를 개발하느니, 미국에서 투자가 물밀듯 들어오는 이때 차라리 미국과 손잡고 AI 강국으로 나아가겠다는 계산을 했을 수 있다는 것이다. 이렇게 놓고 보면 더욱 더 '미일 사이에서 이제 한국은 빠져라'라는 식의 해석이 가능하다.
 

순식간에 다 갖게 된 일본, 이제 남은 건 '데이터'

일본은 AI 관련 논문은 많이 썼을지라도 실제 이를 운영할 수 있는 기업이 없다. 그나마가 소프트뱅크인데, 소프트뱅크는 투자회사이지 IT 기업이 아니다. 그러다 보니 당장 라인만 해도 네이버가 지분 넘기고 모두 철수하면 유지·관리를 할 수가 없다. AI를 개발하고 관리할 기술이 아직 없다는 것이다. 그런가 하면 대규모 데이터 통행을 위한 서버 운영에 필수인 클라우드도 없다.

라인도 네이버 클라우드를 쓰고 있고, 네이버와 라인을 분리시킨 이후에는 구글 등 다른 나라의 클라우드를 쓸 계획을 가지고 있다. 또한 AI에 들어갈 반도체 생산 또한 제대로 하고 있지 않다. AI를 위한 하드웨어(반도체)와 인프라(서버·클라우드)가 모두 없는 것이다. 이걸 네이버와 함께 기술 개발을 하는 식으로 채워나가고 있었는데, 올초 미국 등이 일본에 돈을 싸 들고 몰려가면서 180도 상황이 바뀌었다.

먼저 하드웨어다. 대만의 TSMC 공장이 이미 가동을 시작했고 두 번째 캠퍼스도 공사 중이다. 특히 소프트뱅크는 영국의 반도체 설계회사인 ARM을 자회사로 100% 소유하고 있는데, 여기서 설계한 반도체를 TSMC와 함께 만들겠단 계획을 가지고 있다. AI 인프라 구축도 급물살을 타고 있다. 구글과 아마존, MS 등의 막대한 투자로 클라우드와 서버를 모두 갖게 된 것이다.
 

 
하지만 끝내 가지기 힘든 것이 바로 사람들이 시간을 들여 쌓아나가는 데이터이다. 아무리 돈이 많은 다국적 기업도 이 데이터만큼은 해결할 수가 없다. 그러다 보니 챗GPT 같은 글로벌 리딩 기업도 최근에는 언론사에 돈을 주고 기사를 제공받는 식으로 AI를 학습시키고 있다. 돈은 다 외국에서 끌어올 수 있어도, 데이터만큼은 그게 안 되는 것이다.

AI 패권국을 위한 마지막 퍼즐 조각인 데이터, 이걸 원하던 일본의 눈에 들어온 것이 바로 라인이 13년간 쌓아 온 소비자 데이터이다.
 

13년간 쌓인 2억 아시아인의 데이터

라인의 이용자는 현재 2억 명이 넘는다. 이 중 약 1억 명은 일본, 나머지 1억 명은 대만과 동남아시아이다. 중국을 제외하면, 아시아 그 어떤 국가도 아시아 소비자들의 데이터를 라인만큼 많이 가지고 있는 기업이 없다. 그런데 만약 네이버가 지분을 강탈당하게 된다면 이 데이터의 소유권 역시 그대로 일본으로 넘어가게 된다.

네이버가 13년간 쌓은 이 데이터의 가치는 얼마나 될까? 전문가들은 Priceless, 가치를 매길 수 없을 만큼 비싸다고 보고 있다.

대표적인 예가 미국 최대 커뮤니티 Reddit이다. 우리나라로 치면 DC인사이드 정도 되는 레딧은 영미권 사용자라면 한 번씩은 다 이용해 봤다는 초대형 커뮤니티이다. 기자도 해외 사례를 취재할 때 레딧을 반드시 들어가 볼 정도로 이 세상 모든 분야에 대한 각종 체험 정보들이 커뮤니티 게시물 형태로 올라와 있다. 물론 게시물에는 댓글도 달린다.

AI는 나온 지 얼마 되지 않았지만, 이미 지상에 존재하는 대부분의 지식을 학습을 완료해 이제는 학습할 데이터가 부족하다는 것이 전문가들의 중론이다. 이런 상황에서 사람과 사람이 격의 없이 게시물과 댓글 형태로 자연스레 소통하는 커뮤니티의 자료들은 AI를 더욱더 인간답게 해주는 소중한 자료이다. 과거에는 그저 시덥잖은 '짤' 하나, 눈살 찌푸리게 하는 헛소리성 글 하나 정도로 간주되던 자료들이, AI를 더욱 더 사람답게 만드는 데에는 무척 소중한 자료가 된다는 것이다.

이러다 보니 적자를 면치 못하던 레딧이 얼마 전 뉴욕증시에 상장을 한 이후 주가가 폭등을 하는 현상을 보였다. 챗GPT와 구글 등 AI 기업들이 레딧에 자료를 넘겨달라며 돈을 싸 들고 몰려가는 상황이기 때문이다. 레딧은 신규 투자를 한 것도 없어 그저 하던 대로 있었을 뿐인데 졸지에 적자 기업에서 무한한 가능성을 가진 알짜배기 기업으로 밸류업이 된 것이다.

라인은 어떠한가? 일본만 보더라도 채팅 서비스 이외에도 결제와 배달, 쇼핑 등 생활 전반에 걸친 사업을 펼치고 있다. 여기서 모이는 정보는 일본, 나아가 아시아권 소비자들의 삶 그 자체이다. 아무리 챗GPT가 뛰어나다고 해도 대부분 서구권 데이터 위주이다 보니 아시아 맞춤형 서비스에서는 부족한 부분이 있을 수 있는데, 그런 면에서는 라인에 모인 데이터가 훨씬 더 아시아 맞춤형으로는 양질이다.

게다가 라인은 레딧과 비교하면 훨씬 더 좋은 회사이고 훨씬 더 수익이 많이 나는 회사이다. 라인이 13년간 모아온 아시아권 데이터를 AI가 학습을 하기 시작하면 그때 라인의 가치는 지금과는 비교도 할 수 없이 더 올라갈 수밖에 없는 것이다. 이를 알아본 일본이 결국은 '보안'을 문제 삼아 이 데이터를 통째로 빼앗아 가려 한다는 우려가 나오고 있다.
 
 

지분은 넘겨도 데이터 이용권은 확보해야

일본이 라인의 지분을 요구하는 표면적 이유는 '보안 문제'이다. 51만 명 라인 고객 정보가 유출됐다는 것이다. 그런데 네이버에 확인을 해본 결과, 유출된 고객정보는 일본인보다 태국인 정보가 훨씬 많았다고 한다. 그런데도 태국 정부가 아닌 일본 정부가 나서서 방방 뛰며 지분 매각까지 요구하고 있는 것이다.
이러다 보니 지분을 내놓을 때 내놓더라도 고객 데이터에 대한 사용권은 반드시 확보해야 한다는 이야기가 나온다. 일본이 몽니를 부리며 보안 문제를 계속 들이댄다면, 일본 소비자들의 데이터는 빼더라도 적어도 일본 이외 아시아 지역 데이터에 대한 사용권이라도 반드시 확보해야 한다는 것이다. 이는 네이버뿐 아니라 정부에게도 주어진 과제이기도 하다.
 

글로벌 IT 기업들은 왜 한국만 쏙 빼놓는가?

미국 기업들의 아시아 투자는 사실 일본만이 아니다. 일본 이외에도 주로 동남아시아 국가들에 대한 투자가 함께 이뤄지고 있다. 싱가포르와 말레이시아 등이 대표적이다. 그렇다면 글로벌 IT 기업들은 왜 한국이 아닌 일본과 동남아시아를 투자처로 선택하는 것일까?

여러 이유가 있겠지만, 우선 네이버에 한국어 대규모 언어 모델, LLM을 선점당했다는 인식이 깔려 있다. 즉, 한국에서 하려면 경쟁자가 있지만 일본 같은 곳은 기술이 없다 보니 경쟁자가 없다는 것이다.

발전 가능성에 있어서도 시장 크기나 성장 가능성에서 한국보다는 동남아가 더 매력적으로 보인다는 분석이다.

마지막으로 정부의 투자이다. 일본 같은 경우는 AI 시대만큼은 다시 과거의 영광을 되찾아 아시아 패권국으로 거듭나겠다는 의지를 강하게 보이고 있다. 도쿄 한복판에 국가전략특구를 지정해 이곳에 들어오는 해외 기업에 각종 세제 혜택과 규제 면제는 물론 지원금까지 주고 있다. TSMC 반도체 공장 설립에만 일본 정부가 10조 원에 가까운 지원금을 푼 것이 대표적인 예이다.
 
지난 2월 24일 TSMC 일본 구마모토현 제1공장 개소식 현장
 
하지만 한국은 올초 R&D 예산을 대폭 삭감한 바 있다. 최근 윤석열 대통령이 AI 산업 육성에 9조 원을 지원하겠다고 밝혔지만, 이미 올초 AI 관련 예산이 삭감된 것이 많아 그 의미가 바랜다는 지적도 나온다. AI 시대로의 전환이 이미 상당 부분 진행되고 있는 시점에서 투자 유치는 다른 나라보다 더딘데 심지어 가지고 있던 기업까지 일본에 강탈당하게 될 위기이다 보니 우려의 목소리가 점점 커지는 것이다.
 

라인 지분 매각은 정말 해결됐나?

 
윤석열 대통령은 얼마 전 기시다 총리와의 정상회담에서 라인 사태를 언급했다. "일본이 네이버의 지분 매각을 요구하는 것은 아닌 것으로 이해하고 있다"라는 윤 대통령 말에 기시다 총리는 "보안 유출 사건에 대한 '거버넌스' 재검토 요구"라고 답을 했다.

여기서 '거버넌스 재검토'라는 표현에 대한 해석이 분분하다. '거버넌스'란 '지배구조'·'관리체제'로 해석이 되는 용어이다. 보안상의 취약점을 보완한다는 말을 하고 싶었다면 굳이 '거버넌스'라는 표현을 쓰지 않았을 것이란 것이고, 그러다 보니 결국은 끝내 '지분 매각을 요구하겠다'를 재확인한 것이란 분석까지 나오고 있다.

(남은 이야기는 스프에서)

김종원 기자 terryable@sbs.co.kr

Copyright © Copyright ⓒ SBS. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?