“말 잘하는 로봇으론 역부족”…우리는 ‘눈’을 가진 로봇 만든다 [더테크웨이브]

황순민 기자(smhwang@mk.co.kr) 2024. 6. 29. 18:09
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

네이버랩스유럽, 파운데이션 모델로 로봇 혁신
마틴 휴멘버거 연구소장 단독 인터뷰

경기도 성남시 분당구에 위치한 네이버 본사 ‘1784’. 사람과 로봇이 공존하는 미래 오피스를 실험이 한창인 공간입니다. 이곳에선 매일 오후 ‘루키’로 불리는 배달 로봇 수십 대가 임무를 수행하고 있습니다.

1784에서는 직원들이 주문한 물건을 로봇이 자리에 가져다주는 것이 일상이 됐습니다. 몸통에 택배, 음료, 음식 등을 실은 루키는 로봇 전용 엘리베이터(로보포트)를 타고 지상 2층부터 27층까지 활보하며 직원 자리로 배달합니다.

네이버 1784 사옥에서 운영중인 로봇 루키. 네이버
네이버는 로봇용 인공지능(AI) 모델 개발에서 국내 기업 중 가장 앞서간다는 평가를 받고 있는 회사입니다. 로봇 분야에서 네이버의 다음 목표는 사람이 붐비고 장애물이 즐비한 일반적인 공간에서도 로봇이 자유롭게 다양한 임무를 수행할 수 있도록 하는 것입니다.

핵심은 바로 AI 비전 파운데이션 모델입니다. 네이버는 미래 기술 연구개발(R&D) 핵심 조직인 ‘네이버랩스유럽’을 통해 관련 기술을 축적하고 있습니다. 특히 마치 사람이 두 눈으로 3차원을 인식하는 것처럼 로봇 눈을 강화하는 모델을 고도화하고 있습니다.

이게 왜 중요한지가 이번 기사의 핵심입니다.

이번주 <더테크웨이브>에서는 네이버랩스유럽을 이끌고 있는 마틴 휴멘버거 연구소장과의 인터뷰를 중심으로 테크업계에서 로봇을 ‘물리세계’로 끌어내기 위해 어떤 노력을 기울이고 있는지 살펴보겠습니다.

가벼운 마음으로 읽어주세요.

마틴 휴멘버거 네이버랩스유럽 연구소장. 네이버
제기되는 LLM 로봇 한계론
최근 AI 광풍속에서 로봇 시장에 대한 관심이 높아지고 있습니다.

일부 스타트업들은 LLM을 하드웨어(로봇)에 탑재한 시연 영상등을 공개하면서 막대한 투자금을 유치하기도 했고요.

이러한 가운데 최근 로봇학계와 업계 등에서는 단순히 대규모언어모델(LLM)을 로봇에 탑재하는 아이디어에 대해 회의적인 의견도 나오고 있어 주목됩니다.

로봇이 물리 세계를 실제로 이해하도록 돕는 피지컬(physical) AI가 개발되지 못한 상황에서는 한계가 분명히 존재하다는 것입니다. 챗GPT 등 여러 AI서비스의 근간이 되는 LLM이 분명히 디지털 공간에서 많은 혁신을 가져오고 있지만, 실제 세상에서의 적용은 전혀 다른 차원의 기술 진보가 필요합니다.

예컨대 우리 몸을 동작하고 만지고 짚는 등의 지능은 모두 무의식적으로 이뤄지고 있습니다. 아무리 알고리즘을 세밀하게 짜도 불확실성이 존재하는 물리적 세상에서는 단지 사람의 데이터를 모방하는 것만으로 로봇을 사람처럼 만들 수 없다는 지적이죠.

LLM이 ‘로봇의 뇌’가 되어줄 수 있는가에 대한 의문도 제기됩니다. 생성AI에 쓰이는 언어 데이터는 다루기 쉬운 형태로 정돈된 경우가 많습니다. 이보다 다양성이 넓은 그림 데이터는 사람이 일일히 언어와 대조하는 라벨링 작업을 거쳐 학습시키고 있죠.

이같이 만들어진 언어모델을 로봇에 탑재하더라도 시나리오 안에 존재하는 일을 반복하는 수준에 그칠 수 밖에 없다는 게 전문가들의 지적입니다.

이러한 로봇의 경우 외관이 인간처럼 보이지만 실상 인간처럼 할 수 있는 게 없는 반쪽짜리 휴머노이드가 될 수 밖에 없다는 것이죠. 실제로 로봇이 세상에 나왔을때 실생활에서 마주할 변수는 무궁무진한데, 그 많은 데이터를 모두 학습시키는 게 현실적으로 쉽지 않은 상황입니다.

결국엔 가상 세계의 모방을 넘어 물리적인 현실을 이해하는 AI 모델이 필요한 상황입니다.

이와 관련해 마텐 휴멘버거 네이버랩스유럽 연구소장은 “생성형 AI가 세상을 변화시키고 있다지만 정확히는 ‘디지털 세상’을 변화시키고 있는 것이다. AI를 우리가 살아가는 ‘물리 세계’에 적용할 때 로봇산업에 혁신을 가져오게 될 것”이라고 강조했습니다.

네이버랩스유럽, 로봇 ‘뇌’ 대신 ‘눈’에 주목
네이버랩스유럽은 로봇의 ‘눈’을 강화하는 방법을 택했습니다.

네이버랩스유럽은 네이버 로봇 루키 등에 이미 탑재돼 실험중인 ‘크로코’를 비롯해 이를 업그레이드한 ‘더스터(DUSt3R)’ 그리고 마스터(MASt3R) 등의 파운데이션모델(FM)을 개발하고 고도화하고 있습니다.

챗GPT 등에 쓰이는 LLM이 수많은 문장 데이터를 이용해 학습한다면 네이버랩스유럽이 개발중인 FM은 동일 장면에 해당하는 다른 시점의 이미지를 통해 로봇에 탑재된 AI가 현실 세계를 이해하도록 가르칩니다.

이를 통해 클라우드에 연결된 로봇들이 각종 장애물을 살피고 로봇에 특화된 공간 밖에서도 인지·행동·상호작용할 수 있도록 돕죠. 사람이 두 눈으로 3차원을 인식하는 것과 비슷한 원리입니다.

네이버랩스는 학습과 미세 조정을 통해 로봇이 복잡한 물리 세계의 적응력을 키우는 데 사용할 수 있다고 설명하고 있어요.

예를 들어 클라우드에 연결된 다수의 로봇들이 특정 공간에서만 서비스를 잘하는 것이 아니라, 다른 공간에 가서도 환경 변화에 적응하여 서비스를 잘 제공할 수 있게 되는 것입니다.

‘로봇 눈’을 획기적으로 발전시키면 사람과의 상호 작용 측면에서도 큰 변화를 기대할 수도 있어요.

로봇에게 사람은 매우 복잡한 이해의 대상이거든요. 로봇이 다양한 상황에서 사람의 행동과 의도를 이해할 수 있다면, 안전하게 상호작용할 수 있는 로봇 서비스를 제공할 수 있는 길이 열릴 것으로 기대됩니다.

기술 업계와 학계에서는 파운데이션 모델을 통해 로봇이 여러 문제를 푸는 지식의 이전이 일어나는 것을 목표로 연구를 진행중입니다. 이러한 연쇄반응을 통해 미래에는 복잡한 현실세계에서 1000대의 로봇이 1000개의 각기 다른 작업을 수행할 수 있을 것이라는 설명입니다.

마치 사람처럼 사고(思考)하고 행동하는 ‘휴머노이드’가 수년내로 등장할 것이라는 예상보다 좀 더 현실성 있는 목표와 계획으로도 보여집니다.

로봇 스타트업 피규어AI가 개발한 휴머노이드 로봇 ‘피규어01’(왼쪽). 중국 바이두가 개발한 ‘워커S’가 티셔츠를 정리하는 모습. 로봇 시장 관련 그래픽. 피규어AI·바이두, 매경DB
네이버랩스유럽의 중대결정
네이버랩스의 주된 연구 대상은 AI와 물리 세계의 접점에 맞춰져 있습니다.

중점을 두는 분야는 로봇이 다양한 환경에서 태스크를 수행하는 ‘행동(action)’, 로봇이 환경을 이해하고 인지하는 ‘비전(vision)’, 로봇과 인간의 ‘상호작용(interaction)’으로 요약되고요.

네이버가 신사옥 1784를 로봇 친화 건물로 꾸민 것도 AI기술을 활용해 로봇을 더 똑똑하고 다재다능하게 만들기 위해서였습니다.

다만 한정된 자원에서 로봇AI 경쟁력을 키우기 위해서는 전략적 선택이 필요했다고 해요. 네이버랩스 유럽의 연구자들은 2021년 중대 결정을 내렸습니다. 지금까지 진행해 온 모든 연구 프로젝트들을 파운데이션 모델 기반으로 전환한 것이죠.

파운데이션 모델은 매우 방대한 데이터셋을 사용해 사전 학습됩니다. 일종의 반제품이기 때문에 다양한 목적으로 활용할 수 있고요.

당시 연구진들은 파운데이션모델이 대세가 될 것을 강하게 확신했지만 많은 전환 비용이 발생하기 때문에 쉽지 않은 결정이었다는 후문입니다.

마틴 휴멘버거 네이버랩스유럽 연구소장과의 대화
마틴 휴멘버거(Martin Humenberger)는 알프스 인근 프랑스 그르노블에 위치한 프랑스 최대 규모의 AI 연구소 ‘네이버랩스 유럽’의 연구소장(Director of Science)입니다.

파운데이션 모델을 활용해 로봇이 주변 환경을 이해하고 사람들과 상호작용을 하는 방법을 개발하는 총 책임자죠. 모든 사람이 일상생활에서 로봇을 유용하게 사용할 수 있도록 하는 것이라는 그의 비전이 인상 깊었습니다.

휴멘버거 소장과 나눈 대화를 독자분들께 전합니다.

마틴 휴멘버거 네이버랩스유럽 연구소장. 네이버랩스
-네이버랩스유럽의 비전이 궁금합니다.

=우리의 비전은 로봇이 일상생활에 유용하게 쓰일 수 있도록 하는 것입니다. 이는 현재 로봇이 매우 제한적인 환경(일반적으로 공장)에서 매우 특정한 목적(나사와 볼트를 조이는 등)으로 작동하도록 설계되었기 때문에 할 수 있는 일에서 크게 벗어난 것인데요. 따라서, 두 가지 측면에서 로봇을 다용도로 만드는 것이 로봇의 상업적인 도입을 늘리는 데에 핵심입니다.

첫째, 로봇이 제약 없는 환경에서 작동할 수 있도록 만들고자 합니다. 지금까지 네이버랩스는 오피스 빌딩, 호텔, 병원 등 대형 공간에 집중해왔는데요. 이렇게 다양한 환경에서 로봇이 마주하게 되는 모든 조건을 예상하는 것은 불가능합니다. 따라서 예상하지 못한 환경과 조건에 대응할 수 있도록 프로그래밍 되어야 합니다.

두번째로, 로봇이 정말 유용하게 사용되기 위해서는 로봇이 특수 목적이 아닌 다양한 작업을 수행할 수 있어야 합니다. 이상적으로는, 사용자의 롱테일 니즈를 예측하는 것은 어렵기 때문에 각 단일 작업을 개별적으로 프로그래밍할 필요가 없습니다. 사실, 사용자 수만큼 많은 작업이 있을 수 있습니다. 예를 들어, 제가 로봇에게 “사무실 책상을 정리해 줘”라고 요청한다면, 다른 사람이 같은 요청을 하는 것과 다른 것을 의미할 수도 있습니다. 따라서 로봇은 실행하도록 명시적으로 프로그래밍된 작업이 아닌 요청을 수행할 수 있어야 합니다.

-AI로봇 상용화를 위해서 현재 가장 개선이 필요한 부분은 무엇일까요. 현재 개발중인 파운데이션모델(FM)이 로봇 발전에 어떤 역할을 할 수 있나요.

=최근까지만 해도 AI 관련 업계에서 로봇이 환경이나 작업 측면에서 ‘예상하지 못한 것을 처리하는 것’은 불가능하다고 여겨졌습니다. 파운데이션 모델에 대한 연구개발이 발전한 덕에 최근 이러한 생각이 바뀌고 있습니다.

네이버랩스 유럽에서는 이러한 파운데이션 모델을 물리적인 세계와 로보틱스에서 어떻게 유용하게 만들지에 대한 연구가 대부분을 차지하며, 예상치 못한 상황에 대처하는 문제에 무엇보다 중점을 두고 있습니다.

일상용 로봇을 본격적으로 사용화하기까지는 갈 길이 아직 멀지만, 이제는 그 길로 나아가는 방법을 잘 알고 있다고 생각합니다. 시기를 감히 예측하기는 어렵습니다.

-네이버랩스유럽이 FM 개발에 선택과 집중한 배경은 무엇인가요.

=DUSt3R(현재 개발중인 모델)는 2021년 네이버랩스 유럽이 전략적으로 내린 결정 중 하나인데요, 당시 네이버랩스 유럽은 ‘파운데이션 모델(Foundation Model)’로 알려진 모델에 연구를 집중하는 것으로 결정했습니다.

이는 방대한 양의 데이터로 학습된 대규모 신경 모델로, 다양한 용도로 활용될 수 있습니다. 하이퍼클로바X, 챗GPT, DALL-E 등이 파운데이션 모델의 예시입니다. 돌이켜 보면, 네이버랩스에게 파운데이션 모델이 미래에 중요한 역할을 할 것이라는 것은 이미 명확했습니다.

하지만 당시 파운데이션 모델 연구는 주로 디지털 세계의 문제를 해결하는 것에 초점을 두고 있었습니다. 물리적 세계(Physical World), 즉 우리가 살고 있고 사람과 로봇 간의 상호작용이 일어나는 세계와는 대조적인데요. 파운데이션 모델은 ‘일상 생활에서 유용한 로봇’이라는 저희의 비전을 실현하기 위한 핵심입니다.

-어떤 분야에 집중하는 FM인가요.

=핵심 아이디어 중 하나는 3D 비전을 위한 파운데이션 모델을 개발하는 것이었습니다.

프로젝트를 시작할 당시, 이미지 태깅이나 얼굴 인식과 같이 2D 컴퓨터 비전을 잘하는 파운데이션 모델은 이미 여러 개 있었지만 3D 비전 작업을 효율적으로 해결하는 모델은 없었기 때문입니다. 도시, 랜드마크나 건물의 디지털 세트로부터 도시, 랜드마크, 건물, 공간이나 사물의 디지털 트윈 및 복제품을 만드는 것이 이러한 3D 비전 작업의 예시라고 할 수 있습니다.

이러한 문제를 해결하기 위한 일반적인 솔루션은 보통 모서리나 가장자리 같은 특정 기하학적 패턴을 추출하는 복잡한 특수 목적의 프로세싱 파이프라인을 포함하는데요, 이는 이미지의 내용을 실제로 ‘이해하지’는 못합니다.

지금까지 가능했던 것을 뛰어넘을 수 있는 유망한 방법은 세계가 3D로 어떻게 보이는지를 완전히 이해하는 파운데이션 모델을 만드는 것이라고 생각했습니다.

이것이 가능하다면, 이미지의 특정한 몇 개의 지점에서 3D 구조를 단순히 복원하는 것이 아니라, 3차원의 세계를 인간의 방식으로 이해하는 방법을 만들 수 있게 됩니다. 이런 모델에 하나 이상의 이미지로 방의 3D 복제 모형을 만들도록 요청한다면, 모델은 방이 보통 4개의 벽으로 이뤄져 있고 벽은 평면이라는 사실 등을 이미 이해하고 있습니다. 이러한 지식을 방의 실제 사진에 적용해서 물리 공간에 대해 매우 사실적인 디지털 트윈을 만들 수 있습니다.

-최신 모델 더스터(DUSt3R)의 특징이 궁금합니다.

=DUSt3R는 이미지가 촬영된 위치, 촬영된 방향, 사용된 초점 거리 등 3D 비전 작업에서 이미지에서 보통 추출되는 거의 모든 정보를 제공할 수 있습니다. 개별적이고 비용이 많이 드는 처리 단계에 의존하는 대신, DUSt3R는 일반적으로 이를 위해 필요한 시간보다 훨씬 짧은 시간만에 이 모든 것을 한 번에 제공합니다. 몇 시간이 아니라 몇 초입니다. 우리가 DUSt3R를 ‘간편한 3D 컴퓨터 비전’이라고 소개하는 이유가 여기에 있습니다. 모두가 3D 재구성을 할 수 있도록 하는 것을 DUSt3R의 미래라고 봅니다!

-그 다음은 무엇인가요.

=이미 DUSt3R의 다음 버전인 MASt3R를 개발했습니다.

DUSt3R의 두 가지 한계를 극복했는데요. 먼저 DUSt3R는 스케일까지만 3D 재구성을 할 수 있는데, 미터 단위의 3D 정보를 제공하지 못합니다. 또한 성능이 뛰어나기는 하지만, DUSt3R는 이미지 매칭을 목적으로 설계된 것은 아닙니다. 이 작업은 3D 비전 시스템에 중요한 요소이고, 두 이미지 간의 유사점을 찾는 것으로 구성됩니다. 이 두 가지 한계를 극복할 수 있도록 MASt3R를 설계했습니다.

또한 MASt3R의 훈련 프로토콜에 이미지 매칭을 통합했습니다. 또한 3D 정보를 미터 단위로 제공할 수 있도록 축척 불변성(Scale Invariance)를 제거했습니다. MASt3R는 DUSt3R가 할 수 있는 것을 더 정확하고, 강력하게 수행할 수 있습니다.

-로봇 분야에서 요즘 가장 ‘핫’한 휴머노이드에 대해선 어떻게 보고 있나요.

=휴머노이드 로봇이 미래에 주요한 역할을 할 수 있다는 데에 동의합니다. 네이버랩스 유럽이 직접 로봇 자체를 개발하지는 않지만, 저희의 연구가 이 분야에서 영향을 미칠 수 있다고 생각합니다. 3D 비전을 위한 파운데이션 모델 뿐만 아니라, 실제 세계에서의 자율 주행이나 사물 조작 등 실제 로봇을 위한 작업을 직접 해결하는 모델도 연구한다고 확신합니다.

두 작업 모두 휴머노이드 로봇과 관련이 있지만, 현 시점에서는 네이버 사옥 1784의 로봇이나 최근 개소한 네이버의 두 번째 데이터센터 등 네이버랩스가 이미 개발한 시나리오에 적용하는 것에 초점을 맞추고 있습니다.

미래 도시에는 휴머노이드나 바퀴 이동 로봇, 다리가 있는 로봇과 같이 다양한 형태의 로봇이 필요합니다. 이 때문에 네이버랩스 유럽은 특정 로봇이 아니라 범용 로봇을 위한 AI를 발전시키고 있습니다.

휴머노이드 시장 전망과 중국의 로봇 개발 육성 주요 움직임. 매경DB
-AI와 로봇 업계 인재 쟁탈전이 치열합니다. 네이버랩스유럽의 경우 유럽의 훌륭한 인재를 영입하는 전진기지 역할을 하고 있는 것으로 알고 있습니다. 빅테크와의 인재 쟁탈전에서 우위를 차지하기 위한 전략이 따로 있나요.

=AI 업계에서 인재 영입을 위한 경쟁이 그 어느때보다 치열합니다!

그리고 네이버랩스 유럽은 특히 유럽에서 AI 인재를 네이버로 유치하는 데에 있어 핵심적인 역할을 하고 있습니다. 채용 전략에서 중요한 부분을 차지하는 것은 학계와의 협력 네트워크입니다. 이 방면에서 전통적으로 매우 적극적으로 협력을 해왔는데요. 이러한 협업은 MIAI(Multidisciplinary Institute in Artificial intelligence), PRAIRIE(PaRis AI Research InstitutE)와 같은 국가적인 AI 이니셔티브의 멤버가 되거나 유럽 전역의 학술 파트너와 일대일 협업을 진행하는 등 다양한 형태로 이루어지고 있습니다.

예를 들어, 독일 다름슈타트 공과대학교와는 로봇 조작, 파리 소르본대학교와는 정보 검색과 LLM, 프라하 체코공과대학교와는 개인정보 보호 3D 비전 모델 등을 연구하고 있습니다. 이러한 협업을 통해 초기 단계에서 젊은 인재를 발굴하는 기회를 얻고 있습니다. 인재 영입 전략에서 다른 중요한 측면은 저희 연구원과 엔지니어들에게 흥미로운 프로젝트를 제공할 수 있다는 점입니다.

네이버랩스 유럽의 과학자들은 연구 프로젝트에 대한 아이디어를 직접 제안할 수 있고, 획기적인 기술을 개발하는 팀의 일원이 될 수 있고, 그들의 연구 결과를 발표할 수도 있습니다. 무엇보다도 실제 환경에서 작동하는 실제 로봇에 자신의 연구를 적용해볼 수 있습니다.

-요즘 인재들은 보상도 중요하지만 자신이 어떤 의미있는 일을 하고 있는지, 얼마큼 성장할 수 있는지를 중요하게 보는 것 같습니다.

최고의 인재를 유지하기 위한 최고의 전략은 그들이 성장할 수 있는 흥미로운 프로젝트를 제공하는 것이라고 생각합니다.

그리고 네이버랩스 유럽이 바로 이를 제공하고 있다고 생각합니다! 연구자들과 엔지니어들은 과학 분야에서 가장 도전적인 문제를 해결할 수 잇는 기회를 얻고 있습니다. 그리고 그들은 이 프로젝트가 성공하면, ‘일상생활에 유용한 로봇’이 우리 사회를 변화시키면서, 네이버에 국한되지 않고 그 이상의 더 큰 영향을 미칠 수 있다는 것을 알고 있습니다.

인재들이 머무르는 데 기여하는 다른 요소도 있습니다. 그 중 하나가 다양성인데요. 먼저 출신 국적의 다양성이 있습니다. 현재 네이버랩스 유럽에는 25개국 이상의 다양한 국적을 가진 직원들이 있고, 이는 업무 환경을 포용적으로 만드는 데 기여하고 있습니다. 기술 측면에서도 다양성이 존재합니다.

보다 좁은 영역에 초점을 맞춘 다른 AI 연구소와 비교해, 네이버랩스 유럽은 머신 러닝, 컴퓨터 비전, 자연어 처리 등 다양한 컴퓨터 과학 기술 뿐만 아니라 사용자 경험 디자인, 소프트웨어 엔지니어링 등 광범위한 분야를 다루고 있습니다. 그렇기 때문에 자신의 핵심 역량이 무엇이든 네이버랩스 유럽에 합류하면 다양한 분야의 유능한 연구자와 엔지니어들과 상호작용하고 성장할 수 있는 기회를 얻을 수 있게 됩니다.

그리고 프랑스 알프스 중심부의 그르노블이라는 특별한 위치도 있습니다! 주변 산 봉우리에 있는 공원에서 보는 경치는 매번 방문객들을 놀라게 하고 저희 연구자들에게 영감을 주고 있습니다. 이 모든 것들이 네이버랩스 유럽의 문화를 특별하게 만들고 있습니다.

프랑스 그로노블 전경. Explore France TM
-한국의 네이버랩스와는 어떤 관계인가요.

=한국의 네이버랩스와의 관계는 상호 존중을 바탕으로 하고 있습니다. 네이버랩스 유럽은 연구 프로젝트를 선택하는 데에 많은 자유를 누리고 있습니다. 다른 한편으로는 한국 동료들과의 협업으로 저희의 연구가 네이버랩스의 로봇과 궁극적으로는 네이버의 제품에 적용될 수 있는 기회를 극대화하고 있습니다.

-네이버의 글로벌 AI분야 경쟁을 위해 네이버랩스유럽이 어떤 역할을 할 수 있다고 보시나요?

=네이버랩스유럽은 네이버의 변화에 중요한 역할을 해오고 있다고 생각합니다. 실제로 3년 전에, 아무도 챗GPT를 들어본 적이 없던 시절, 네이버랩스 유럽은 파운데이션 모델과 그것이 기술 지형을 어떻게 변화시킬지 예측하고 인식하기도 했습니다.

이처럼 지금 우리의 역할은 변함이 없습니다. AI, 더 넓게 기술 분야에서 일어나는 일들을 예측하고, 로보틱스를 포함한 임바디드 AI(embodied AI)에서 네이버의 미래를 준비하는 것입니다.

마치며
앞서 말씀드린 것처럼 AI 혁신은 현 단계에서 ‘디지털 세계’에 집중돼 있는 것도 사실입니다.

챗GPT, 바드와 같은 AI챗봇, 이미지 생성 AI, 3D 아바타 등은 모두 디지털 세계에서 일어나는 일들이죠.

다음의 혁신은 우리가 살아가는 물리 세계에서 일어날 수 있습니다. (혁신이 일어나길 기대하고 있습니다. 그러기 위해서는 획기적인 기술적 ‘돌파구(Breakthrough)’가 필요한 것도 사실입니다.)

하지만 현실적인 제약도 상당합니다.

우선 로봇AI 개발에는 막대한 비용이 듭니다.

현실적으로 물리 세계의 데이터 확보도 쉽지 않고요. (현재의 데이터센터 규모로는 턱없이 부족하다는 의견도 있습니다). 또 실제 세상은 늘 빠르게 변화하기 때문에 데이터 업데이트가 필수적입니다.

로봇업계에서는 이러한 이유 등으로 디지털 세계에서의 성과에 비해 물리적 세계에서의 파운데이션 모델 연구가 전 세계적으로 초기 단계에 머물러 있다고 평가하고 있습니다.

파운데이션 모델에 집중하는 네이버의 ‘선택과 집중’ 전략이 어떤 성과로 나타날지 계속해서 지켜보고 독자분들에게 업데이트를 전하겠습니다.

<황순민 기자의 ‘더테크웨이브’> 연재를 시작합니다. 기술(Tech)이 세상을 더 나은 곳으로 만들리라 믿습니다. 혁신적인 서비스로 인류를 진보시키는 최신 기술 동향과 기업 사례를 소개하겠습니다. 네이버 기자페이지를 구독하시면 다음 기사를 쉽게 받아보실 수 있습니다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?