2023년 최고의 화두 챗GPT…2024년엔 ‘이것’에 주목하라 [더테크웨이브]

로봇에 접목되는 AI 기술 트렌드 분석

지난해 11월, 챗GPT가 세상에 등장한 이후 많은 것들이 바뀌었습니다. AI기술은 이제 실생활 곳곳에 침투했습니다. AI가 워낙 다양하게 활용되고 있다 보니, 서비스 앞에 AI를 붙이는 것이 차별화에 있어 큰 의미가 없어졌을 정도입니다.

그렇다면 다음으로 ‘기술 충격’이 일어날 분야가 있을까요? 저는 로봇을 떠올려 봅니다.

사실 로봇과 AI는 뗄 수 없는 관계에 있습니다. 로봇 학자들은 로봇에 쓰이는 인공지능 기술을 ‘로봇지능’이라고 부르죠. 로봇지능이 발달할수록 더 똑똑한 로봇이 나올 수 있고, 하드웨어(로봇)에 대한 수요 자체가 커질 것이라는 예상입니다. 특히 AI 기술은 △자율주행 △작업처리 능력 △로봇의 의사 결정 능력 △로봇과 인간의 상호작용 △에너지 효율성 강화 측면에서 로봇 발전을 앞당길 수 있습니다.

실제로 최근 AI와 로봇 기술을 접목하는 시도가 활발히 이뤄지고 있어 주목할 필요가 있습니다. 이 역시 소프트웨어와 하드웨어 기술력을 동시에 갖춘 빅테크 회사들이 주도하고 있고요. 내년에는 이같은 움직임이 더욱 빨라질 것으로 예상됩니다.

그래서 이번주 <더테크웨이브>에서는 내년도 더 뜨거운 이슈가 될 ‘AI 로보틱스’에 대해 다뤄보겠습니다.

챗GPT를 로봇에 심는다고?

챗GPT, 바드 등 챗봇을 중심으로 생성형AI 생태계가 확장되고 있지만 현재까지는 디지털 공간 내에서 생산, 활용되는 것이 대부분입니다.

그간의 로봇 프로그래밍은 엔지니어(사람)가 로봇의 언어로 코딩해 명령을 입력하고 로봇의 피드백을 관찰해 수정하는 작업을 반복하는 수준에 머물러 있었습니다.

하지만 대규모언어모델(LLM)을 로봇에 적용할 수 있다면, 자연어 명령만으로 로봇을 조종하거나 창작활동을 하는 것이 가능해질 수 있습니다. 예컨대 AI를 로봇에 적용해 기계가 사람처럼 인식·행동할 수 있도록 유도하고 챗GPT처럼 자연어 명령만으로 로봇을 조종하는 것이죠.

최근에는 오픈AI의 GPT와 같은 생성AI를 로봇에 접목하는 시도가 이뤄지면서 변화가 일어나고 있습니다. 프로그램과 프로그램을 잇는 ‘GPT 애플리케이션 프로그램 인터페이스(API)’를 로봇 두뇌에 연결해 사람 대신 AI가 로봇에 명령어를 내려주는 것이죠.

엔비디아의 로봇 훈련 AI에이전트 ‘유레카’ 동작 이미지. 엔비디아블로그

엔비디아는 최근 로봇을 훈련하기 위한 알고리즘을 자동으로 생성하는 AI 에이전트 ‘유레카(Eureka)’를 공개했습니다. 오픈AI의 LLM GPT-4의 자연어 기능과 강화학습을 결합해 로봇이 복잡한 기술을 배울 수 있도록 돕습니다. 사람처럼 손가락으로 펜을 돌리거나, 서랍과 캐비닛 열기, 공 던지기와 잡기, 가위 사용 등 30여 가지 작업을 수행할 수 있다고 회사측은 밝혔습니다.

앞으로 빅테크의 생성AI를 튜닝해 하드웨어(로봇)의 동작을 제어하는 서비스를 내놓는 스타트업도 더욱 많이 생겨날 것으로 예상됩니다. 청소 로봇과 서빙 로봇 등 이미 실생활에 많이 보급된 로봇들이 우선적인 타깃이 될 수 있겠습니다.

분석업체 넥스트MSC에 따르면, AI 로봇 시장은 2021년 956억6000만 달러에서 연평균 32.95% 성장해 2030년 1847억달러로 2배 가까이 커질 것으로 예상됩니다. 넥스트MSC는 “AI로봇은 딥러닝을 사용해 명시적인 지시를 따르지 않고도 학습하고 적응하는 로봇”이라면서 “사무실 서비스에 AI 로봇을 활용하는 사례가 확대되면서, 시장 성장이 더욱 가속화되고 있다”고 분석했습니다.

고차원의 ‘로봇 두뇌’ 개발 경쟁

더 심화한 차원의 ‘로봇 두뇌’를 개발 경쟁도 치열합니다.

도요타연구소(TRI)는 지난 9월 AI를 통해 로봇을 고도화하는 교육 기법을 공개하면서 이를 로봇용 ‘대규모행동모델(Large Behavior Model)’로 정의했어요.

현 단계에서 AI는 로봇을 위한 코드를 일일이 작성하거나, 동작을 프로그래밍해온 로봇 공학자들의 어려움을 덜어주고 있는데요. 여기서 더 나아가 고도의 두뇌(LBM)를 장착한 로봇이 속속 개발되고 있다는 설명이죠. LLM이 챗GPT와 같은 대화형AI에 혁명을 일으켰듯 LBM이 로봇 분야에서 새로운 기술 충격을 가져올 것이라는 설명입니다.

단순히 물건을 집어 새로운 위치에 내려놓는 수준에서 벗어나 AI를 통해 로봇이 일상적인 상황을 예측하고 사람과 상호 작용할 수 있는 시대가 코앞에 다가온 셈입니다.

도요타는 수년전부터 자체 리서치연구소인 TRI와 투자 자회사를 통해 연구개발과 창업 생태계 선점에 속도를 높이고 있는 회사입니다. 특히 도요타 산하 투자회사인 우븐 캐피탈(Woven Capital)은 로봇. 자율주행, 소프트웨어 분야에서 미국 주요 로봇 실험실의 지식재산권(IP)과 유망 스타트업 지분을 긁어모으고 있고요. 도요타 TRI는 “올해 연말까지 수백 가지의 새로운 기술을 가르치고 2024년 말까지 1000가지의 새로운 기술을 로봇에 가르칠 것”이라고 밝혔습니다.

테슬라는 현존하는 가장 빠른 슈퍼컴퓨터 ‘후카쿠’보다 2배 이상 빠른 슈퍼컴퓨터 ‘도조’ 를 개발중입니다. 이 컴퓨터는 향후 테슬라의 휴머노이드 로봇에 적용될 것으로 예상됩니다. 일론 머스크 테슬라 CEO는 뇌과학 전문기업 뉴럴링크도 설립해 관련 연구를 진행 중이죠. 머스크 CEO가 뇌 과학에 심혈을 쏟고 있는 이유는 단순 헬스케어 사업 목적이 아니라 테슬라의 로봇 비전과도 밀접한 관련이 있다는 해석이 나옵니다.

로봇 전용 AI모델 등장

구글은 지난 7월 로봇을 위한 AI 모델인 로보틱스 트랜스포머2(RT-2)를 공개했어요. 프로그래밍이나 별도의 훈련 없이도 스스로 학습해 명령을 이해하는 로봇 특화 AI모델로 지난해 공개한 RT-1의 업그레이드 버전입니다.

전 버전인 RT-1의 경우 물건을 들어 옮기고 서랍을 여는 작업을 수행하기 위해 엔지니어의 프로그래밍 작업이 일일이 필요했는데요. RT-2는 할 일을 일일이 입력하지 않아도 인터넷상 이미지와 텍스트를 바탕으로 스스로 기술을 습득해 실행 방법을 찾아낸다고 합니다.

RT-2를 탑재한 로봇은 인터넷 웹상에 나오는 시각적 정보를 학습해 이미 쓰레기가 무엇인지에 대한 생각을 갖고 있고요, 훈련 없이도 이를 식별할 수 있습니다.

예컨대 로봇에게 ‘못을 박고 싶은데 망치가 없다’고 말하면 카메라 센서로 물건을 인식해 주변에 있는 돌덩이를 집어주는 식이죠.

구글은 이를 ‘시각-언어-행동’ 모델이라고 소개하고 있습니다.

이를 두고 뉴욕타임스(NYT)는 “RT-2가 LLM을 일종의 인공두뇌처럼 사용하고 있다”고 분석했죠. 구글은 당장 AI를 로봇을 출시하거나 판매할 계획이 없고, 해당 모델을 통해 실물 로봇을 훈련하고 있는 것으로 알려졌습니다.

‘로봇 눈’ 강화하는 네이버

경기 성남시 분당구 네이버 신사옥 ‘1784’에서는 매일 오후 ‘루키’로 불리는 배달 로봇 수십 대가 분주하게 움직이고 있습니다. 직원들이 모바일로 시킨 주문을 처리하기 위해서죠. 몸통에 택배, 음료, 음식 등을 실은 루키는 로봇 전용 엘리베이터(로보포트)를 타고 2층부터 27층까지 활보하며 자리로 택배 등을 전달합니다.

현재 단계에서 루키는 로봇친화건물로 설계된 1784에 최적화 돼 있습니다. 사람이 붐비고 장애물이 즐비한 일반 공간에서도 로봇이 자유롭게 다양한 임무를 수행할 수 있도록 하는 것이 다음 목표이지요.

네이버는 루키와 같은 로봇을 일상 세계로 끌어내기 위해 ‘로봇의 눈’을 강화하고 나섰습니다.

사실 AI와 로봇을 접목하는 것은 하드웨어와 소프트웨어 둘 다를 해야 하기 때문에 상당한 자본과 인력이 투입되는 일입니다. 세계적으로도 이를 상용화하겠다고 나서는 회사가 많지 않은 이유이기도 하죠. 국내 기업중엔 네이버가 가장 앞서서 빅테크와 경쟁하고 있습니다.

3D비전 파운데이션 모델 ‘크로코’

매일경제 취재결과, 네이버는 회사의 글로벌 AI전진기지인 ‘네이버랩스 유럽’이 개발한 3D 비전 파운데이션 모델 ‘크로코’를 이르면 내년 초 자사 로봇에 적용할 예정인 것으로 파악됐습니다.

1784에서 활동 중인 루키로봇과 데이터센터 ‘각 세종’에 위치한 3종 로봇 등 로봇 120여대가 그 대상이죠.

크로코(CROCO)는 Cross-view Completion의 약자로, 동일 장면에 해당하는 다른 시점의 이미지들로 AI가 현실 세계를 이해하도록 가르친 것입니다. 쉽게 말해 마치 사람이 두 눈으로 3차원을 인식하는 것처럼 로봇 눈을 강화하는 모델입니다.

챗GPT등에 쓰이는 LLM이 수많은 문장 데이터를 이용하여 학습한다면 크로코는 동일 장면에 해당하는 다른 시점의 이미지들을 통해 로봇에 탑재된 AI가 현실 세계를 이해하도록 가르치는 구조입니다.

이를 통해 클라우드에 연결된 로봇들이 각종 장애물을 살피고 로봇에 특화된 공간 밖에서도 인지·행동·상호작용할 수 있도록 돕는 것이죠. 이는 사람이 두 눈으로 3차원을 인식하는 것과 비슷합니다.

네이버는 학습과 미세 조정을 통해 로봇이 복잡한 물리 세계의 적응력을 키우는 데 사용할 수 있다고 설명합니다. 예를 들어 클라우드에 연결된 다수의 로봇들이 특정 공간에서만 서비스를 잘하는 것이 아니라, 다른 공간에 가서도 환경 변화에 적응하여 서비스를 잘 제공할 수 있게 되는 것이죠.

환경 정보가 변화하거나 불완전할 경우에도 모빌리티 등의 성능을 안정화할 수 있습니다. 특히 대규모 로봇들의 모빌리티에 더욱 효과적으로 적용할 수 있습니다. 이는 기존의 AI 방식만으로는 불가능한 일입니다. 궁극적으로 로봇들이 어딘가로 이동해야 할 때 사람처럼 공간을 탐색할 수 있게 하는 것이 네이버랩스 연구진의 목표입니다.

‘로봇 눈’을 획기적으로 발전시키면 사람과의 상호 작용 측면에서도 큰 변화를 기대할 수 있습니다. 로봇에게 사람은 매우 복잡한 이해의 대상입니다. 로봇이 다양한 상황에서 사람의 행동과 의도를 이해할 수 있다면, 안전하게 상호작용할 수 있는 로봇 서비스를 제공할 수 있겠죠.

마틴 휴멘버거 네이버랩스 유럽 연구소장은 “파운데이션 모델을 통해 여러 문제를 푸는 지식의 이전이 일어나고 있다. 이러한 연쇄반응을 통해 미래에는 복잡한 현실세계에서 1000대의 로봇이 1,000개의 각기 다른 작업을 수행할 수 있게 될 것”이라고 강조했습니다.

네이버랩스유럽의 ‘중대결정’

그동안 네이버랩스의 주된 연구 대상은 AI와 물리 세계의 접점이었다고 합니다.

중점을 두는 분야 역시 로봇이 다양한 환경에서 태스크를 수행하는 ‘행동(action)’, 로봇이 환경을 이해하고 인지하는 ‘비전(vision)’, 로봇과 인간의 ‘상호작용(interaction)’으로 요약됩니다.

네이버가 신사옥 1784를 로봇 친화 건물로 꾸민 것도 AI기술을 활용해 로봇을 더 똑똑하고 다재다능하게 만들기 위해서였죠.

한정된 자원에서 로봇AI 경쟁력을 키우기 위해서는 전략적 선택이 필요했습니다. 네이버랩스 유럽의 연구자들은 2021년 중대 결정을 내렸습니다. 지금까지 진행해 온 연구 프로젝트들을 파운데이션 모델 기반으로 전환하겠다는 것이었죠.

파운데이션 모델은 매우 방대한 데이터셋을 사용해 사전 학습됩니다. 일종의 반제품이기 때문에 다양한 목적으로 활용할 수 있습니다. 당시 연구진들은 파운데이션모델이 대세가 될 것을 강하게 확신했지만 많은 전환 비용이 발생하기 때문에 쉽지 않은 결정이었다고 회고합니다.

파운데이션모델과 AI

파운데이션모델은 로봇AI에 어떤 도움을 줄 수 있을까요. 기술적으로 볼 때, 제어되지 않은 환경에서 로봇이 자율적으로 작업을 수행하도록 하는 것은 너무나 어렵다고 합니다.

제어가 안된다는 건 예상할 수 없다는 의미겠죠. 그래서 로봇이 예기치 않게 작업이 중단되어도 그 대응 방법을 찾는 일이 매우 복잡하고요. 그래서 예상치 못한 변수가 많을수록 기업들은 로봇의 능력을 더욱 제한하는 선택을 하게 되죠.

파운데이션 모델은 이런 한계를 돌파할 핵심 열쇠가 됩니다. 방대한 양의 데이터로 포괄적으로 학습시킨 후 특정 목적에 따라 미세 조정을 하면, 새로운 작업에 적용하는 노력을 최소화할 수 있기 때문이죠. 특히 도메인이 다른 연구자들끼리 파운데이션 모델을 통해 서로의 시너지를 높일 수 있는 것도 조직 차원의 장점으로 꼽힙니다.

현실적으로 물리 세계의 데이터 확보가 쉽지 않고, 실제 세상은 늘 빠르게 변화하기 때문에 데이터 업데이트가 필수적입니다.

로봇업계에서는 이러한 이유 등으로 디지털 세계에서의 성과에 비해 물리적 세계에서의 파운데이션 모델 연구가 전 세계적으로 초기 단계에 머물러 있다고 평가하고 있습니다.

AI가 세상을 변화시키고 있습니다. 좀 더 정확히 말하자면, ‘디지털 세계’를 바꾸고 있습니다. 챗봇, 이미지 생성 AI, 3D 아바타 등 주로 디지털 세계에서 일어나는 일들의 예시입니다. 하지만 주목해야 할 또 다른 세계가 있습니다. 바로 우리가 살아가는 물리 세계입니다. 근래의 혁신적인 AI 방법론은 로봇이나 디지털 트윈과 같은 물리 세계를 대상으로도 활용될 수 있습니다. 심지어 더 큰 잠재력을 발견하고 있습니다.

‘휴머노이드’를 향해가는 로봇 개발

‘로봇 뇌’가 더 똑똑해질수록 로봇이 할 수 있는 일들이 많아질 수 있겠죠.

아직 상용화 단계에 있진 않지만 인간과 거의 유사한 역할을 하게 될 ‘휴머노이드’ 로봇이 로봇 사업의 ‘끝판왕’이 될 수 있습니다.

궁극적으로는 휴머노이드를 내놓는 것이 로봇업계의 목표이자 과제입니다.

창업한지 2년도 안된 로봇 스타트업 ‘피규어(Figure)’는 휴머노이드 분야에서 가장 주목받은 회사 중 하나입니다. 국제학술지 ‘IEEE 스펙트럼’ 등에 따르면 이 회사는 세계 최초로 상업적으로 사용 가능한 범용 휴머노이드 로봇 ‘피규어 0.1’를 고도화하고 있습니다.

불과 12개월의 개발 끝에 지난 10월 피규어는 휴머노이드 로봇이 걷는 영상을 공개했습니다.

회사 측은 “피규어 로봇이 생각하고, 학습하며, 환경과 상호작용할 수 있는 능력을 갖게 될 것이다. 이 로봇은 노동력 부족을 해결하고, 시간이 지나면서 안전하지 않고 바람직하지 않은 작업의 필요성을 없애줄 것”이라고 자신감을 드러냈죠. 피규어는 창업후 1년동안 IHMC, 보스턴 다이내믹스, 테슬라, 웨이모, 애플, 크루즈, 구글X 등에서 40명 이상의 핵심 엔지니어를 영입했다고 합니다.

테슬라는 지난 9월 사람을 닮은 AI휴머노이드(인간형 로봇) ‘옵티머스’의 영상을 공개했습니다.

손가락 5개를 가진 이 로봇은 능숙하게 플라스틱 블록을 잡아 색깔별로 상자에 분류합니다. 테슬라는 “(수집한) 영상 이미지를 바탕으로 탑재된 신경망을 통해 스스로 훈련하고 행동으로 옮긴다”고 설명했죠. 옵티머스는 고난도 요가 동작까지 선보였습니다.

업계에서는 머지 않아 테슬라가 공장 투입과 판매 등 옵티머스 상용화에 나설 것으로 보고 있습니다.

로봇의 정의

로봇은 외부환경을 스스로 인식하고 상황을 판단해 자율적으로 동작하는 기계 장치를 의미합니다.

체코의 작가 카렐 차페크가 ‘R.U.R’란 희곡에서 로봇이란 단어를 처음 사용했죠. 업계에선 통상적으로 산업용(제조)와 서비스 로봇으로 구분합니다.

현대차그룹 자회사 보스턴 다이내믹스 가 개발한 로봇 아틀라스. 보스턴다이내믹스

산업용 로봇은 공장자동화, 협동 로봇 등 제조 현장에서 널리 쓰입니다. 서비스용 로봇에는 국방, 의료 등 전문서비스 로봇과 가사, 건강 교육 등 개인 서비스 로봇 등이 있습니다.

더 큰 범위에서는 자율주행차, 드론, AI스피커 등을 로봇 개념에 포함시키기도 하죠. 나아가 아직 상용화 단계에 있진 않지만 인간과 거의 유사한 역할을 하게 될 ‘휴머노이드’ 로봇은 인류의 패러다임을 바꿀 핵심 기술로 주목받고 있습니다.

보스턴컨설팅그룹은 세계 로봇 시장이 2020년 250억달러(약 31조원)에서 2023년 400억달러(약 50조원)로, 2030년에는 1600억달러(약 201조원)까지 커질 것으로 전망했습니다.

2024년, AI로봇 티핑포인트

AI로봇은 내년부터 ‘티핑포인트(급격한 변화 시점)’에 접어들 전망입니다.

지난 1년간 챗봇과 같은 AI기술이 개인 사용자들의 관심을 받았다면 지금부터는 기업들의 기술 개발과 맞물려 물리 세계에서 활동하는 AI를 발견할 수 있을 것으로 보입니다.

로봇이 사람을 대신해 유의미한 노동력을 제공할 수 있게 된다면, 제조 물류 등 산업 전 영역에서 큰 변화가 일어날 것으로 보입니다.

인간의 노동방식과 생산성 나아가 삶의 패러다임이 바뀔 수 있습니다. 로봇업계 일각에서는 이를 ‘1차 로봇혁명’이라고 표현하는 분들도 있습니다.

챗GPT 등장 이후 기술 변화의 속도를 감안하면, 1차 로봇 혁명이 임박했음을 실감하는 요즘입니다.

<황순민 기자의 더테크웨이브> 연재를 시작합니다. 기술(Tech)이 세상을 더 나은 곳으로 만들리라 믿습니다. 혁신적인 서비스로 인류를 진보시키는 최신 기술 동향과 기업 사례를 소개하겠습니다. 네이버 기자페이지를 구독하시면 다음 기사를 쉽게 받아보실 수 있습니다.

이 기사에 대해 어떻게 생각하시나요?

매일경제에서 직접 확인하세요. 해당 언론사로 이동합니다.

IT

2023년 최고의 화두 챗GPT…2024년엔 ‘이것’에 주목하라 [더테크웨이브]