80년 컴퓨팅의 규칙을 깨다…AI 컴퓨팅의 근본을 재설계하는 ‘언컨벤셔널 AI’[최중혁의 월가를 흔드는 기업들-창업가편]

언컨벤셔널 AI 공동창업자 겸 최고경영자 나빈 라오 인터뷰

생성형 인공지능(AI)의 급성장과 함께 글로벌 데이터센터의 전력 수요가 폭발적으로 증가하고 있다. 현재 전 세계 전력 생산 용량은 약 9000기가와트(GW), 미국은 약 1000GW 수준인데, AI 컴퓨팅 확대에 따라 향후 10년간 수백 GW의 추가 전력이 필요할 것이라는 전망이 나온다. 반도체 부족보다 전력 부족이 AI 확산의 더 큰 제약이 될 수 있다는 경고가 현실화되고 있는 것이다.

2026년 4월 미국 샌프란시스코에서 열린 ‘휴먼X(HumanX)’ 컨퍼런스의 ‘AI 붐 뒤의 인프라(The Infrastructure Behind the AI Boom)’ 세션에서 언컨벤셔널 AI의 나빈 라오 공동창업자 겸 최고경영자(CEO)는 이 문제의 본질을 짚었다.

언컨벤셔널 AI 공동창업자 겸 CEO 나빈 라오. 팔로알토캐피탈 최중혁 대표 제공

라오는 “에너지가 이제 근본적인 제약 요인으로 부상했다. 데이터센터를 이야기할 때 우리는 더 이상 면적이나 그래픽처리장치(GPU) 수가 아니라 메가와트(MW), GW 단위로 이야기한다. 이 변화는 불과 5년 사이에 일어났다”고 말했다. 이어 “전력 생산을 의미 있게 10~20% 늘리는 것은 20년이 걸리는 프로젝트다. 내일 당장 할 수 있는 일이 아니다”라고 강조했다. 언컨벤셔널 AI는 이 위기의 근본 원인을 파고들며 컴퓨팅의 기초 자체를 다시 설계하겠다고 나선 회사다.

‘실리콘 풍동’으로 AI를 재설계하다

언컨벤셔널 AI는 2025년 9월 설립된 AI 컴퓨팅 스타트업으로, 본사는 샌프란시스코에 있다. 회사명인 ‘언컨벤셔널(Unconventional·비관습적)’에는 80년간 이어져 온 디지털 컴퓨팅의 기본 전제, 즉 폰 노이만 아키텍처를 근본적으로 재설계하겠다는 선언이 담겨 있다. 폰 노이만 아키텍처는 메모리에 저장된 데이터를 프로세서(CPU)가 꺼내 연산한 뒤 다시 저장하는 구조로, 1940년대 이후 오늘날까지 거의 모든 컴퓨터의 기본 설계 원리로 자리 잡아 왔다. GPU 역시 이 구조의 연장선에 있다.

현재의 AI 컴퓨터는 신경망의 학습 과정을 숫자로 변환해 시뮬레이션하는 방식으로 작동한다. 이 과정에서 막대한 에너지를 소비한다. 반면 인간의 뇌는 뉴런과 시냅스의 물리적 동역학을 통해 정보를 처리한다. 라오의 문제의식은 생물학적 시스템이 디지털 컴퓨터처럼 모든 과정을 명시적인 숫자 연산으로 환원하지 않기 때문에 훨씬 높은 에너지 효율을 보인다는 데 있다. 언컨벤셔널 AI는 이러한 원리를 실리콘 회로에 적용하려 한다.

회사는 창업 블로그에서 스스로를 이렇게 정의했다. “F1 레이싱팀이 레이싱카를 더 공기역학적으로 만드는 것처럼, 우리는 ‘실리콘 풍동(silicon wind tunnel)’에서 지능 레이어의 ‘생물학적 스케일’ 모델을 구축해 컴퓨팅을 더욱 효율적으로 만들 것이다.” 풍동이 바람의 흐름을 수학적으로 계산하는 대신 실제 바람을 불어넣어 직접 테스트하듯, 실리콘 회로의 물리적 특성을 AI 연산에 직접 활용하겠다는 구상이다.

영국 IT 전문매체 더레지스터(The Register)와의 인터뷰에서 라오는 이 접근법의 핵심을 이렇게 요약했다. “자연의 학습 시스템은 숫자를 사용한 적이 없다. 학습의 역학을 시뮬레이션하지도 않았다. 대신 자신이 존재하는 기판의 고유한 물리를 활용해 학습 시스템을 구축했다. 우리는 이러한 작동 방식을 실리콘에서 재현할 수 있다고 믿는다.”

라오는 이 문제가 물리적으로 이미 풀려 있다는 점을 강조한다. 인간의 뇌가 20와트의 전력만으로 고도의 지능을 구현하는 것은 초자연적 현상이 아니라 물리 법칙의 결과이며, 따라서 공학적으로도 해결 가능한 문제라는 것이다. 그는 유명 테크 팟캐스트 ‘소서리(Sourcery)’에서 더욱 직설적으로 말했다. “자연에 마법 같은 것은 없다. 20와트로 사고할 수 있다는 것도 마법이 아니다. 하지만 좀 창피한 일이다(embarrassing). 우리는 몇 와트가 아니라 메가와트 단위를 쓰고 있다.”

이는 자연이 20와트로 해내는 일을 인간은 최첨단 기술을 동원하고도 수백만 와트의 전력을 써야 겨우 흉내 내고 있다는 뜻이다. 엔지니어의 관점에서 보면 부끄러울 정도의 비효율인 셈이다. 그가 말한 ‘마법이 아니다’라는 말에는 공학적으로 구현할 수 있다는 확신이 담겨있다.

1000배의 효율, 왜 지금인가

쉽게 말하면 이렇다. 현재 AI를 구동하는 컴퓨터(GPU)는 막대한 전력을 소비한다. AI 모델이 커질수록 필요한 전력도 기하급수적으로 늘어나지만, 발전소를 새로 짓는 데는 수십 년이 걸린다. 앞으로 3~4년 안에 전 세계 전력 공급이 AI 수요를 감당하지 못하는 시점이 올 수 있다는 전망까지 나온다. 언컨벤셔널 AI는 이런 상황에서 GPU의 효율을 조금 높이는 데 그치지 않고, 컴퓨터가 작동하는 원리 자체를 바꿔 에너지 소비를 1000배 줄이겠다는 목표를 내세우고 있다.

비유하자면 현재의 GPU는 바람의 흐름을 수학 공식으로 계산하는 컴퓨터 시뮬레이션에 가깝다. 반면 언컨벤셔널 AI가 만들고자 하는 것은 실제 바람을 불어넣어 시험하는 ‘풍동(wind tunnel)’이다. 물리 현상 자체를 계산에 활용함으로써 시뮬레이션에 필요한 막대한 에너지를 절약하겠다는 발상이다. 이 시도가 성공한다면 AI 비용은 지금보다 획기적으로 낮아지고, 로봇·의료·교육 등 비용 문제로 확산이 제한됐던 분야에서도 AI 활용이 본격화될 수 있다.

130년에 걸친 컴퓨팅 비용 하락의 장기 추세. 반도체 시대에는 무어의 법칙이 이 흐름을 대표했다. 컴퓨팅 비용이 떨어질 때마다 적용 분야는 과학·군사에서 비즈니스, 게임, AI로 확장돼 왔다. 언컨벤셔널 AI는 이제 AI 수요가 3~4년 내 전 세계 전력 공급의 한계에 부딪힐 것으로 본다. 출처 언컨벤셔널 AI 블로그

설립 약 2개월 만인 2025년 12월, 언컨벤셔널 AI는 a16z(안드리슨호로위츠)와 라이트스피드 벤처 파트너스가 공동 주도한 시드 라운드에서 4억7500만 달러(약 7100억 원)를 유치하며 기업가치 45억 달러(약 6조7500억 원)를 인정받았다. 세코이아 캐피탈, 아마존 창업자 제프 베조스, 럭스캐피탈, DCVC, 데이터브릭스 등도 투자자로 참여했다. 라오 역시 1000만 달러를 출자해 다른 투자자들과 동일한 조건으로 투자에 나섰다. 이는 AI 칩 분야 시드 투자 가운데 역대 최대 규모 중 하나로 평가된다.

공동창업자로는 매사추세츠공대(MIT) 교수 마이클 카빈(Michael Carbin), 스탠퍼드대 교수 사라 아슈르(Sara Achour), 구글·퀄컴·인텔 출신의 아날로그 회로 설계 전문가 미란 리(MeeLan Lee)가 참여했다. 학계의 이론가와 산업계의 실무진을 의도적으로 결합한 팀 구성이다.

칩 설계자에서 뇌 과학자로, 세 번째 도전

나빈 라오는 듀크대에서 전기공학·컴퓨터과학 학사를 취득한 뒤 선마이크로시스템즈 등에서 10년간 컴퓨터 아키텍트로 일했다. 이후 브라운대에서 계산 신경과학(Computational Neuroscience) 박사 학위를 받았으며, 하드웨어 엔지니어와 뇌과학자를 겸한 독특한 이력을 지녔다. 박사 과정 이후에는 퀄컴의 뉴로모픽(neuromorphic) 연구팀에서도 근무했다.

그는 2014년 딥러닝 전용 칩 개발 기업 너바나 시스템스(Nervana Systems)를 창업해 2016년 인텔에 약 4억 달러에 매각했다. 이어 2021년에는 AI 모델 학습 플랫폼 모자이크ML(MosaicML)을 창업해 오픈소스 대규모언어모델 MPT 시리즈와 LLM 파운드리(Foundry)를 공개하며 주목받았고, 2023년 데이터브릭스에 13억 달러에 회사를 매각했다. 너바나(칩 최적화), 모자이크ML(학습 효율화), 언컨벤셔널 AI(컴퓨팅 패러다임 자체 재설계)로 이어지는 그의 행보는 매번 더 근본적인 문제를 향해 나아가는 궤적을 보여준다.

나빈 라오 언컨벤셔널 AI 공동창업자 겸CEO(오른쪽)와 최중혁 팔로알토캐피탈 대표. 최중혁 팔로알토캐피탈 대표 제공

필자는 2026년 4월 미국 샌프란시스코에서 열린 휴먼X 컨퍼런스에서 라오 CEO를 직접 인터뷰했다. 현장에서 다루지 못한 질문은 이후 서면 인터뷰를 통해 추가로 물었다. 이 글에는 같은 행사에서 코어위브(CoreWeave)의 피터 살란키 최고기술책임자(CTO)와 함께 진행한 패널 세션에서 라오가 밝힌 견해도 함께 담았다.

창업자의 여정과 비전: “GPU조차 80년 된 구조의 연장선이다”

―너바나를 인텔에, 모자이크ML을 데이터브릭스에 매각했다. 두 차례의 성공적인 엑시트(exit) 이후에도 다시 가장 어려운 문제를 택했다. 이번 창업은 너바나나 모자이크ML과 어떻게 다른가. 무엇이 더 본질적이고, 무엇이 더 큰 기회라고 봤나.

“더 근본적인 문제다. 우리는 컴퓨터가 작동하는 기본 전제 자체에 의문을 제기하고 있다. 지난 80년 동안 인류가 만든 모든 컴퓨팅 머신은 기본적으로 같은 방식으로 작동해 왔다. GPU 역시 폰 노이만 머신이다. 메모리에서 데이터를 꺼내 연산한 뒤 다시 저장한다. 우리는 이 전제에 의문을 제기하고, ‘역동적 시스템(dynamical systems)’을 활용한 새로운 컴퓨터 구축 방식을 만들고 있다. 이 방식에는 더 이상 메모리와 연산의 구분이 없다. 그래서 어렵다. 대신 적용 범위는 훨씬 좁다. 우리는 웹 서버나 스프레드시트를 돌릴 필요가 없다. 오직 AI만을 위해 설계된 컴퓨터를 만들고 있다.

20%의 효율 개선이 아니다. 1000배 더 효율적인 시스템을 만든다면 AI를 제공하는 경제성 자체가 완전히 바뀐다. 그렇게 되면 인류 역사상 가장 큰 시장이 열릴 수 있다. AI 추론 시장은 이미 크고 계속 성장하고 있지만, 비용을 획기적으로 낮출 수 있다면 AI의 적용 범위는 사실상 모든 영역으로 확대될 것이다.”

―너바나 인수 후 인텔에서 AI 제품 그룹 부사장으로 일했지만, 인텔은 2020년 너바나 NNP(Neural Network Processor) 개발을 중단했다. 대기업 내부에서 AI 칩 혁신을 추진하며 무엇을 배웠고, 결국 회사를 떠나게 된 이유는 무엇인가.

“인텔에서 정말 많은 것을 배웠다. 기술보다 사람에 대해 훨씬 많이 배웠다. 조직을 어떻게 설계하고 운영하는지, 원격 팀을 어떻게 관리하는지, 그리고 왜 기존 강자들이 혁신과 패러다임 전환에 실패하는지를 배웠다.

회사를 떠난 이유는 내 위의 의사결정권자들이 너무 많은 잘못된 결정을 내렸기 때문이다. 인텔 내부에 AI에 대한 대규모 투자의 긴급성을 만들어내지 못했다. 해야 할 일은 분명했지만, 크고 성공적인 기업일수록 새로운 영역을 개척하기보다 기존 사업을 방어하는 데 집중하는 경향이 있다. 내가 얻은 교훈은 조직이 제대로 작동하지 않거나 성장 과정에서 변화가 필요하다는 신호를 읽는 법이었다. 또한 경영의 엄격함(rigor)이 무엇인지도 배웠다.”

인텔은 2016년 너바나를 인수하며 AI 칩 시장 진출을 선언했다. 그러나 이후 이스라엘 AI 칩 기업 하바나랩스(Habana Labs)를 추가 인수하면서 내부적으로 두 개의 AI 칩 라인이 경쟁하는 구조가 형성됐다. 결국 인텔은 2020년 너바나 NNP 개발을 중단하고, 하바나랩스의 가우디(Gaudi) 칩을 중심으로 AI 전략을 일원화했다.

―창업자 나빈 라오의 가장 큰 강점은 무엇이라고 생각하나. 제품 비전, 기술 통찰, 자본 조달, 조직 구축 가운데 스스로 가장 차별화된 역량은 어디에 있다고 보나.

“나는 대부분의 사람들보다 먼저 특정 방향에 대한 강한 확신을 가져왔다고 생각한다. 그것은 기술이 어떻게 진화하는지를 바라보는 시각에서 나온다. 몇 년 뒤 시장이 어떤 모습일지에 대한 이해와 기술에 대한 이해를 결합하는 것, 그것이 비교적 드문 역량이라고 생각한다.
하지만 그것만으로는 충분하지 않다. 최고의 인재를 끌어들일 수 있는 올바른 서사(narrative)를 갖는 것도 중요하다. 비전을 현실로 만들려면 결국 최고의 사람들이 함께해야 한다. 시장에 대한 이해, 기술에 대한 통찰, 그리고 뛰어난 인재를 모을 수 있는 서사. 이 세 가지의 결합이 나의 강점이라고 생각한다.

AI 인프라의 근본적 한계

―지금의 AI 인프라가 가진 가장 근본적인 병목은 무엇이라고 보나. 비용, 전력, 메모리, 데이터 이동, 병렬화 한계 가운데 무엇이 가장 큰 문제인가.

“전력과 메모리다. 그게 전부다. 나머지는 모두 이 둘의 함수다. 비용은 전력과 메모리의 함수이고, 데이터 이동은 결국 메모리 문제다. 같은 이야기다. 병렬화는 상대적으로 쉬운 문제다. 결국 핵심은 1와트의 에너지로 얼마나 많은 지능을 구현할 수 있느냐다.”

라오는 휴먼X 컨퍼런스에서도 같은 메시지를 반복했다. “가장 큰 병목이 무엇이냐”는 질문에 그는 “메모리 대역폭이 근본적인 제약이 됐다”고 답했다. 이어 “언컨벤셔널 AI가 주목하는 것은 기존과 완전히 다른 연산 방식을 설계해 메모리 벽(memory wall)을 우회할 수 있느냐는 점”이라며 “계산을 ‘역동적 시스템(dynamical systems)’으로 재구성하면 메모리에서 데이터를 읽고 쓰는 빈도를 극적으로 줄일 수 있다”고 설명했다.

AI 추론의 에너지 비용은 연산이 아니라 메모리 접근에서 대부분 발생한다. 1000억 파라미터 모델로 토큰 하나를 생성할 때 연산만 따지면 0.007줄(J)이지만, 외부 메모리(HBM)에서 데이터를 읽어오면 3.9J로 약 500배 늘어난다. 라오가 ‘전력과 메모리가 근본 병목’이라고 말한 이유다. 출처 언컨벤셔널 AI 블로그

―언컨벤셔널 AI가 풀고자 하는 문제를 일반 독자도 이해할 수 있게 설명해 달라. 왜 기존 CPU·GPU 중심 구조만으로는 앞으로의 AI 수요를 감당하기 어렵다고 보는가.

“디지털 컴퓨팅의 기본 구조는 결정론적 애플리케이션을 위해 만들어졌으며, 전력 효율은 애초에 중요한 고려 대상이 아니었다. 무어의 법칙 덕분에 전력 효율도 자연스럽게 개선됐지만, AI의 컴퓨팅 수요가 폭증하면서 이제는 현재의 패러다임을 더 확장할 만큼 충분한 전력이 존재하지 않는다. 앞으로 컴퓨팅은 글로벌 차원에서 에너지 제약에 직면하게 될 것이다.

언컨벤셔널 AI는 물리 세계가 정보를 표현하고 계산하는 방식을 근본적으로 다시 생각함으로써 이 문제를 해결하려 한다. 자연은 계산이 어디에나 존재하며 매우 효율적으로 이뤄질 수 있음을 보여준다. 점균류도 계산을 하고, 인간의 뇌는 20와트만으로 작동한다. 더 놀라운 것은 다람쥐의 뇌가 수 밀리와트 수준의 전력만으로 작동한다는 점이다. 이는 아이폰보다 약 100배 적은 전력이다.

우리가 활용하는 핵심 개념은 회로가 시간에 따라 변화하는 고유한 물리 현상을 AI 추론에 직접 활용하는 것이다. 자연계의 모든 물리 현상은 시간에 따라 끊임없이 변하지만, 현재의 컴퓨팅 구조는 이러한 특성을 활용하지 못한다. 우리는 컴퓨팅에 시간이라는 차원을 도입하려 한다.”

하드웨어와 소프트웨어를 함께 진화시키다

―최근 블로그에서 ‘뉴럴 코-에볼루션(Neural Co-Evolution)’이라는 개념을 제시했다. 하드웨어와 신경망을 처음부터 함께 설계한다는 것인데, 이 접근은 왜 지금 가능해졌고 어떻게 작동하나.

“지금 가능해진 이유는 몇 가지가 있다. 첫째는 AI 그 자체다. 추상화(abstraction)는 소프트웨어와 하드웨어의 복잡성을 관리하기 위해 인간이 만든 개념이다. 복잡한 시스템을 다루기 위해 단순한 API와 추상화 계층을 만들어 왔다. 하지만 AI를 활용하기 시작하면 더 이상 같은 수준의 추상화가 필요하지 않을 수 있다. AI는 전체 코드 스택을 스스로 생성할 수 있고, 그 능력은 계속 발전하고 있다.

문제는 추상화가 성능 측면에서 대가를 치르게 한다는 점이다. 복잡한 것을 단순하게 만드는 과정에서 효율이 희생된다. 또한 하드웨어와 소프트웨어를 엄격히 구분하는 현재의 구조는 혁신의 폭을 제한해 왔다. 알고리즘 연구자는 하드웨어가 특정 기능만 수행할 수 있다고 가정하고, 하드웨어 설계자는 그 기능을 구현하는 데 집중한다. 하지만 이 경계를 재설계하면 하드웨어와 알고리즘을 함께 진화시킬 수 있고, 알고리즘에 필요한 물리적 특성을 하드웨어에서 직접 활용할 수 있다. 이것이 코-에볼루션의 의미다.”

라오는 휴먼X 컨퍼런스에서도 이 개념을 강조했다. 그는 “몇 년 전 발표된 ‘하드웨어 복권(Hardware Lottery)’ 논문의 핵심은 오늘날의 AI 알고리즘이 기존 하드웨어 환경에 맞춰 발전해 왔다는 점”이라며 “현재 AI는 GPU 아키텍처와 그 제약에 과도하게 최적화돼 있다. 이 추상화의 틀을 깨면 성능과 에너지 효율 측면에서 훨씬 더 나은 방식으로 나아갈 수 있다”고 설명했다.

―창업 블로그에서 ‘지능에 대한 올바른 동형사상(isomorphism)은 무엇인가?’라는 질문을 던졌다. 구체적으로 어떤 물리적 기반(substrate)을 탐색하고 있나.

“본질적으로는 ‘역동적 시스템 이론(dynamical systems theory)’에 관한 이야기다. 흔히 ‘카오스 이론’이나 ‘삼체 문제(three body problem)’와 연관 지어 설명되는 분야다. 단순한 요소들로 구성된 대규모 시스템이 어떻게 작동하는지를 연구한다. 물리 세계에서 각각의 요소는 시간 차원을 갖는다. 분자들의 상호작용이나 당구공들의 충돌 모두 역동적 시스템의 예다. 인간의 뇌 역시 매우 복잡한 역동적 시스템이다.

우리가 던지는 질문은 이것이다. 시스템이 시간에 따라 변화하는 역학 자체를 계산에 활용할 수 있을까? 만약 가능하다면 오늘날에는 얻을 수 없는 수준의 효율성 향상이 가능해진다. 이 방식은 본질적으로 폰 노이만 병목을 피할 수 있으며, 에너지 효율뿐 아니라 시간 효율도 높일 수 있다.

또 하나의 질문은 물리 세계의 반복성(repeatability)을 활용할 수 있느냐는 것이다. 물론 그 과정은 매번 완벽하지 않고 일정한 노이즈를 수반한다. 회계 소프트웨어라면 덧셈 결과가 항상 정확해야 한다. 하지만 AI는 반드시 그럴 필요가 없다. 어느 정도의 불확실성과 오차를 허용하더라도 충분히 작동할 수 있다. 그렇다면 이러한 특성을 하드웨어 차원에서 활용해 전력 효율을 높일 수 있지 않을까. 자세한 내용은 결과가 나오는 대로 향후 몇 달 안에 공개할 예정이다.”

엔비디아 생태계, 넘을 것인가 피할 것인가

―언컨벤셔널 AI는 엔비디아의 GPU를 대체하려는 것인가, 아니면 보완하려는 것인가.

“궁극적으로 우리는 AI 추론을 위한 더 나은 패러다임을 구축해 엔비디아를 비롯한 기존 하드웨어를 대체할 수 있다고 믿는다. 다만 현실은 더 복잡하다. 매우 빠른 부동소수점 연산은 당분간 여전히 중요할 것이다. 따라서 언컨벤셔널의 솔루션은 기존 방식이 최적이 아닌 영역부터 적용될 가능성이 크다.”

―IBM의 노스폴(NorthPole), 인텔의 로이히(Loihi) 등 뉴로모픽 칩 연구는 수십 년간 이어져 왔지만 상업적 성공 사례는 거의 없다. 언컨벤셔널 AI가 이들과 근본적으로 다른 점은 무엇인가.

“기존 시도들은 문제의 핵심을 제대로 짚지 못했다고 생각한다. 대부분은 디지털 컴퓨터가 하는 일을 다른 방식으로 구현하려 했다. 아날로그 컴퓨팅이나 뉴로모픽 분야의 많은 연구도 결국 ‘행렬 곱셈(matrix multiplication)을 어떻게 구현할 것인가’에 집중했다. 하지만 그것은 잘못된 질문이다.

우리가 다시 생각해야 하는 것은 신경망 자체를 어떻게 설계할 것인가다. 행렬 곱셈은 GPU에 최적화된 연산이다. 아날로그 하드웨어에 최적화된 방식이 아니다.

기존 시도들이 성과를 내지 못한 이유도 여기에 있다고 본다. 뉴럴 코-에볼루션을 하지 않았기 때문이다. 신경망 구조는 그대로 둔 채 같은 추상화 위에서 새로운 하드웨어만 만들려고 했다. 하지만 진정한 변화는 그 추상화 자체를 깨는 데서 시작된다. 우리가 성공할 수 있다고 믿는 이유도 바로 여기에 있다.”

―지난 10년간 그래프코어(Graphcore), 세레브라스(Cerebras), 삼바노바(SambaNova) 등 수많은 AI 칩 스타트업이 엔비디아의 쿠다(CUDA) 생태계를 넘지 못하고 고전했다. 언컨벤셔널 AI가 같은 운명을 피할 수 있다고 확신하는 근거는 무엇인가.

“언컨벤셔널은 기존 디지털 머신과 같은 방식으로 프로그래밍할 수 있는 표준 컴퓨터를 만들고 있지 않다. 세레브라스는 자신의 니치를 찾아 지금 꽤 잘하고 있다고 반론하고 싶다(매우 빠르지만 비싼 추론). 추론에는 학습만큼의 CUDA 종속(lock-in)이 없다. 그리고 우리가 만드는 것은 GPU 대비 전력 효율에서 극적으로(dramatically) 더 나을 것이다. 1000배 더 나은 것을 목표로 한다. 그 정도의 효율을 얻기 위해서라면 고객들은 기꺼이 맞춤화(customization)를 할 것이다.”

―지금의 AI 업계는 ‘모델’에 시선이 집중돼 있다. 하지만 실제 승부는 컴퓨팅 구조에서 갈릴 수 있다고 보나. 앞으로 가장 과소평가된 경쟁력은 무엇이라고 생각하나.

“컴퓨팅과 에너지에 대한 접근성이 앞으로 가장 큰 단일 경쟁 우위가 될 것이다. 세상은 데이터센터 경제학으로 전환됐다. 에너지 계약을 확보하고 모든 와트를 수익화하는 것이 핵심이다. 우리가 와트당 더 많은 토큰(tokens/s per watt)을 제공할 수 있다면, 우리 솔루션으로 이동할 직접적인 인센티브가 있다.”

‘코드로 소통하는’ 초학제적 조직

―이번 회사에서 가장 먼저 채용하고 싶은 인재는 어떤 사람인가. 반도체, 시스템 아키텍처, ML 인프라, 신경과학 등 서로 다른 배경을 어떻게 한 팀으로 묶고 있나.

“우리에게도 큰 도전이다. 우리가 채용하는 사람들 가운데는 순수 이론가들이 있다. 수학이나 이론 신경과학 박사들이다. 이들이 실제 하드웨어를 만드는 엔지니어들과 소통하도록 만드는 일은 생각보다 쉽지 않다.

그래서 우리는 ‘코드로 소통하는’ 방식을 만들었다. 코드는 의사소통을 매우 명확하게 해준다. 고수준 연구자들은 하드웨어를 이해하면서 자신이 필요한 것이 무엇인지 코드로 구체적으로 표현할 수 있다. 반대로 회로를 설계하는 사람들은 이를 바탕으로 실제 구현 가능한 모델을 제시할 수 있다. 서로 다른 계층을 오가며 협업할 수 있게 된 것이다. 이 방식을 정립하는 데 시간이 걸렸지만, 덕분에 다른 조직이 하기 어려운 ‘크로스 레이어 혁신(cross-layer innovation)’이 가능해졌다.”

한국에는 삼성전자와 SK하이닉스 등에서 세계적 수준의 반도체 경험을 쌓은 인재들이 많다. 아날로그 회로 설계와 동적 시스템 이론, ML 인프라를 아우르는 언컨벤셔널 AI의 초학제적 접근은 한국 반도체 인재들에게도 흥미로운 기회가 될 수 있을 것이다.

―딥테크 스타트업은 기술 리스크뿐 아니라 시간 리스크도 크다. 초기 투자자와 팀에게 ‘왜 지금이 적기인가’를 어떻게 설명했나.

“기술적으로 성공한다면 인류 역사상 가장 큰 시장을 만들 수 있다. 투자자들이 이 회사에 참여한 이유도 바로 그것이다. 나는 그동안 기술 트렌드의 타이밍을 비교적 잘 읽어왔다고 생각한다. 그리고 에너지 문제가 앞으로 더욱 심각해질 것이라는 점은 분명하다.”

―언컨벤셔널 AI는 역대급 규모의 시드 라운드를 유치한 것으로 알려져 있다. 이 정도 규모의 초기 투자가 가능했던 이유는 무엇인가. 시장이 그만큼 절박하다는 뜻인지, 아니면 두 차례의 성공적인 엑시트를 이끈 당신에 대한 신뢰가 컸던 것인지 궁금하다.

“앞서 말한 이유와 같다. 시장 기회가 사실상 무한하기 때문이다.”

―대형 클라우드 사업자와 하이퍼스케일러들은 이미 자체 칩과 시스템을 개발하고 있다. 스타트업이 이 시장에서 의미 있는 위치를 차지하려면 어떤 방식으로 접근해야 하나.
“우리는 기존 시스템의 마진을 조금 더 개선하는 도구를 만들고 있는 것이 아니다. 하이퍼스케일러들이 이미 그런 일을 하고 있고, 그것은 합리적인 전략이다. 우리는 완전히 새로운 컴퓨팅 패러다임을 구축하려 한다. 그리고 그것이 가능하다면 압도적인 경쟁 우위를 확보할 수 있을 것이다.”

미래 비전: “10년 안에 로봇이 어디에나 있을 것”

―디퓨전 모델, 플로우 모델, 에너지 기반 모델처럼 본질적으로 역학(dynamics)을 내재한 모델이 언컨벤셔널의 접근에 더 적합하다고 했다. 이들 모델의 발전 방향은 언컨벤셔널의 타이밍 판단에 어떤 영향을 미쳤나.

“이들은 이미 실제 서비스 환경에서 중요한 모델 유형으로 자리 잡고 있다. 또 우리 접근법에 잘 맞는 ‘루프 트랜스포머(looped transformers)’ 같은 새로운 모델도 등장하고 있다. 세상은 우리가 처음부터 바라봤던 방향으로 움직이고 있다.”

휴먼X 컨퍼런스에서 라오는 “신경망의 근본은 사람들이 생각하는 것만큼 크게 변하지 않는다”고 말했다. 그는 “특히 연산의 기본 단위 관점에서 보면 더욱 그렇다. 인공 신경망은 오래전부터 존재해 왔고, 역전파(backpropagation·신경망이 학습하는 핵심 알고리즘) 역시 1980년대에 등장했다”며 “변화가 빠른 표면층이 있는 반면, 그 아래에는 매우 안정적인 기반이 존재한다”고 설명했다.

―만약 언컨벤셔널 AI가 성공한다면 AI 산업은 무엇이 가장 크게 달라질까. 단순히 더 싸고 빠른 컴퓨터를 넘어 어떤 새로운 제품과 산업이 가능해질까.

“나는 수십억 대의 로봇이 서로 협력하며 다양한 작업을 수행하는 세상을 본다. 현재의 데이터센터 중심 대형 칩 구조로는 그런 세상을 구현하기 어렵다. 10억 대의 로봇이 동시에 연결되면 네트워크 대역폭에 엄청난 부담이 생긴다. 로봇 자체에 더 많은 연산 능력이 필요하고, 이를 지원하기 위해 더 작고 분산된 데이터센터도 필요하다.”

라오는 휴먼X 컨퍼런스에서도 “개인적으로 가장 기대하는 분야는 물리적 로봇”이라고 말했다. 그는 “수많은 로봇이 실제 세계에서 함께 일하고, 집단적으로 협력해 문제를 해결하는 모습에 흥분한다”며 “이는 진정한 물리적 에이전트이자 일종의 합성 생명(synthetic life)”이라고 설명했다. 이어 “수천 마일 떨어진 기가와트급 초대형 데이터센터에 의존하는 현재 구조로는 그런 세상을 만들 수 없다”며 “앞으로 10년 안에 로봇이 우리 주변 곳곳에 존재하게 될 것”이라고 전망했다.

한국 반도체·AI 생태계에 대한 메시지

―한국은 삼성전자, SK하이닉스 등 세계 최고 수준의 반도체 제조 역량을 보유하고 있다. 한국의 투자자, 기업인, 정책입안자에게 전하고 싶은 메시지가 있다면 무엇인가.

“한국은 이 생태계의 중요한 구성원이다. 실제로 우리는 이미 삼성과 일부 협력을 진행하고 있다. 흥미로운 점은 우리가 기존보다 오래된 공정 노드(process node)를 새로운 방식으로 활용해 반도체 생산 능력을 실질적으로 늘릴 수 있다는 것이다. 한국과의 협력 없이 가능한 미래는 없다고 생각한다.

물론 메모리도 중요한 영역이다. 우리가 성공한다면 외부 DRAM에 대한 의존도는 크게 줄어들 수 있다. 이것이 한국 메모리 산업에 좋은 일인지는 확신할 수 없다. 하지만 의존의 중심이 메모리에서 실리콘 전반으로 이동하게 될 것이고, 장기적으로는 한국 반도체 생태계 전체에 긍정적일 것이라고 본다.

또 한국에는 이 분야의 AI 연구와 응용에 참여하는 뛰어난 인재들이 많다. 모자이크ML 시절에도 한국 고객들이 있었다. 어떤 형태로든 우리는 한국 생태계와 함께 일하게 될 것이다.”

필자(최중혁)는 미국 미시간대 경영학석사(MBA) 학위를 받은 뒤 삼성SDI America, SK Global Development Advisors 등을 거쳐 미 실리콘밸리 소재의 사모펀드 팔로알토캐피탈(Palo Alto Capital)을 설립해 운용하고 있다. ‘AI 로봇 반도체 BIG 3 투자 트렌드’ ‘2025~2027 앞으로 3년 미국 주식 트렌드’ 등의 저자다.

최중혁 팔로알토캐피탈 대표

동아일보에서 직접 확인하세요. 해당 언론사로 이동합니다.