지난 23일(현지시각) 스위스 다보스 포럼에서 미국 인공지능(AI)업체인 스케일 AI 최고경영자(CEO) 알렉산더 왕은 중국 AI 스타트업 딥시크(딥시크)가 대다수 미국 빅테크 AI 기술을 제쳤다고 말해 전세계 AI 주도국인 미국을 충격에 빠트렸다.
그가 언급한 딥시크는 중국 항저우에 있는 창업된 지 2년도 안된 회사다. 이 회사가 지난 20일 발표한 AI모델 ‘딥시크-R1’은 오픈소스 기반으로서 미국기업보다 훨씬 적은 AI훈련 비용만 들이고도 세계적 빅테크 AI기업과 같거나 능가한 기술력을 평가받은 데다 무료로 제공된다.
이같은 내용이 알려지면서 전세계 AI 투자자들과 소비자들은 즉각 반응했다. 이 내용이 반영된 첫날인 지난 27일(현지시각) 미증시는 엔비디아를 비롯한 관련 빅테크 AI 주식 폭락으로 반응했다. 애플 앱스토어에서 딥시크-R1은 챗GPT를 제치고 다운로드 1위를 차지했다.
딥시크는 저비용 투자만으로도 미국 빅테크들의 세계 최고 AI기술 경쟁력 자부심에 의문부호를 더했고 미국 실리콘밸리와 투자업계를 혼란의 도가니에 빠뜨렸다.
세계 AI연구와 산업화를 쥐락펴락하던 미국 AI가 한수 아래로 내러다 보던 중국기업에 추격당했다는 소식은 이제 ‘AI의 ‘스푸트니크 쇼크’까지 비유되고 있다.
중국 스타트업 딥시크 창업자 량원펑의 비하인드 스토리, 미국을 뺨치는 딥시크를 내놓을 수 있었던 이유, 값싸게 만들어 무료로 배포하는 이 AI 모델 등장의 의미, 엔비디아 등 미국의 AI 관련 빅테크의 움직임, 논란과 충격에 빠진 미국 AI 업계의 움직임과 전문가들의 평가 등을 종합해 봤다. CNBC, 로이터, 포춘, 이코노믹 타임스 등을 참고했다.
美 CEO, “지난해 크리스마스에 모든 게 바뀌었다”
시작은 미국 알렉산더 왕 스케일 AI CEO의 지난 23일(현지시각) 다보스 포럼 발언이었다.
왕은 중국 AI 스타트업 딥시크의 오픈 소스 AI 모델인 딥시크-R1에 대해 소개하면서 이 모델이 미국 AI모델을 빠르게 따라잡았다고 밝혔다. (알렉산더 왕은 지난 2016년 AI SW 훈련(머신러닝)용 데이터에 주석을 다는 플랫폼 회사인 스케일AI를 창업했다. 그와 함께 이 회사 전무 겸 전략책임자로 일해 온 마이클 크라트시오스 트럼프 1기 행정부 최고기술책임자(CTO) 는 지난주 트럼프 2기 행정부에서 과기정책실장(Director of OSTP)으로 지명됐고 현재 미상원인준을 기다리고 있다.)
왕은 미-중 간 AI 경쟁은 “AI 전쟁”이라고 말하면서 중국 AI업체가 미국 AI기술력을 추월했다고 말했다. 그에 따르면 미국은 지난 10년 동안 AI경쟁에서 중국을 이끌었지만 지난해 말 모든 것이 바뀌었다.
그는 이날 중국의 대표적 AI 스타트업인 딥시크가 지난해 크리스마스에 “지구를 뒤흔드는 모델”을 내놓았고 이어 “오픈AI가 최근 출시한 챗GPT o1 모델과 겨룰 강력한 추론 중심 AI 모델인 ‘딥시크-R1’을 출시했다”고 밝혔다. 이어 “우리가 발견한 바에 따르면 딥시크는 ... 가장 성능이 뛰어나거나 최고의 미국 모델과 거의 동등하다”고 말했다.
세계 AI연구개발과 상업화의 선두주자로 자부하던 미국 기술업계가 충격에 빠졌다.
그도 그럴 것이 중국 스타트업 딥시크는 그동안 오픈AI, 구글, 메타를 포함한 미국 주요 AI기업에 훈련 데이터를 제공하는 기업으로만 여겨져 왔기 때문이었다. 항저우의 AI 스타트업 딥시크는 헤지펀드인 하이플라이어의 공동창업자인 량원펑(梁文锋)이 2023년 5월 세운 AI스타트업으로서 거의 알려지지 않은 회사였다. 지난해 처음 자체 AI모델인 딥시크 V3를 공개했다.
더 놀라운 것은 그런 중국 업체가 천문학적 돈이 필요하다는 AI모델을 훈련하는 데 기존 미국 기업의 10분의 1에 불과한 저비용으로 최단시일 내에 미국 AI를 뺨칠 강력한 모델을 내놓은 것으로 알려졌기 때문이다.
딥시크 연구진은 지난달 논문에서 1월 10일에 출시된 딥시크-V3 모델이 600만 달러(약 87억원) 미만의 비용을 들여 엔비디아의 저용량 H800 칩을 훈련에 사용했다고 밝혔다.
이날 스위스 다보스포럼에서 오픈 AI의 최대 투자자 중 한 명인 사티아 나델라 MS CEO도 딥시크의 새로운 모델에 대해 “매우 인상적”이라고 말하며 “중국의 발전을 매우, 매우 진지하게 받아들여야 한다”고 덧붙였다
그 충격파는 마치 1957년 10월4일 구 소련이 미국에 앞서 인공위성 스푸트니크를 쏘아올렸을때의 쇼크를 연상케 한다는 지적이 나올 정도다.
인터넷 웹브라우저 ‘넷스케이프 커뮤니케이터’를 개발하고 상용화해 인터넷 실용화 시대를 연 실리콘밸리의 구루 마크 앤드리센은 26일 자신의 X(트위터)에 “딥시크 R1은 AI의 스푸트니크 순간이다”라고 썼다. 딥시크-R1 쇼크를 마치 1957년 10월4일 구 소련이 미국에 앞서 스푸트니크 인공위성을 먼저 쏘아올렸을 때의 쇼크에 빗댄 것이다. 당시 미국은 자신들과 우주경쟁을 벌이고 있는 공산주의 국가 소련이 농경 중심의 저개발 국가여서 절대로 미국보다 먼저 로켓을 쏘아올릴 수 없을 것이라고 생각하고 있었지만 이게 뒤집힌 것이다.
사실 딥시크에게는 그간 알려진 것이상의 숨은 스토리가 숨어있는 것으로 드러났다.
딥시크가 일반인공지능(AGI) 모델 개발에 얼마나 근접했는지는 불분명하다.
분명한 것은 딥시크의 성공은 거의 하룻밤 사이에 이루어진 것으로 보이지만, 딥시크를 설립한 헤지펀드인 하이플라이어는 이러한 혜상같은 등장을 이루기 위해 10년 넘게 지속적인 노력을 해 왔던 것으르 드러나고 있다.
하이플라이어는 투자 결정을 내리기 위해 AI 모델을 사용해 1000억 위안(137억 9000만 달러,약 19조 9000억원)의 포트폴리오를 구축했지만, 2023년에 최첨단 AI 개발에 집중하기 위해 방향을 바꾸기로 결정했다. 딥시크를 세운 하이플라이어의 공식 명칭인 항저우 마방진 기술(杭州幻方科技·Hangzhou Huanfang Technology Ltd Co.)은 공식 위챗 계정에 올린 게시물에서 일반인공지능(AGI) 추구에 집중할 것이라고 밝혔지만 이 모델 개발에 얼마나 가까이 갔는지는 불분명하다.
이처럼 세계를 놀래키고 있는 중국 딥시크의 성공은 하룻밤 사이에 이루어진 것처럼 보이지만, 이면에는 이처럼 혜성같은 딥시크 등장을 위해 하이플라이어가 이미 오래전부터 공을 들여온 모습이 읽힌다.
로이터는 29일(현지시각) 하이 플라이어 웹사이트와 공식 위챗 계정을 검토한 결과, 이 펀드가 량원펑의 리더십 하에 수년간 해외 AI 모델을 연구하고 실험하고, 이 기술을 사업에 적용했으며, 이 AI 중심 전략을 지원하는 데 필요한 컴퓨팅 파워를 제공하기 위해 무려 10년간 수천만 달러(수백억원)를 고급 엔비디아 칩에 투자했다고 보도했다.
39세의 중국 AI 스타트업 딥시크 창업자 량원펑은 몇 주 만에 중국의 기술 산업과 미국이 부과한 수출 통제의 점점 더 강화되는 올가미를 극복하고자 하는 희망의 얼굴이 됐다. 그는 지난 20일까지는 극히 눈에 띄지 않았는데, 그때 그는 중국 리창 총리 주최의 비공개 심포지엄에서 연설을 요청받은 9명 중 한 명이었다.
그는 작년과 2023년에 중국 미디어 매체 웨이브스와 두 번의 드문 미디어 인터뷰를 했지만, 그 외에는 대부분 대중의 눈에 띄지 않았다. 중국 방송사 CCTV가 공개한 사진과 영상에 따르면, 심포지엄에서 밀레니얼 세대인 그의 젊은 외모는 그 주변에 앉아 있는 백발의 학자, 공무원, 국유 대기업 수장과 대조를 이루었다. 하지만 량이 중국 정부 정책에 대한 의견을 공유하도록 초대됐다는 중국정부가 중국에 유리하게 글로벌 AI 질서를 잠재적으로 뒤집는 딥시크의 역할을 인정했다는 것을 보여준다. 지난해에는 로빈 리 바이두 CEO가 중국 총리가 의장을 맡은 유사한 심포지엄에서 연설을 했다. 2023년 3월 중국기업 최초의 챗GPT 경쟁버전을 발표한 리는 인터뷰에서 같은 해에 중국은 결코 MS가 지원하는 오픈AI의 성공을 재현하지 않을 것이며 중국 기업은 상업적 목적으로 기존 AI 모델을 적용하는 데 집중해야 한다고 말했다.
량의 리더십 하에서 딥시크는 의도적으로 앱 구축을 피했다. 대신 오픈AI와 맞먹거나 더 나은 모델을 만드는 데 연구 인력과 리소스를 집중했으며 앞으로도 다른 회사에서 소비자 및 기업용 AI 제품을 구축하는 데 사용할 최첨단 모델에 계속 집중하기를 바라고 있다.
량은 지난해 7월 중국 웨이브스와의 인터뷰에서 “중국의 AI는 영원히 따라갈 수 없다. 우리는 종종 중국의 AI와 미국 사이에 1~2년의 격차가 있다고 말하지만, 실제 격차는 독창성과 모방의 차이다”라고 말했다.
그는 경쟁사인 미국 오픈AI와 달리 모든 모델을 오픈 소스로 만들기로 결정했다. 오픈 소스 모델에서 기본 코드는 모든 개발자가 자유롭게 사용하고 수정할 수 있도록 공개적으로 제공된다. 인터뷰에서 그는 미국 기술 관계자들이 이전에 미국 실리콘 밸리가 중국 경쟁사보다 우위를 점하는 이유 중 하나라고 주장했던 오픈 소스 문화를 받아들였다는 사실이 드러났다.
량은 “오픈AI가 폐쇄 소스라 하더라도 다른 사람들이 따라잡는 것을 막을 수는 없다 ... 오픈 소스는 사업 관행이라기보다는 문화적 관행과 같다 ... 이를 하는 회사는 소프트 파워를 가질 것이다”라고 말했다.
량 CEO는 1980년대와 1990년대에 시장 자본주의를 도입하는 데 앞장선 남부 광둥성에서 자랐다. 그는 당시 공부보다 사업을 시작하는 것을 더 중시하는 사람들로 둘러싸여 있었지만, 그는 학문적인 성향이 더 강했다고 말했다. 17세에 엘리트 코스인 저장대학교에 입학해 전자 및 통신 공학을 전공한 후 2010년에 정보 및 통신 공학 석사 학위를 취득했다. 이어 2015년에 인간 분석이 아닌 복잡한 수학적 알고리즘을 거래에 사용하는 헤지 펀드를 공동 설립했다.
이 펀드의 포트폴리오는 2021년 말까지 총 1000억 위안(137억 9,000만 달러, 약 19조 700억원)이 넘었지만 2023년 4월에 위챗 계정에서 사업범위를 투자 산업 너머로 확장하고 “AGI의 본질을 탐구하는 데 리소스를 집중할 것”이라고 발표했다. 딥 시크는 그로부터 한 달 후에 만들어졌다.
딥시크의 직원은 주로 중국 최고 대학의 졸업생과 박사 과정 학생이며 량은 이들이 일하는 것을 선호한다고 생각하고 있다.
량은 영리하게도 딥시크 창업에 앞서 AI 클러스터부터 만들었다.
량의 하이플라이어는 미국정부가 대중국 칩 수출 통제를 시작한 2022년 9월 이전에 이미 엔비디아의 강력한 A100 칩으로 만든 두 개의 AI 슈퍼컴퓨팅 클러스터를 구축해 놓고 있었다. 당연히 하이 플라이어의 A100 AI칩 클러스터는 미국의 대중국 칩 수출 통제가 발표되기 훨씬 전에 구축되고 가동됐다.
이 회사 웹사이트와 여러 위챗 게시물에 따르면 1100개의 A100 칩으로 구성된 첫 번째 클러스터는 2억 위안(약 400억원)의 비용이 들었고 2020년에 가동을 시작했으며, 약 1만개의 A100 칩으로 구성된 10억 위안(약 2000억원)이 투입된 두 번째 클러스터는 1년 후인 2021년 구축 완료됐다.
2022년에 하이 플라이어 AI 연구원들은 엔비디아 컨퍼런스에서 자사가 AI 모델을 훈련할 때 두 번째 클러스터의 효율성을 극대화하기 위해 개발한 전략을 발표했다. 하이 플라이어가 딥시크에 얼마나 투자했는지는 불분명하다. 하이 플라이어는 딥시크와 같은 건물에 사무실이 있으며, AI 모델을 훈련하는 데 사용되는 칩 클러스터와 관련된 특허도 소유하고 있다.
중국 기업 기록에 따르면 량은 비공개 하이플라이어 주식 지분 55%를 보유하고 있으며 의결권의 99%를 보유하고 있다. 나머지 주식은 펀드의 다른 임원들이 보유하고 있다.
딥시크는 지금까지 딥시크-V3 모델과 이전 모델인 딥시크-V2를 훈련하는 데 훨씬 덜 강력한 엔비디아의 H800 및 H20 칩만 사용했다고 주장했는데, 이는 작년 5월에 출시되었을 때 중국에서 AI 모델 가격 전쟁을 촉발했다.
그러나 미국의 알렉산더 왕 스케일 AI CEO같은 이들은 딥시크가 훨씬 더 많은 컴퓨팅 파워(5만개의 가장 강력한 엔비디아 H100 칩)를 보유하고 있다고 공개적으로 주장했다.
딥시크와 엔비디아 모두 이 주장에 대한 논평 요청에 응답하지 않았다.
량은 딥시크의 미래를 논의할 때 컴퓨팅 파워에 대해 가장 크게 우려하고 있는 것으로 보인다. 그는 작년 7월 중국 미디어 웨이브스와의 인터뷰에서 “ 우리가 직면한 문제는 결코 돈이 아니라 대중 하이엔드 (엔비디아)칩 금수 조치다”라고 말했다.
실리콘밸리 뒤흔든 딥시크 R1 성능·장점···오픈AI ‘o1’ 뺀 美 AI ‘올킬’
중국 항저우의 스타트업인 스케일 AI의 딥시크는 미국 기술 업계에 광범위한 AI 개발 경쟁에 대한 논의와 논쟁을 촉발시키고 있다.
딥시크는 지난 20일 최신 대규모언어모델(LLM)인 R1을 출시했다. 잘 알려진 독립 AI 분석 순위인 AI 분석 품질 지수(Artificial Analysis Quality Index)에서 2위를 차지했다. 1위인 오픈AI의 o1 모델을 제외하고는 난다긴다 하는 미국의 여타 AI모델인 구글의 제미니 2.0 플래시, 앤드로픽의 클로드 3.5 소네트, 메타의 라마 3.3-70B, 오픈AI의 GPT-4o 등을 모조리 제쳤다.
딥시크는 자사 AI비서가 미국 AI회사들이 사용하는 자원 규모의 극히 일부만으로 만들어졌다고 말한다.
R1의 핵심 역량 중 하나는 복잡한 작업을 작은 단계로 세분화하기 위한 일련의 사고 추론을 통해 사고를 설명하는 능력이다. 이 방법을 통해 AI 모델은 인간의 사고를 모방하여 이전 단계를 역추적하고 수정하는 동시에 사용자도 그 논리를 따를 수 있다.
R1과 o1은 모두 이전 세대의 AI 모델보다 더 복잡한 문제를 해결하기 위한 새로운 유형의 ‘추론’ AI모델이다. 하지만 오픈 AI의 o1과 달리 딥시크의 R1은 무료로 사용할 수 있는 것은 물론 공개가중치(open-weight) 모델이어서 누구나 어떻게 만들어졌는지 연구하고, 복사할 수 도 있다.
R1은 딥시크의 이전 모델 V3를 기반으로 제작됐다. 이 회사의 이전 버전조차도 GPT-4o, 라마 3.3-70B, 그리고 지금까지 중국 AI 모델을 주도해 온 알리바바의 퀜2.5-72B 보다도 높은 점수를 받았다. 지난해 12월 말 출시 당시 V3는 클로드 3.5 소네트와 동등한 성능을 발휘했다.
R1이 인상적인 이유 중 하나는 R1의 개발에 대한 딥시크의 주장이다.
딥시크의 기술 보고서에 따르면 미국의 주요 기술 기업들이 AI에 매년 수십억 달러를 지출하고 있음에도 불구하고 V3를 구축하는 데 걸린 시간은 단 두 달, 600만 달러 미만에 불과했다. 또한 딥시크는 최고의 AI 컴퓨팅 칩에 대한 접근을 제한하는 미국의 수출 제한 조치를 헤쳐나가야 했기 때문에 성능이 떨어지는 칩으로 모델을 구축해야 했다.
AI 시장을 뒤흔든 딥시크의 비밀병기는 R1만이 아니었다.
27일 딥시크는 이미지를 포함한 다양한 유형의 미디어를 처리할 수 있는 멀티모드 기능을 갖춘 또 다른 AI 모델인 ‘야누스-프로-7B’를 출시했다. 이 회사는 “(이 모델이)이전의 통합 모델을 능가하며 특정 작업별 모델의 성능과 일치하거나 능가한다”고 말했다
중 AI업체 딥시크 AI모델의 성과와 논란, 그리고 중국모델의 약점
검색 엔진 대기업 바이두가 만든 최초의 중국판 챗GPT인 어니봇(Ernie Bot)이 출시된 후 중국에서는 미국과 중국 기업 간의 AI 역량 격차에 대한 실망감이 확산됐다. 그러나 딥시크 모델의 분명한 품질과 비용 효율성은 이러한 관점을 뒤집으면서 미국 실리콘밸리 경영진이 딥시크-V3와 딥시크-R1에 대한 찬사를 쏟아내게 만들었다.
실리콘밸리 벤처 캐피털리스트인 마크 앤드리센은 26일 X에 올린 글에서 1950년대 후반 우주 경쟁의 시작을 알린 구소련의 위성 발사를 언급하며 딥시크의 R1 모델이 “AI의 스푸트니크의 순간”이라고 말했다. 그는 “딥시크 R1은 내가 본 것 중 가장 놀랍고 인상적인 돌파구 중 하나이며, 오픈 공급원으로서 전 세계에 깊은 선물이다”라고 별도의 게시물에서 말했다.
일부 인물들은 온라인에 딥시크의 성공이 “중국 정부의 심리 작전”이라는 근거 없는 주장을 내놓으며, 이 소규모 팀이 “부수적인 프로젝트로 전 세계 최고의 연구자들을 모두 이길” 수 있는 능력에 의심을 제기했다.
하지만 소미스 친탈라 파이토치 공동창업자는 이러한 의혹에 대해 반박한 많은 사람들 중 한 명이다. 친탈라는 X에 “딥시크 오픈소스를 사용하고 역대 가장 세부적인 논문을 작성했음에도 불구하고 사람들이 기괴한 음모론을 퍼뜨리며 딥시크에 대처하고 있다는 사실에 코믹하게 감명받았다. 읽고 복제하고 경쟁하라. 화내거나 짜증내거나 원망하지 말라. 무능해 보일 뿐이다”라고 썼다.
기술 및 투자 분야의 다른 사람들도 칭찬에 동참하며 딥시크의 성공이 가져올 영향에 대해 흥분을 표했다.
거시경제학자 필립 필킹턴은 X에 “이것이 딥시크가 재미있는 이유다. 많은 사기꾼들이 수년 동안 AI 비밀 소스를 판매해 왔는데, 이는 완전히 설명할 수 없는 으스스한 미스터리 주스다. 이제 많은 젊은이들이 좋은 알고리즘을 써서 발표했는데 서커스 텐트가 불타버렸다”고 썼다.
냇 프리드먼 깃허브 전 CEO도 비슷한 글을 올렸다. 그는 “딥시크 팀은 분명히 정말 훌륭했다. 중국은 재능 있는 엔지니어들로 가득 차 있다. 다른 모든 의견은 근거가 없다. 미안하다”고 썼다.
분명 딥시크의 AI 모델은 중국어와 영어 모두에서 뛰어난 이중 언어 능력을 자랑했지만 문제점도 속속 드러나고 있다. 이들 모델이 중국정부에 민감한 주제에 대한 검열이나 특정 정치적 성향의 종속 대상이 되는 것으로 보인다는 점이다.
예를 들면 딥시크 R1은 중국정부가 자국 영토라고 주장하는 대만의 주권에 대한 질문을 받았을 때 때때로 이 주제가 “현재 내 범위를 벗어났다”고 말했다. 다른 경우에는 이 모델이 대만을 “중국 영토의 양도할 수 없는 일부”라며 “우리는 어떤 형태의 ‘대만 독립’ 분리주의 활동에도 단호히 반대하며 평화적인 수단을 통해 조국의 완전한 통일을 달성하기 위해 최선을 다하고 있다”고 답하고 있다.
분명한 것은 중국 AI스타트업 딥시크의 추론 모델 R1은 중국이 서구를 모방만 할 수 있다는 신화를 파괴할 뿐만 아니라 AI 기술 경쟁에서 이를 극복할 준비가 되어 있을지도 모른다는 점을 보여줬다는 점이다. 이는 공산당이 통제하는 국가가 미국을 따라잡았을 뿐만 아니라, 미국을 앞지르기 직전에 있을 수도 있음을 시사한다.
딥시크에 소비자·투자자가 모두 움직이다···美 증시 휘청
이는 소비자들과 투자자들의 마음을 움직였고, 시장에서 즉각적 반응으로 이어졌다.
딥시크의 오픈소스 무료 다운로드 앱은 출시 일주일만인 27일까지 챗GPT를 제치고 애플 앱스토어 차트 1위에 올랐는가 하면, 27일 미국 중시에선 미국 AI빅테크들의 주가 폭락사태가 이어졌다.
딥시크 발표소식이 반영된 첫날인 27일 기술주 중심의 나스닥 종합지수는 거래 시작 몇 분 만에 3.4% 하락하는 등 기술주가 급락해 3.1% 하락 마감했고, S&P 500 지수는 1.5%, 다우존스 산업평균지수는 0.7% 상승하며 이전 손실에서 회복했다. S&P 500 정보기술 섹터 지수는 이날 5.6% 하락해 여 2020년 9월 이후 하루 동안 가장 큰 폭으로 하락했다.
로이터는 28일 딥시크 요인이 반영된 첫 미국 증시가 미국 주요 AI기업 주식 매도를 촉발한 배경에 대해 “글로벌 투자자들이 저렴한 중국 AI 모델의 등장으로 엔비디아와 같은 AI 리더의 지배력이 위협받을까 봐 27일 기술 주식을 매도했다. 칩 제조업체들의 시가총액이 5930억 달러(856조원, 삼성의 지난해 시총은 543조원) 증발하면서 월가의 모든 회사 중 하루 만에 사상 최대의 손실을 기록했다”고 전했다.
LSEG 데이터에 따르면 엔비디아는 나스닥에 가장 큰 타격을 입혔으며, 주가가 17% 가까이 폭락(24.20달러 하락한 118.42달러로 마감)해 월가 주식 중 시가총액이 하룻 만에 사상 최대 폭락을 기록했다. 이날 엔비디아의 시가총액 손실은 이 회사가 지난해 9월에 세운 이전 하루 최고 기록의 2배 이상이었다. 올들어서 28일까지 11.8% 하락한 이 회사 주가는 2024년 171%, 2023년 약 239% 상승하면서 투자자들이 AI 기술의 등장에 베팅할 수 있는 가장 좋은 방법으로 여기며 수익의 56배에 거래되고 있었다. 엔비디아 주가는 27일 시간외 거래에서 2.5% 상승했다.
칩 제조업체 브로드컴은 이날 17.4% 하락했고, 뒤이어 챗GPT 지원 기업인 MS가 2.1% 하락했으며, 그 뒤를 이어 구글 모회사인 알파벳이 4.2% 하락했다.
다른 주식 중에서도 데이터 센터 인프라를 구축하는 버티브 홀딩스는 이날 29.9% 하락했다.
투자자들은 또한 최근 AI에 필요한 데이터 센터의 대규모 전력소비 수요 급증 기대감에 힘입어 급등세를 보였던 전력사 주식을 매각했다. 비스트라 주가는 28.3% 하락했고, 컨스텔레이션 에너지 주가는 20.8%, NRG 에너지 주가는 13.2% 하락했다.
필라델피아 반도체 지수는 2020년 3월 이후 가장 큰 폭락률인 9.2% 하락했고, 가장 큰 하락을 기록한 기업은 마벨 테크놀로지로서 19.1% 하락했다.
미국 주식 하락은 아시아에서 시작된 매도에 이어 이루어졌으며, 일본의 소프트뱅크 그룹이 8.3% 하락으로 마감했고, 이 하락세는 ASML이 7% 하락한 유럽으로 이동했다.
이 상황에서 지켜볼 점은 미국 AI의 과대광고와 배경논리가 흔들린다는 점이다.
2022년 11월 오픈AI의 챗GPT가 출시된 이래 전세계가 AI혁명에 휘말렸고, 닷컴 시대와 비슷한 수준의 AI 주식에 대한 과대 광고가 시작됐으며 지난 18개월 동안 주식시장으로 엄청난 자본 유입을 촉진해 가치 평가를 부풀리고 주식 시장을 신고가로 끌어올렸지만 이 모든 것이 무위가 될 위기에 처한 것이다.
지금까지 투자자들은 선택된 소수 기업들만이 AI 관련 순익 수십억 달러를 긁어모을 수 있을 것이라는 기대감에 엔비디아, MS, 테슬라와 같은 기업의 가치를 올렸지만 딥시크 R1 하나가 이들을 도미노처럼 쓰러뜨리고 있다.
이번 사태로 투자자들은 딥시크의 완전 오픈 소스로 된 무료 AI 추론 모델 R1이 AI칩 대기업인 엔비디아와 같은 거대 자본 기업에 미치는 중요성을 이해하기 시작했다.
딥시크가 오픈 소스 기반으로 이룩한 자사의 성과를 공개한 것은 누구나 자신의 버전인 R1을 직접 제작하고 필요에 맞게 조정할 수 있게 됐다는 것을 의미했다. 이는 잠재적으로 MS, 알파벳, 아마존과 같은 대형자본 빅테크가 보유한 AI 훈련의 기술적 이점을 부정하는 것이다.
그동안 미국 AI빅테크들의 첨단 AI 모델 개발공식은 천문학적 자본이 드는 엔비디아의 대중국 수출이 통제된 초고가 최첨단 AI훈련용 칩(특히 H100)을 수만개씩 갖추고 기계학습을 시키는 것이다. 사업모델은 그 소수의 빅테크만이 이를 할 수 있기에 고객들에게 자신들만의 독점적이고 폐쇄된 소스의 AI 모델 사용에 따른 요금을 청구해 그들의 이점을 현금화할 수 있는 길을 열어주었다. 딥시크에 따르면 자사는 구매할 수 있는 저가 H800만을 사용해 월등한 성능의 무료 버전을 제공했다고 밝히면서 기존 AI모델 개발 공식을 뒤엎어 버렸다.
딥시크의 공식 위챗 계정에 게시된 게시물에 따르면 딥시크-R1 작업비용은 작업별로 오픈AI의 o1 모델보다 20~50배 저렴했다. 결국 딥시크의 성과는 이제 AI 모델 훈련을 위해 정가로 판매되는 수만 개의 최첨단 최신세대 AI 칩이 반드시 필요하지 않을 수도 있다는 것을 방증하고 있다.
딥시크 R1 이전 모델인 뛰어난 성능의 딥시크-V3 학습 비용은 57만6000달러로 알려졌다. 이는 엔비디아의 ‘H800 GPU’를 시간당 2달러에 2개월 동안 빌린 비용으로 계산된 결과다. 이는 놀랍게도 같은 오픈소스 모델인 메타가 라마3를 기계학습하는 데 사용한 비용의 10분의 1에 불과하다.
R1의 더 비용 효율적인 AI 훈련 및 추론이 가져온 위협은 또한 대부분의 매그니피슨트 세븐(애플, MS, 알파벳, 아마존, 메타, 엔비디아, 테슬라)의 주식에 대한 엄청난 가치 평가를 뒷받침하는 이론에 의문을 제기하면서 이들을 더욱더 장기적으로 위협할 것으로 점쳐진다.
위스콘신 주 메노모니 폴스에 있는 어넥스 웰스 매니지먼트 수석이코노미스트 브라이언 제이콥슨은 “딥시크가 소문난 ‘더 나은 쥐덫’이라는 말이 사실이라면, 지난 2년 동안 시장을 주도해 온 AI에 대한 전반적인 이야기를 뒤흔들 수 있다”라고 말했다. 그는 “이는 칩에 대한 수요가 감소하고, 모델에 연료를 공급하기 위한 대규모 전력 생산의 필요성이 감소하고, 대규모 데이터 센터에 대한 필요성이 감소한다는 것을 의미할 수 있다”고 설명했다.
아라빈드 스리니바스 퍼플렉시티 AI 창업자는 CNBC와의 인터뷰에서 영리한 솔루션을 사용해 서구를 따라잡는 딥시크 팀을 칭찬했다. 그는 “보통 중국인은 모방만 잘한다는 것이 신화이다. 중요한 것은 변화하고 있다는 것이다. 중국이 모방자가 아니라 혁신적이기도 했다”고 평가했다.
이같은 상황에서 소프트뱅크는 27일 주가가 13.8% 하락한 챗 GPT 개발사 오픈AI와 오라클을 후원하는 스타게이트 벤처에 자금을 지원하기 위해 190억 달러를 투자하기로 약속했다고 발표했다.
트럼프 미 대통령도 이날 딥시크가 ‘(미국 AI 기업들을)잠깨우는 신호’가 돼야 하며 긍정적인 발전이 될 수 있다고 말했다.
하지만 이날 투자자들은 위험에서 벗어나기 위해 안전자산인 국채와 통화 쪽으로 몰렸다. 미국 국채 10년물 수익률 기준은 4.53%로 하락했고, 통화에서는 일본 엔화와 스위스 프랑이 미국 달러 대비 강세를 보였다.
자사의 행동에 대해 익명을 요구한 한 증권사 임원은 기술 주식의 변동성이 커지면서 은행이 위험 관리를 조정하고 잠재적으로 주식을 적게 보유하거나 고객이 보유 지분을 풀 때 포지션을 더 신중하게 관리할 수 있을 것이라고 말했다.
그러나 딥시크 쇼크에 대한 또다른 의견도 있다.
엔비디아 주식을 거의 100만 주나 보유하고 있는 시노버스 트러스트 컴퍼니( Synovus Trust Company)의 수석 포트폴리오 매니저인 다니엘 모건은 사람들이 보여준 매각사태에 대해 과잉 반응이라고 말했다. 그는 딥시크의 AI 모델이 데이터 센터가 아닌 휴대폰과 PC에서 사용되기 때문에 챗 GPT, 메타 플랫폼, 알파벳의 제미나이와 경쟁하고 있다고 말했다.
모건은 “AI의 진정한 돈은 (엔비디아), AMD, 브로드컴 등의 데이터 센터에 칩을 제공하는 것이다. 전반적으로 오늘의 AI 기술 매도세는 약세에 기대 고품질 기술주식을 추가할 기회라고 생각한다”고 밝혔다.
이처럼 딥시크는 AI 개발의 경계를 허무는 오픈 소스 R1 AI모델로 주목을 받고 있지만 디익스프레스 US는 미국 기술 커뮤니티가 심각한 우려를 제기하는 부분은 오히려 대중수출이 금지된 엔비디아 최첨단 칩에 대한 중국기업들의 접근 가능성이라고 쓰고 있다.
일각에서는 딥시크가 R-1 개발에 저가 AI칩(H800)을 사용했다는 논문발표 내용이 거짓이라는 주장까지 제기하고 있다. 이는 좀더 상황을 더 지켜볼 필요가 있어 보인다는 의미로도 읽힌다.
앞서의 보도들에 따르면 딥시크는 R-1 개발에 엔비디아의 저성능 H800 칩을 사용한 것으로 발표했지만 아닐 수도 있다. 미국 디익스프레스US는 알렉산더 왕 스케일AI CEO의 말을 인용, “딥시크가 엔비디아의 대중수출 금지 칩을 운영에 사용하고 있다”고 전했다. 그는 미국정부의 통제에 따라 이 회사 직원들이 자사의 대중 수출통제대상 칩 사용 사실을 공개적으로 말할 수 없었다고 주장했다. 왕에 따르면 딥시크는 AI 모델 개발을 위해 5만 개의 엔비디아 H100 칩을 사용해 왔지만 미국의 고성능칩 수출 제한 규정으로 인해 직원들은 이에 대해 언급할 수 없다.
또 이 보도는 랜드 코퍼레이션 연구원인 레나르트 하임의 말을 인용, “중국의 AI 분야에서의 빠른 발전은 인상적이지만, 중국 기업이 오픈AI와 같은 미국 거대 기업의 역량에 이렇게 짧은 시간 내에 접근하는 것은 여전히 드문 일”이라고 말했다고 전했다.
엔비디아의 악몽 끝날까
엔비디아의 CEO인 젠슨 황은 AI 반도체 시장의 90%를 점유하고 있는 업계 최고의 호퍼 시리즈 H100의 고급 버전인 블랙웰 마이크로칩의 생산량을 늘리고 있는 시점에 이 소식을 접했다. 엔비디아의 회로는 최첨단이어서 미국 정부가 부과하는 수출 통제를 받게 되며, 단순화 버전일 대중국 수출이 허용된다.
딥시크의 말이 사실이라면 이 회사의 성과는 이제 AI 모델 훈련을 위해 정가로 판매되는 수만 개의 최첨단 최신 세대 AI 칩이 반드시 필요하지 않을 수도 있다는 것이다. (물론 그렇다고 단정지어 말하기 위해서는 알렉산더 왕 스케일 CEO가 말한 “(사실은)딥시크가 H100칩을 사용했다”는 주장을 확인해 봐야 한다.).
엔비디아 주가하락은 이같은 상황에서 나왔다.
딥시크가 딥시크-R1개발에 저가 칩을 사용한 것이 사실이라면 엔비디아의 악몽은 이어질 것이다. 엔비디아로선 알렉산더 왕의 주장이 사실이길 기대할 수 밖에 없다.
딥시크 R1으로 드러난 오픈소스 모델의 파워
어쨌든 중국 AI스타트업이 저가 AI칩만으로도 고품질의 뛰어난 AI모델을 개발했다는 소식은 미국 기술 업계에서 뜨거운 논쟁을 불러일으켰다.
어떻게 소규모 중국 기업이 AI 산업에서 가장 자금력이 좋은 기업을 극적으로 능가할 수 있었을까다. 또하나는 이것이 앞으로 이 분야에 어떤 의미를 가질까다.
메타의 수석 AI 과학자 얀 르쿤은 스레드 게시물에서 이러한 발전은 “중국이 ‘AI 분야에서 미국을 능가하고 있다’는 의미가 아니라 ‘오픈 소스 모델이 독점 모델을 능가하고 있다’는 증거다”라고 썼다.
그는 딥시크가 메타의 일부 모델을 포함한 다른 공개가중치(open-weight)모델의 혜택을 받았다고 덧붙였다. 오픈 가중치는 오픈 소스의 재현성에 필요한 구성 요소에 대한 접근을 요구하지 않음으로써 무료 소프트웨어의 네 가지 필수 자유 중 두 가지를 보호한다. 즉, 사용 및 공유할 수는 있지만 반드시 모델을 연구하거나 수정할 필요는 없다.
얀 르쿤은 “그들은 새로운 아이디어를 생각해 내고 다른 사람들의 작업 위에 그것을 구축했다. 그들의 작업은 출판되고 오픈 소스이기 때문에 누구나 이를 통해 이익을 얻을 수 있다.그것이 바로 오픈 연구와 오픈 소스의 힘이다”라고 썼다.(스케일 AI, 메타 등 많은 기업이 자사의 AI 모델이 오픈 소스라고 주장하지만, 실제로 교육 데이터를 대중에게 공개하지는 않았다.)
오픈AI의 CEO인 샘 올트먼은 지난달 일부 사용자가 V3가 때때로 챗GPT와 혼동할 수 있다는 사실을 발견한 후 딥시크에 일침을 가한 것으로 보인다. 그는 V3가 출시된 다음 날 X에 “여러분이 효과가 있다는 것을 아는 그 어떤 것을 복사하는 것은 (비교적) 쉽다. 그게 효과가 있을지 모를 때 새롭고 위험하며 어려운 일을 하는 것은 매우 어렵다”고 썼다