훨신 싸고 훨씬 똑똑한 중국산 AI가 세상을 흔들었다.

조회 8,0272025. 1. 29.

딥시크 충격과 스푸트니크 모먼트, ‘규모가 최고’라는 빅테크의 신화가 깨졌다.

[슬로우리포트] 골드러시에 곡괭이 팔던 시대는 끝났다… 챗GPT와 맞먹는 성능에 가격은 30분의 1, 핵심은 최적화.

한동안 오픈AI가 업계 지존이었다. 그런데 게임 체인저가 될 수도 있는 ‘뉴 페이스’가 등장했다. 중국의 한 인공지능 스타트업이 만든 딥시크(DeepSeek)가 세상을 발칵 뒤집어 놓았다.

그래픽 칩을 만드는 엔비디아 주가가 17% 폭락한 걸 비롯해 마이크로소프트와 알파벳(구글) 등도 충격을 피할 수 없었다. “인공지능의 스푸트니크 순간(AI’s Sputnik moment)”이라는 평가도 나온다.

이게 왜 중요한가.

1957년 10월 소련이 스푸트니크 1호를 쏘아 올렸을 때 미국은 엄청난 충격에 빠졌다. 기술력에서 훨씬 뒤쳐져 있다는 평가를 받던 소련이 단숨에 미국을 따라잡은 사건이었다.

딥시크는 일단 오픈AI와 견줄 정도의 놀라운 성능을 보여주고 있다. AI 기업들이 엔비디아 칩을 못 구해서 난린데 딥시크는 저가형 칩으로 해결했다.

5억 달러를 주고 만드는 AI를 500만 달러에 만들 수 있다면? 완전히 게임의 법칙이 달라진다. AI는 규모의 경쟁이라는 그동안의 믿음이 깨지고 있다.

트럼프 정부가 오픈AI와 함께 AI 인프라 구축에 5000억 달러를 쏟아 붓겠다고 발표한 뒤라 충격이 더 컸다. 미국은 그동안 엔비디아 칩 수출을 제한하면서 중국을 견제했지만 경쟁의 양상이 달라졌다.

최신 AI 기술은 상당 부분 오픈소스로 공개돼 있다. 무임승차라고 할 수는 없지만 딥시크 같은 후발 주자들이 시행착오를 줄일 수 있는 환경이다.

참고로 스푸트니크 모멘트가 불러온 미국의 열등감은 1958년 NASA(미국 항공우주국)를 만들고 1969년 7월 달 착륙에 성공한 뒤에야 극복됐다.

핵심 키워드 여덟 가지.

엔비디아의 비싼 그래픽 카드를 꼭 써야 하는 건 아니다. 훨씬 더 적은 비용으로 가능할 수도 있다.

세상의 모든 지식을 다 때려넣어야 하는 것도 아니다. 대형 언어모델말고 다른 길도 있다.

아직은 딥시크가 챗-GPT보다 더 뛰어나다고 볼 수는 없다. 이제 겨우 견줄 만한 정도라고 할 수 있지만 앞으로는 어떨지 모른다.

오픈소스가 폐쇄형 모델보다 가능성이 많다.

빅테크의 독점적 성장 모델에 근본적인 의문이 제기되고 있다. 돈 풀어서 되는 문제가 아니다.

값싼 AI의 시대가 온다. 규모가 아니라 최적화가 핵심이다.

‘적당히 듣기 좋은 말(sounding good)’을 늘어놓는 걸로는 부족하고 ‘더 잘 생각하는(thinking better)’ 추론 능력이 경쟁력이다.

미국과 중국의 AI=안보 경쟁이 더 격화될 가능성이 있다.

딥시크는 어떻게 다른가.

딥시크R1은 이미 오픈AI의 GPT-o1을 뛰어넘었다는 평가를 받고 있다.

딥시크를 만든 하이플라이어(High-Flyer)는 전혀 알려지지 않은 기업이었다. CEO는 1985년생 투자 관리 회사 출신의 랑웬펑(Liang Wenfeng)이다.

메타의 라마3(Llama 3)와 비교하면 왜 딥시크를 게임 체인저라고 하는지 쉽게 이해할 수 있다.

라마3는 H100칩을 1만6000개 이상 썼는데 딥시크R1은 H100보다 훨씬 성능이 떨어지는 H800을 2048개 쓰고도 비슷한 성능을 낸다. 훈련 시간도 라마3는 3084만 GPU시간인데 딥시크R1은 278만 GPU시간으로 10분의 1 수준이다. 비용도 라마3는 5억 달러 이상인데 딥시크R1은 557만 달러에 그쳤다.

미국 정부는 H100은 중국 수출을 금지했지만 H800은 허용했다. H800 정도면 위협이 안 될 거라고 봤기 때문이다. 그런데 그 H800으로 오픈AI에 맞먹는 성능을 냈다면 굴욕을 넘어 충격과 공포가 아닐 수 없다.

딥시크가 구체적으로 어떤 종류의 칩을 얼마나 보유하고 있는지 공개하지 않고 있기 때문에 온갖 추측이 오가지만 대부분의 기술이 오픈소스로 공개돼 있기 때문에 검증은 어렵지 않다.

딥시크의 스펙.

딥시크의 훈련 비용은 560만 달러다. 실리콘밸리에서는 전문가 한 사람 연봉 정도밖에 안 되는 금액이다.

참고로 다리오 아모데이(앤트로픽 CEO)에 따르면 클로드의 훈련 비용은 1억~10억 달러에 이른다. 오픈AI의 GPT-4 훈련 비용도 1억 달러가 넘는 것으로 알려졌다.

대략 GPT-4와 비교하면 파라미터는 3분의 1, 훈련 비용은 20분의 1, 훈련 시간도 절반 이하다.

기존의 AI 모델은 문장을 조각(Token)으로 나눠 읽는데 딥시크R1은 문장 전체를 읽어서 처리하기 때문에 생성 속도가 두 배 더 빠르고 답변 정확도도 90%에 이른다.

딥시크의 혁신.

딥시크의 핵심 기술은 매우 구체적으로 공개돼 있다.

다른 대형 언어모델(LLM) 기반 AI는 ‘지도학습(Supervised Fine-Tuning, SFT)’과 피드백 기반 강화학습(Reinforcement learning by Human Feedback)’ 기법으로 훈련을 시킨다. 데이터를 주고 정답을 찾는 능력을 키운다. 100장의 고양이 사진과 100장의 원숭이 사진을 보여주면서 차이를 구별하게 만드는 방식이다.

딥시크는 인간의 개입 없이 ‘강화학습’으로 성능을 끌어올렸다. 굳이 비교하자면 어린아이가 수없이 넘어지면서 자전거를 배우는 것처럼 행동(액션)을 시도하고 그에 따른 결과(보상)를 얻는 과정을 반복하며 최적의 패턴을 찾는 방식이다.

1단계는 추론 기반 강화학습이다. 논리 추론과 문제 해결 능력을 키운 뒤 데이터에서 패턴을 발견하고 추론의 법칙을 끌어낸다.

2단계는 시나리오 기반 강화학습이다. 예측 불가능한 다양한 상황에서 어떤 행동을 해야 최적의 결과를 얻을 수 있을지 결정하는 전략(policy)을 설계한다.

증류(distillation) 방식을 활용했다. 대형 모델이 생성한 데이터를 소형 모델에 학습시킬 수 있다. 비용과 자원을 크게 줄일 수 있다.

딥시크의 ‘아하 모멘트’.

“잠깐만요. 이 지점을 아하 모멘트라고 부를 수 있겠네요.”

딥시크가 공개한 기술 논문에서 가장 충격적인 대목은 딥시크R1이 ‘아하 모멘트’를 거치면서 스스로 진화했다는 사실이다.

반복적인 자기 검증(self-verification)과 반성(reflection) 반복적인 성찰과 자기 교정 같은 인간의 문제 해결 프로세스를 흉내냈다. 추론 모델의 새로운 가능성을 열었다는 평가를 받는다.

딥시크의 확장성.

이원재(경제평론가)는 딥시크의 차별화된 인프라를 두 가지로 꼽았다. 첫째, 미친 사람들과 둘째, 미친 듯이 놀아볼 수 있는 자원. 여기에는 세 가지 포인트가 있다.

첫째, 딥시크는 대학 졸업 2년 이하 경력자들만 채용했다. 경험이 장애물이 된다고 봤기 때문이다.

둘째, 제약이 혁신을 만들었다. 엔비디아 칩을 마음껏 살 수 있었으면 달랐을 수도 있다.

셋째, 빅테크의 폐쇄형 모델에 맞선 오픈소스 문화가 혁신의 동력이었다.

얀 르쿤(뉴욕대 교수)은 “중국이 미국을 넘어선 것도 아니라 오픈소스 모델이 폐쇄적 모델을 넘어선 것이라고 봐야 한다”고 지적했다. 한상기(테크프론티어 대표)는 “엄청난 자본을 투입하는 폐쇄 기업에 대해 오픈소스 진영이 얼마든지 경쟁할 수 있으며, 다양성과 집단 지능을 발휘하는 오픈 소스 진영의 리더십이 결코 꺾이지 않을 것이라는 증거를 보여준 사례”라고 설명했다.

의혹과 논란.

수입 가능한 H800을 썼다고 주장하고 있지만 실제로는 중국으로 수출이 금지된 H100을 비공식적인 루트로 들여와 활용했을 거라는 의혹이 있다.

실제로 인건비와 전기 요금 등을 감안하면 550만 달러보다 훨씬 많은 5억 달러에 이를 거라는 분석도 있다. 그래도 100억 달러가 넘어서는 빅테크 기업들과 비교하면 파격적인 효율이다.

오픈AI의 데이터를 훔쳐갔다는 논란도 있다. 데이빗 색스(미국 백악관 암호화폐 차관)는 “딥시크가 오픈AI 모델에서 지식을 추출했다는 상당한 증거가 있다”고 말했다. 저작권 논란에서 자유롭지 못한 오픈AI가 딥시크에 저작권을 주장하는 것도 아이러니한 일이다.

천안문 등 민감한 주제에 제대로 답변하지 못한다. 중국 정부의 검열을 의식한 것 아니냐는 비판이 나온다.

딥시크도 성능을 끌어올리려면 지금보다 훨씬 더 많은 칩이 필요할 수 있다. 로이터에 따르면 하이플라이어는 H100 칩을 5만 개 정도 보유하고 있다고 한다.

미국 정부는 군인들의 딥시크 사용을 금지했다.

딥시크에 사이버 공격이 집중되고 있다. 지난 27일에는 일시적으로 회원 가입을 중단하기도 했다.

개인정보 이슈도 있다.

중국 기업이라 개인정보 규제를 거의 받지 않는다.

IP 주소는 물론이고 장치 정보와 키보드 입력 패턴, 쿠키 값까지 긁어갈 수 있다.

중국에 있는 서버에 정보를 저장하는데 옵트아웃도 없고 언제까지 저장하고 어떻게 활용한다는 안내도 없다.

(딥시크를 쓸 것이냐 말 것이냐는 부차적인 문제다. 딥시크가 어떤 변화를 불러올 것이냐가 더 중요한 문제다.)

딥시크가 바꿔놓을 것들.

린드로 폰 베라(허깅페이스 연구 책임자)는 더버지와 인터뷰에서 “그동안 빅테크 기업들은 자신들이 가장 위대한 일을 하고 있다고 믿게 만들어서 가치를 유지했다”면서 “더 많은 돈을 끌어모으려고 전망을 부풀렸을 수도 있다”고 지적했다.

케빈 루즈(뉴욕타임스 기술 칼럼니스트)는 “딥시크의 혁신은 진짜”라며 “실리콘밸리의 두 가지 믿음이 깨졌다”고 평가했다.

첫째, 최첨단 AI 모델을 구축하려면 강력한 칩과 대규모 데이터 센터가 필요하다는 가정을 깨뜨렸다.

둘째, 빅테크가 아니면 안 된다는 믿음도 깨졌다.

중국이 뒤처져 있다는 믿음도 깨졌고 그동안의 혁신이라는 게 한 달이면 복제할 수 있는 수준이라는 사실도 확인됐다. 군비 경쟁(arm race)과도 같았던 “클수록 좋다(bigger is better)”는 믿음도 깨졌다.

딥시크가 가격 경쟁을 촉발시킬 거라는 전망도 나온다. 오픈AI는 o3 출시를 서두르고 있다.

존 빌라세너(UCLA 교수)는 “AI 수출 규제가 오히려 중국의 혁신을 촉진했다”고 지적했다.

에너지 수요 예측이 달라져야 할 거라는 전망도 나온다. 아르빈드 라비쿠바(UT오스틴 분석가)는 “30년짜리 가서 발전소를 짓기 전에 AI 컴퓨팅의 효율 문제를 다시 살펴봐야 한다”고 조언했다. 2028년이면 미국의 데이터센터가 전력 생산의 최대 12%를 차지할 거라는 전망이 있었지만 더 줄어들 수도 있다. AI의 효율성이 높아지는 것만큼 이용이 늘어나서 여전히 더 많은 컴퓨팅 자원을 소비하게 될 거라는 전망도 있다.

악시오스는 “여전히 엔비디아 칩이 필요하지만 모두가 생각했던 것만큼 많이 필요하지 않을 수도 있다”고 지적했다.

어떻게 될까.

오픈AI가 AI의 위워크가 될 수도 있다는 경고가 있었다.

챗GPT프로는 이용료가 월 200달러인데 여전히 적자를 보고 있다. 비용은 걷잡을 수 없이 느는데 기대수준은 갈수록 높아지고 요금을 올리기는커녕 낮춰야 할 상황이다.

게리 마커스(뉴욕대 교수)는 “엔비디아도 심각한 타격을 입을 수 있다”고 경고했다. 골드러시 한복판에서 곡괭이을 팔아 부자가 됐지만 곡괭이가 그렇게 많이 필요하지 않다는 주장이 나왔다.

바이든 정부의 칩스법도 역풍을 맞게 될 수 있다. 고성능 그래픽 칩은 여전히 중요하지만 칩이 많다고 해서 더 좋은 성능의 AI를 만들 수 있는 게 아니라는 이야기다. 이제 누가 더 싸게 만드느냐의 경쟁이 시작됐다.

어느 한 기업이 압도적으로 치고 나가는 시대는 끝났다. 계속해서 새로운 모델이 쏟아져 나오고 환각 현상과 신뢰성 문제도 계속된다. 대형 언어모델(LLM) 기반 AI를 포기해야 할 수도 있다.

오픈AI o3가 아직 공개되지 않은 상태라 오픈AI의 패배를 이야기하기는 이르다는 지적도 있다.

오픈소스로 풀렸기 때문에 새로운 게임 체인저가 등장할 수도 있다.

뉴욕타임스는 “미국이 오픈소스 기술을 억제하면 중국이 상당한 우위를 차지하게 될 수도 있다”고 경고했다. 미국 기업들이 무임승차할 수도 있겠지만 장기적으로 중국이 기술을 주도하게 될 거라는 이야기다.

규모가 아니라 최적화가 핵심이다. 게임의 규칙이 달라졌다.

슬로우레터를 이메일로 받아볼 수 있습니다. 날마다 아침 7시에 발송합니다.

#슬로우뉴스 #지식토스트 #지식토스트_모닝브리핑

Copyright © 슬로우뉴스.

이 콘텐츠가 마음에 드셨다면?
이런 콘텐츠는 어때요?

최근에 본 콘텐츠와 구독한
채널을 분석하여 관련있는
콘텐츠를 추천합니다.

더 많은 콘텐츠를 보려면?

채널탭에서 더 풍성하고 다양하게 추천드려요