'놀라운 가성비' 中딥시크 4억vs.오픈AI 약1천389억

송태희 기자 2025. 9. 19. 10:09

글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

닫기

딥시크, 훈련비용과 엔비디아 칩 일부 사용 공개

저비용 고사양으로 주목 받고 있는 중국의 인공지능(AI) 스타트업 딥시크가 자사의 생성형 AI 모델 훈련비용이 4억원에 불과하다고 주장했습니다.

19일 로이터통신에 따르면 딥시크가 자사 AI 모델 'R1' 훈련 비용의 구체적인 추정치를 처음으로 공개한 내용을 담은 동료심사 논문이 지난 17일 국제 학술지 네이처에 실렸습니다.

딥시크 창업자 량원펑이 공동 발표한 논문을 통해 딥시크 측은 추론에 초점을 맞춘 R1 모델의 훈련 비용에 29만4천달러(약 4억821만원)가 들었다고 주장했습니다.

또 모델 훈련에는 엔비디아의 H800 칩 512개를 사용했다고 밝혔습니다.

올해 1월 공개됐던 딥시크의 다른 논문에서는 이 내용들이 포함되지 않았었습니다.

챗GPT를 만든 미국 AI기업인 오픈AI의 샘 올트먼 최고경영자(CEO)는 2023년 기초적인 모델 훈련에 1억달러(약 1천389억원)보다도 더 비용이 들었다고 말한 적 있다고 로이터는 짚었습니다.

딥시크 측은 이번에 발표한 논문에 딸린 추가 정보에서 엔비디아 A100을 보유하고 있으며 개발 준비단계에서 그것들을 사용했다고 처음으로 인정했습니다.

이는 수출이 금지되기 전 비축해둔 것으로, 매사추세츠공대(MIT)의 정보기술매체 테크놀로지 리뷰 등 이전 보도들에 따르면 해당 비축량은 1만∼5만개로 추산됩니다.

딥시크 측은 초기 단계 이후 R1은 엔비디아 H800 512개로 구성된 클러스터에서 80시간 동안 학습됐다고 강조했습니다. H800은 중국이 구입 가능한 칩입니다.

R1은 순수 강화 학습(reinforcement learning) 방식으로 추론 능력을 향상시킨 것으로 나타났습니다.

인간의 선택에 기반한 예시를 AI가 수동적으로 학습하는 방식이 아니라 AI가 정확한 답변을 하면 보상 받고 틀린 답변을 하면 페널티를 받는 구조 속에서 스스로 진화하도록 유도했습니다.

당신의 제보가 뉴스로 만들어집니다.SBS Biz는 여러분의 제보를 기다리고 있습니다.홈페이지 = https://url.kr/9pghjn

SBS Biz에서 직접 확인하세요. 해당 언론사로 이동합니다.

경제