딥시크에 시진핑·톈안먼 물으니 …"다른 얘기하자" 답 피했다

이덕주 특파원(mrdjlee@mk.co.kr), 송광섭 특파원(song.kwangsub@mk.co.kr) 2025. 1. 29. 18:30
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

딥시크 둘러싼 3대 논란
① 검색내용들 검열하나
중국 공산당·대만 독립 등
민감한 질문엔 '답변 불가'
② 개발비, 美 100분의 1 맞나
메타는 GPU 구매비용 기준
딥시크는 '1회 사용'만 계산
③ 개인정보 수집되나
키보드 입력패턴·IP 등 수집
전문가 "中 보안서버에 저장"

◆ 딥시크 쇼크 ◆

오픈AI와 마이크로소프트는 딥시크가 챗GPT를 이용해 자신들의 모델을 학습했다며 본격적인 조사에 나섰다. 사진은 오픈 AI 로고를 배경으로 스마트폰에서 딥시크 앱이 구동되는 모습. 로이터 연합뉴스

전세계를 깜짝 놀라게한 중국의 인공지능(AI) 딥시크는 낮은 학습 비용에도 불구하고 챗GPT 같은 최고 성능의 AI를 달성한 것으로 평가받는다. 하지만 낮은 비용은 딥시크가 발표한 기술 논문에 따른 것으로 이를 의심의 눈으로 보는 시각이 많다. 중국 개인정보 사용에 대한 우려와 중국 정부의 방침에 맞춘 검열에 대한 비판도 나오고 있다.

딥시크는 여러 벤치마크에서 주요 첨단 AI와 비등한 성능을 보여준다. 영어 성능을 평가하는 MMLU에서 딥시크 V3는 88.5점, 같은 오픈소스인 메타 라마는 88.6점, 오픈AI GPT-4o는 87.2점을 받았다. 코딩 점수에서도 82.6점으로 라마(77.2점)나 GPT-4o(80.5)보다도 높다.

딥시크와 챗GPT에 각각 상대 모델 대비 강점이 무엇인지 한국어로 질문해보니 딥시크는 챗GPT에 비해 최신 정보 반영, 맥락 이해, 다국어 지원, 윤리적 안전성 등에서 강점이 있으며 챗GPT의 한계를 보완해 더 발전된 AI 기술을 제공한다고 밝혔다. '효율성'과 '자원 최적화'라는 답은 영어로 질문했을 경우에만 제시했다. 반면 챗GPT는 상대적인 강점으로 '검열 제한 없음' '고급기능제공' '데이터 프라이버시'라는 일관된 답을 내놨다.

딥시크와 관련해 가장 많은 논란이 있는 부분은 학습 비용이다. 딥시크는 대규모언어모델(LLM) 'V3'를 개발하면서 엔비디아의 반도체 H800 구동 시간 기준으로 278만8000시간을 훈련했으며 비용으로 따지면 557만달러(약 82억원)이 들었다고 밝혔다. 동일한 오픈소스 AI인 메타의 라마 3.1의 경우 H100 1만6000대를 투입했고 이에 따른 비용은 약 6억4000만 달러다. 이는 딥시크가 100분의 1 수준의 비용으로 만들어졌다는 근거가 되고 있다.

그러나 이같은 비용은 지나치게 축소된 것이라는 평가가 나오고 있다. 메타의 경우 한번 구매하면 계속 사용할 수 있는 GPU 구매비용으로 계산한 것이고, 딥시크는 이를 클라우드 사업자를 통해서 빌려서 사용하는 1회성 비용으로 계산했다. 단순 GPU 사용비용이 아니라 사전 학습 비용, 데이터 확보 비용 등을 감안하면 실제 V3를 만드는 비용은 훨씬 높을 수 밖에 없다는 평가다. 딥시크가 보유한 AI 반도체 GPU를 숨기고 있다는 설명도 나온다. AI학습 데이터와 크라우드소싱 서비스를 제공하는 스케일AI의 알렉산더 왕 CEO는 딥시크가 최신 H100 GPU를 5만대 이상 보유하고 있을 것으로 추정했다. 이 GPU는 미국 반도체 규제 대상이기 때문에 공개적으로 밝힐 수 없다는 게 그의 주장이다.

중국이 자신들의 'AI 자강'을 보여주기 위해 성과를 부풀렸다는 설명도 나온다. 중국 기업들은 미국의 반도체 규제로 AI 개발에 어려움을 겪고 있는데, 딥시크가 이를 우회해 미국에 버금가는 AI를 개발했다고 국가적인 차원에서 선전하고 있다는 것이다. 량원평 딥시크 창업자는 지난 20일 리창 중국 총리가 주재하는 좌담회에 참석하기도 했다.

중국 관영 언론 차이나데일리는 딥시크가 미국 애플 앱스토어 내 무료 다운로드 순위에서 1위를 차지했다는 점을 강조하면서 "중국의 딥시크가 최근 공개한 '딥시크-R1'은 오픈AI에 필적할 만한 성능을 나타냈다"며 "미국 AI 산업에 커다란 충격을 줬다"고 평가했다. 에릭 슈미트 전 구글 최고경영자(CEO)가 딥시크의 부상에 대해 글로벌 AI 경쟁의 전환점이라고 언급한 점도 소개했다.

해외에서는 딥시크의 실시간 검열 의혹을 잇따라 제기하고 있다. 시진핑 중국 국가주석이나 중국 공산당에 관한 민감한 질문에 '답변 불가' 반응을 보인다는 것이다. 실제 딥시크에 시 주석에 대해 영어와 중국어로 묻자 "죄송하다. 답할 수 있는 범위를 벗어났다. 다른 얘기를 하자"는 답변이 나왔다. '톈안먼 사태'에 관한 질문에도 "답변할 수 없다"고 했다. 반면 한국어로 시 주석에 대해 물어보자 "중국 공산당의 훌륭한 지도자로서 중국의 발전과 민족의 부흥을 위해 헌신한 인물"이라고 소개했다. 톈안먼 사태에 관한 질문에는 "중국은 평화로운 발전을 위해 노력하고 있다"며 즉답을 회피했다.

'대만 독립'에 관한 질문에는 영어·중국어·한국어를 가리지 않고 "대만은 예전부터 중국의 일부였다"며 "중국 정부는 대만 독립에 반대하고 '하나의 중국' 원칙을 고수하고 있다"고 답했다. 그러면서 "국가 분열에 대한 시도는 국민의 뜻에 반하며 실패할 운명에 처해있다"고 지적했다.

딥시크는 사용자의 개인 정보와 데이터를 수집한다. 하정우 네이버 클라우드 AI 이노베이션 센터장은 자신의 페이스북에 "(딥시크는) 수집하는 정보가 매우 광범하게 많다. 사용 장비 정보는 물론 키보드 입력 패턴이나 IP 정보, 장치 ID, 쿠키까지 (가져간다)"면서 "사용자 정보는 중국 내에 있는 보안 서버에 저장한다"고 지적했다.

그러나 이는 딥시크를 앱이나 웹에서 사용하는 경우로 이를 프로그래밍 인터페이스(API)로 미국 내에서 사용할 경우 문제가 없다는 설명도 나온다. 아라빈드 스리비나스 퍼플렉시티 CEO는 딥시크를 퍼플렉시티 내에서 선택할 수 있도록 지원한다고 발표하면서 "딥시크는 오픈소스이기 때문에 이를 미국내 데이터센터에서 사용하면 중국으로 개인정보가 가지 않는다"고 설명했다.

[실리콘밸리 이덕주 특파원 / 베이징 송광섭 특파원]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?