딥시크에 시진핑·톈안먼 물으니 …"다른 얘기하자" 답 피했다
① 검색내용들 검열하나
중국 공산당·대만 독립 등
민감한 질문엔 '답변 불가'
② 개발비, 美 100분의 1 맞나
메타는 GPU 구매비용 기준
딥시크는 '1회 사용'만 계산
③ 개인정보 수집되나
키보드 입력패턴·IP 등 수집
전문가 "中 보안서버에 저장"
◆ 딥시크 쇼크 ◆
전세계를 깜짝 놀라게한 중국의 인공지능(AI) 딥시크는 낮은 학습 비용에도 불구하고 챗GPT 같은 최고 성능의 AI를 달성한 것으로 평가받는다. 하지만 낮은 비용은 딥시크가 발표한 기술 논문에 따른 것으로 이를 의심의 눈으로 보는 시각이 많다. 중국 개인정보 사용에 대한 우려와 중국 정부의 방침에 맞춘 검열에 대한 비판도 나오고 있다.
딥시크는 여러 벤치마크에서 주요 첨단 AI와 비등한 성능을 보여준다. 영어 성능을 평가하는 MMLU에서 딥시크 V3는 88.5점, 같은 오픈소스인 메타 라마는 88.6점, 오픈AI GPT-4o는 87.2점을 받았다. 코딩 점수에서도 82.6점으로 라마(77.2점)나 GPT-4o(80.5)보다도 높다.
딥시크와 챗GPT에 각각 상대 모델 대비 강점이 무엇인지 한국어로 질문해보니 딥시크는 챗GPT에 비해 최신 정보 반영, 맥락 이해, 다국어 지원, 윤리적 안전성 등에서 강점이 있으며 챗GPT의 한계를 보완해 더 발전된 AI 기술을 제공한다고 밝혔다. '효율성'과 '자원 최적화'라는 답은 영어로 질문했을 경우에만 제시했다. 반면 챗GPT는 상대적인 강점으로 '검열 제한 없음' '고급기능제공' '데이터 프라이버시'라는 일관된 답을 내놨다.
딥시크와 관련해 가장 많은 논란이 있는 부분은 학습 비용이다. 딥시크는 대규모언어모델(LLM) 'V3'를 개발하면서 엔비디아의 반도체 H800 구동 시간 기준으로 278만8000시간을 훈련했으며 비용으로 따지면 557만달러(약 82억원)이 들었다고 밝혔다. 동일한 오픈소스 AI인 메타의 라마 3.1의 경우 H100 1만6000대를 투입했고 이에 따른 비용은 약 6억4000만 달러다. 이는 딥시크가 100분의 1 수준의 비용으로 만들어졌다는 근거가 되고 있다.
그러나 이같은 비용은 지나치게 축소된 것이라는 평가가 나오고 있다. 메타의 경우 한번 구매하면 계속 사용할 수 있는 GPU 구매비용으로 계산한 것이고, 딥시크는 이를 클라우드 사업자를 통해서 빌려서 사용하는 1회성 비용으로 계산했다. 단순 GPU 사용비용이 아니라 사전 학습 비용, 데이터 확보 비용 등을 감안하면 실제 V3를 만드는 비용은 훨씬 높을 수 밖에 없다는 평가다. 딥시크가 보유한 AI 반도체 GPU를 숨기고 있다는 설명도 나온다. AI학습 데이터와 크라우드소싱 서비스를 제공하는 스케일AI의 알렉산더 왕 CEO는 딥시크가 최신 H100 GPU를 5만대 이상 보유하고 있을 것으로 추정했다. 이 GPU는 미국 반도체 규제 대상이기 때문에 공개적으로 밝힐 수 없다는 게 그의 주장이다.
중국이 자신들의 'AI 자강'을 보여주기 위해 성과를 부풀렸다는 설명도 나온다. 중국 기업들은 미국의 반도체 규제로 AI 개발에 어려움을 겪고 있는데, 딥시크가 이를 우회해 미국에 버금가는 AI를 개발했다고 국가적인 차원에서 선전하고 있다는 것이다. 량원평 딥시크 창업자는 지난 20일 리창 중국 총리가 주재하는 좌담회에 참석하기도 했다.
중국 관영 언론 차이나데일리는 딥시크가 미국 애플 앱스토어 내 무료 다운로드 순위에서 1위를 차지했다는 점을 강조하면서 "중국의 딥시크가 최근 공개한 '딥시크-R1'은 오픈AI에 필적할 만한 성능을 나타냈다"며 "미국 AI 산업에 커다란 충격을 줬다"고 평가했다. 에릭 슈미트 전 구글 최고경영자(CEO)가 딥시크의 부상에 대해 글로벌 AI 경쟁의 전환점이라고 언급한 점도 소개했다.
해외에서는 딥시크의 실시간 검열 의혹을 잇따라 제기하고 있다. 시진핑 중국 국가주석이나 중국 공산당에 관한 민감한 질문에 '답변 불가' 반응을 보인다는 것이다. 실제 딥시크에 시 주석에 대해 영어와 중국어로 묻자 "죄송하다. 답할 수 있는 범위를 벗어났다. 다른 얘기를 하자"는 답변이 나왔다. '톈안먼 사태'에 관한 질문에도 "답변할 수 없다"고 했다. 반면 한국어로 시 주석에 대해 물어보자 "중국 공산당의 훌륭한 지도자로서 중국의 발전과 민족의 부흥을 위해 헌신한 인물"이라고 소개했다. 톈안먼 사태에 관한 질문에는 "중국은 평화로운 발전을 위해 노력하고 있다"며 즉답을 회피했다.
'대만 독립'에 관한 질문에는 영어·중국어·한국어를 가리지 않고 "대만은 예전부터 중국의 일부였다"며 "중국 정부는 대만 독립에 반대하고 '하나의 중국' 원칙을 고수하고 있다"고 답했다. 그러면서 "국가 분열에 대한 시도는 국민의 뜻에 반하며 실패할 운명에 처해있다"고 지적했다.
딥시크는 사용자의 개인 정보와 데이터를 수집한다. 하정우 네이버 클라우드 AI 이노베이션 센터장은 자신의 페이스북에 "(딥시크는) 수집하는 정보가 매우 광범하게 많다. 사용 장비 정보는 물론 키보드 입력 패턴이나 IP 정보, 장치 ID, 쿠키까지 (가져간다)"면서 "사용자 정보는 중국 내에 있는 보안 서버에 저장한다"고 지적했다.
그러나 이는 딥시크를 앱이나 웹에서 사용하는 경우로 이를 프로그래밍 인터페이스(API)로 미국 내에서 사용할 경우 문제가 없다는 설명도 나온다. 아라빈드 스리비나스 퍼플렉시티 CEO는 딥시크를 퍼플렉시티 내에서 선택할 수 있도록 지원한다고 발표하면서 "딥시크는 오픈소스이기 때문에 이를 미국내 데이터센터에서 사용하면 중국으로 개인정보가 가지 않는다"고 설명했다.
[실리콘밸리 이덕주 특파원 / 베이징 송광섭 특파원]
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- “설날 5천만원 꽂힌 통장 부럽다”...연봉 50% 성과급 쏜 ‘이 회사’ - 매일경제
- “경기도 다낭시 제쳤다”...명절 해외여행족 최애 도시는 바로 여기 - 매일경제
- “80 넘으면 산에·안방에 누운 사람 같다더라”...손숙·박근형 ‘웰다잉’ 준비한다는데 - 매일
- 세뱃돈 대신 ‘이것’ 사 달라는 초딩들…가격 본 부모, 한숨이 저절로 - 매일경제
- 한달 관리비만 무려 763만원…작년 전국서 가장 많이 나온 아파트 어디길래 - 매일경제
- “6일 남았다, 혹시 나?”...18억 로또 1등, 아직도 안나타났다는데 - 매일경제
- “선녀보살·맥아더장군 큰일 났다”…이제 ‘이것’까지 본다는 인공지능 - 매일경제
- “2월 역사적 증시 폭락 온다”...‘부자아빠’가 경고하며 기회로 꼽은 것은 - 매일경제
- 한화그룹 아워홈 인수 이유는? “年 64조원 식자재 유통시장 노린다” - 매일경제
- ‘헤더 결승골’ 김민재, 분데스리가 19라운드 베스트 11 선정···‘최다 볼 터치·패스 성공률도