딥시크 차세대 LLM ‘V4’ 출시 임박…오픈AI·구글 성능 또 넘볼까

미국 최대 온라인 커뮤니티 ‘레딧’(Reddit)에 올라온 딥시크 ‘V4’ 출시 임박 소식과 그에 따른 미 빅테크 기업의 주가 하락 전망을 풍자한 이미지. 레딧 갈무리

중국 인공지능 스타트업 딥시크의 차세대 거대언어모델(LLM) ‘V4’ 출시가 임박하면서, ‘가성비’를 앞세운 새 모델이 미국 빅테크 모델 성능을 다시 뛰어넘을지 업계의 관심이 모이고 있다.

18일 로이터 통신 등 외신을 보면, 딥시크는 이달 중순 강력한 코딩 기능을 갖춘 새 모델 V4를 공개할 예정이다. 앞서 딥시크는 지난해 12월 선보인 ‘V3.2’ 모델 성능이 일부 평가 지표에서 오픈에이아이의 지피티-5(GPT-5)와 구글 제미나이 3.0 프로와 경쟁할 수 있는 수준으로 나타났다고 밝힌 바 있다.

딥시크의 V4는 파라미터(매개변수) 1조개 수준의 대형 모델로, 긴 코딩 프롬프트(명령문)가 필요한 작업에서 우수한 성능을 보이는 것으로 알려졌다. 안정적이고 효율적으로 데이터를 학습할 수 있는 ‘매니폴드 제약 하이퍼커넥션(mHC)’ 설계를 적용하고 연산 효율을 높여 고비용인 고대역폭메모리(HBM) 의존도를 줄였다는 게 업계 평가다. 노무라증권은 V4에 대해 “다른 조건이 동일하다면, 토큰 당 추론 비용이 이전 모델 대비 10~50% 낮아질 수 있다”고 강조했다.

딥시크는 지난해 1월 엔비디아의 저성능 인공지능 칩으로 개발한 추론 모델 ‘R1’을 선보여 전 세계에 ‘딥시크 충격’을 안겼으나, 미국의 대중 반도체 수출 규제 등으로 1년간 뚜렷한 후속 모델을 내놓지 못했다. 지난해 상반기에는 자국산 칩인 화웨이의 어센드(Ascend)를 ‘R2’ 모델 훈련에 사용했으나, 칩 성능 한계로 신제품 출시를 연기하기도 했다. 이후 딥시크는 엔비디아 최신 칩 수천개를 제3국의 데이터센터로 들여와 분해한 뒤 중국에 밀반입하는 방식으로 최신 모델 개발에 활용한 것으로 알려졌다.

한편, V4 출시가 임박하면서 중국 인공지능 기업들의 경쟁도 치열해졌다. 쇼트폼(짧은 동영상) 플랫폼 틱톡의 모회사 바이트댄스는 최근 춘절 연휴를 앞두고 인공지능 챗봇 도우바오(Doubao) 2.0과 인공지능 영상 생성 모델 ‘시댄스 2.0’을 선보였으며, 중국 오픈소스 선두주자인 알리바바도 새 모델 ‘큐원(Qwen) 3.5’를 공개했다.

선담은 기자 sun@hani.co.kr

한겨레

IT/과학

딥시크 차세대 LLM ‘V4’ 출시 임박…오픈AI·구글 성능 또 넘볼까