딥시크 차세대 LLM ‘V4’ 출시 임박…오픈AI·구글 성능 또 넘볼까
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
중국 인공지능 스타트업 딥시크의 차세대 거대언어모델(LLM) 'V4' 출시가 임박하면서, '가성비'를 앞세운 새 모델이 미국 빅테크 모델 성능을 다시 뛰어넘을지 업계의 관심이 모이고 있다.
18일 로이터 통신 등 외신을 보면, 딥시크는 이달 중순 강력한 코딩 기능을 갖춘 새 모델 V4를 공개할 예정이다.
딥시크의 V4는 파라미터(매개변수) 1조개 수준의 대형 모델로, 긴 코딩 프롬프트(명령문)가 필요한 작업에서 우수한 성능을 보이는 것으로 알려졌다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

중국 인공지능 스타트업 딥시크의 차세대 거대언어모델(LLM) ‘V4’ 출시가 임박하면서, ‘가성비’를 앞세운 새 모델이 미국 빅테크 모델 성능을 다시 뛰어넘을지 업계의 관심이 모이고 있다.
18일 로이터 통신 등 외신을 보면, 딥시크는 이달 중순 강력한 코딩 기능을 갖춘 새 모델 V4를 공개할 예정이다. 앞서 딥시크는 지난해 12월 선보인 ‘V3.2’ 모델 성능이 일부 평가 지표에서 오픈에이아이의 지피티-5(GPT-5)와 구글 제미나이 3.0 프로와 경쟁할 수 있는 수준으로 나타났다고 밝힌 바 있다.
딥시크의 V4는 파라미터(매개변수) 1조개 수준의 대형 모델로, 긴 코딩 프롬프트(명령문)가 필요한 작업에서 우수한 성능을 보이는 것으로 알려졌다. 안정적이고 효율적으로 데이터를 학습할 수 있는 ‘매니폴드 제약 하이퍼커넥션(mHC)’ 설계를 적용하고 연산 효율을 높여 고비용인 고대역폭메모리(HBM) 의존도를 줄였다는 게 업계 평가다. 노무라증권은 V4에 대해 “다른 조건이 동일하다면, 토큰 당 추론 비용이 이전 모델 대비 10~50% 낮아질 수 있다”고 강조했다.
딥시크는 지난해 1월 엔비디아의 저성능 인공지능 칩으로 개발한 추론 모델 ‘R1’을 선보여 전 세계에 ‘딥시크 충격’을 안겼으나, 미국의 대중 반도체 수출 규제 등으로 1년간 뚜렷한 후속 모델을 내놓지 못했다. 지난해 상반기에는 자국산 칩인 화웨이의 어센드(Ascend)를 ‘R2’ 모델 훈련에 사용했으나, 칩 성능 한계로 신제품 출시를 연기하기도 했다. 이후 딥시크는 엔비디아 최신 칩 수천개를 제3국의 데이터센터로 들여와 분해한 뒤 중국에 밀반입하는 방식으로 최신 모델 개발에 활용한 것으로 알려졌다.
한편, V4 출시가 임박하면서 중국 인공지능 기업들의 경쟁도 치열해졌다. 쇼트폼(짧은 동영상) 플랫폼 틱톡의 모회사 바이트댄스는 최근 춘절 연휴를 앞두고 인공지능 챗봇 도우바오(Doubao) 2.0과 인공지능 영상 생성 모델 ‘시댄스 2.0’을 선보였으며, 중국 오픈소스 선두주자인 알리바바도 새 모델 ‘큐원(Qwen) 3.5’를 공개했다.
선담은 기자 sun@hani.co.kr
Copyright © 한겨레신문사 All Rights Reserved. 무단 전재, 재배포, AI 학습 및 활용 금지
- [단독] 12·3 계엄 막은 대한민국 국민, 노벨평화상 후보로 추천됐다
- 전두환을 어설프게 용서한 카르마, 윤석열의 끝은 달라야 한다 [성한용 칼럼]
- 일본 ‘대미 투자 확정’에 한국도 속도전…실무단 미국행
- 세계 최장 7m 뱀, 축구골대 막기 가능…“근육마다 모터 단 듯 엄청난 힘”
- 윤 선고 앞둔 ‘지귀연 머릿속’ [그림판]
- 내란 특검, 이상민 ‘징역 7년’ 1심 판결에 항소
- 반전…충주맨 후배 ‘추노’ 한방에 250만뷰 터졌다 “ㅋㅋㅋ”
- 장동혁, 19일 윤석열 선고 뒤 발표할 메시지 수위 ‘저울질 중’
- 송영길 2심 무죄로 바뀐 민주당 역학구도…인천 계양을 보선 ‘주목’
- [단독] 인천대 수시 ‘점수 담합 의혹’…면접 때 참관인 없었다