
[엠투데이 최태인 기자] 중국 인공지능(AI) 기업 딥시크(DeepSeek)가 생성형 AI 모델 '딥시크-R1-0528(DeepSeek-R1-0528)'을 공개했다.
지난 29일(현지시간) 온라인 매체 기가진은 이번 모델은 기존 딥시크 R1을 마이너 업그레이드한 버전으로, 6,850억 개의 파라미터를 탑재해 더 강력한 추론 능력을 갖췄다고 보도했다. 특히, 코드 생성 및 실행 능력이 향상됐으며, 특정 작업에서 최대 30~60분간 심층적인 추론이 가능한 것으로 알려졌다.
딥시크는 새로운 모델이 구글 AI처럼 깊이 있는 추론을 수행하며, 빠르면서도 신중한 분석을 제공한다고 강조했다.
실제로 코드 생성 및 수정, 출력 예측 등의 벤치마크를 측정하는 라이브코드벤치(LiveCodeBench)에서 딥시크-R1-0528은 오픈AI의 'o4-미니(mini)'와 비슷한 성능을 기록하며 4위에 올랐다.
딥시크는 트랜스포머(Transformer) 아키텍처를 설명한 논문 '어텐션 이즈 올 유 니드(Attention Is All You Need)'를 모델에 입력해 요약하도록 하는 등 실험을 통해 모델의 추론 능력을 검증하고 있다.
또한 딥시크-R1-0528은 MIT 라이선스를 통해 무료로 공개되며, 누구나 모델 데이터를 다운로드해 사용할 수 있다. AI 시장에서 오픈AI와 경쟁을 선언한 딥시크가 이번 모델을 통해 얼마나 큰 영향력을 확대할지 관심을 모은다.