네이버, AI 모델 '비디오 인코더' 자체 모델로 바꾸나···"확정된 바 없어"

김성태 기자 2026. 1. 7. 19:18
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

네이버가 최근 '독자 인공지능(AI) 파운데이션 모델' 프로젝트에서 차용한 중국 알리바바 '비전 인코더' 모델을 자체 모델로 교체하는 방안이 거론되고 있다.

7일 정보기술(IT) 업계에 따르면 네이버클라우드는 '하이퍼클로바X 시드 32B 싱크' 모델의 비전 인코더를 큐원 모델에서 자체 모델로 변경하는 가능성을 검토하고 있는 것으로 전해졌다.

앞서 네이버클라우드의 하이퍼클로바X 시드 32B 싱크 모델의 비전 인코더가 큐원 모델을 사용한 것으로 나타났다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

30일 서울 강남구 코엑스에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회에서 참석자들이 네이버클라우드 부스를 체험하고 있다. 연합뉴스
[서울경제]

네이버가 최근 ‘독자 인공지능(AI) 파운데이션 모델’ 프로젝트에서 차용한 중국 알리바바 ‘비전 인코더’ 모델을 자체 모델로 교체하는 방안이 거론되고 있다.

7일 정보기술(IT) 업계에 따르면 네이버클라우드는 ‘하이퍼클로바X 시드 32B 싱크’ 모델의 비전 인코더를 큐원 모델에서 자체 모델로 변경하는 가능성을 검토하고 있는 것으로 전해졌다. 네이버클라우드는 VUClip과 같은 독자적 비전 인코더 기술력도 갖췄다. 네이버클라우드 관계자는 “확정된 바 없다”고 말했다.

앞서 네이버클라우드의 하이퍼클로바X 시드 32B 싱크 모델의 비전 인코더가 큐원 모델을 사용한 것으로 나타났다. 멀티모달 AI 모델에서 시각 정보를 처리하는 ‘시신경’에 해당하는 비전 인코더에 타사 기술이 활용되며 해당 모델이 기초부터 자체적으로 개발하는 ‘프롬 스크래치’로 개발된 것이 아니라는 주장이 제기됐다.

네이버클라우드는 이에 대해 반박했다. 네이버클라우드는 “글로벌 AI 업계에서도 (타사 인코더를 차용하는) 방식은 시스템 확장성을 위한 보편적인 설계 표준으로 자리 잡고 있다”며 “이번 모델의 핵심 기여는 단순 부품의 조립이 아닌 통합 아키텍처의 완성에 있다. 텍스트, 음성, 이미지를 하나의 유기적인 구조 안에서 동시에 이해하고 생성하도록 설계하는 것이 멀티모달 AI의 가장 본질적이고 어려운 과제”라고 설명했다.

아울러 정부가 프롬 스크래치 방식을 평가 요소로 제시하고도 어디부터가 진짜 프롬 스크래치인지 확실히 규정하지 않아 논란을 키웠다는 지적도 나왔다.

현재 정부는 네이버클라우드와 업스테이지, SK텔레콤(017670), NC AI, LG(003550) AI연구원이 각각 주축인 컨소시엄 5곳을 프로젝트 지원 대상으로 선정해 심사하고 있다. 이달 중순 1차 탈락팀 곳이 발표될 예정이다.

김성태 기자 kim@sedaily.com

Copyright © 서울경제. 무단전재 및 재배포 금지.