AI 모델서 ‘중국산’ 제거…네이버, ‘자체 비전 인코더’ 적용
한국 문화 특화 멀티모달의 탄생

17일 IT 업계에 따르면 네이버클라우드는 지난달 초 독자적인 비전 인코더 개발을 완료하고, 향후 개발하는 멀티모달 모델 전반에 이를 적용하기 위한 내재화 작업에 착수했다. 비전 인코더는 이미지·영상 정보를 AI가 이해할 수 있는 형태로 변환하는 모듈이다. 텍스트·이미지·음성·영상 정보를 종합적으로 다루는 멀티모달 모델에서 일종의 ‘시신경’ 역할을 한다.
앞서 네이버클라우드는 자사 멀티모달 모델 ‘하이퍼클로바X 시드 32B 싱크’에 알리바바가 개발한 큐웬 2.5 모델의 비전 인코더와 가중치를 일부 차용했다 논란이 됐다.
독파모는 해외 빅테크 AI 모델에 대한 의존을 줄이고 한국만의 AI 모델을 육성하기 위해 추진됐다. 학습 초기 단계부터 자체 기술로 구축하는 ‘프롬 스크래치’(From Scratch) 원칙을 내세웠기에 네이버의 중국 기술 차용에 비판이 거셌다. 당시 네이버클라우드는 “비전 인코더는 언제든 교체할 수 있고, 교체가 불가능한 핵심 영역도 아니”라고 주장했다.
네이버는 이번 개발로 독자성 논란을 씻어내고 기술 자립의 발판을 다질 계획이다. 새 인코더는 글로벌 최상위권 모델인 ‘큐웬’과 대등한 성능을 갖췄다고 평가된다. 눈에 띄는 강점은 한국어와 한국 문화의 맥락을 정확히 읽어내는 시각 지능지능이다. 이번에 개발된 비전 인코더는 별도 번역 과정 없이 이미지와 한국어를 직접 연결하는 구조다. 기존 글로벌 인코더들은 우리나라 ‘하르방’ 이미지를 단순히 ‘석상’(Statue)이라는 영어 단어로 인식했지만 네이버 모델은 즉시 ‘하르방’이라는 한글 단어를 떠올리는 식이다.
네이버클라우드 측은 “한국어와 이미지를 직접 연결하도록 설계돼 정보 왜곡 없이 우리나라 문화 특유의 맥락을 읽어낼 수 있는 점이 차별점”이라며 “한국의 지리나 문화, 고유 명사가 포함된 시각 데이터를 다룰 때 외산 모델과는 차원이 다른 독보적인 정확도를 보여줄 것”이라고 강조했다.
Copyright © 매경이코노미. 무단전재 및 재배포 금지.
- “스페이스X 덕분” 미래에셋 美우주테크 ETF ‘뭉칫돈’- 매경ECONOMY
- ‘부동산 부자’ 롯데가 꺼내든 승부수- 매경ECONOMY
- 천당에서 지옥으로…삼천당제약 미스터리 [스페셜리포트]- 매경ECONOMY
- 젠슨 황 한마디에…광통신·양자컴株 ‘어질어질’- 매경ECONOMY
- 삼성전자 노조의 ‘안분지족’은 어디쯤… [편집장 레터]- 매경ECONOMY
- 보험료 30% 낮은 5세대 실손으로 갈아타볼까- 매경ECONOMY
- ‘K방산’에 ‘K드론’ 없다…WHY?- 매경ECONOMY
- 기로에 선 ‘홈플러스익스프레스 매각’- 매경ECONOMY
- 신세계, 리플렉션AI 협업...열흘 만에 갈아탄 동맹- 매경ECONOMY
- [단독] “최대 매출 뒤 이익 반토막”...구지은, 아워홈 주총 후 김동선에 쓴소리- 매경ECONOMY