[AI 프런티어] 클로바X에 눈·귀 달아 … 멀티모달로 진화

이상덕 기자(asiris27@mk.co.kr), 황순민 기자(smhwang@mk.co.kr) 2024. 3. 3. 17:51
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

한국의 대표 인공지능(AI) 에이전트인 네이버 '클로바X'가 텍스트뿐만 아니라 음성·이미지 코딩까지 생성하는 멀티모달로 본격 진화한다.

성낙호 네이버 클라우드 하이퍼스케일(Hyperscale) AI 기술총괄은 지난달 29일 경기도 성남시 분당구에 있는 '네이버 1784'에서 기자와 만나 "곧 클로바X에 눈이 생기고 귀가 생길 것"이라고 강조했다.

네이버 클라우드는 클로바X에 이미지와 오디오 AI를 순차적으로 탑재하고, 코딩 기능을 대폭 강화한다는 방침을 발표했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

성낙호 네이버클라우드 기술총괄
이미지·음성·코딩 곧 지원
AI 구축은 '핵 경쟁'과 닮아
국가관 담은 AI 반드시 필요
네이버 LLM은 한국 자존심
성낙호 네이버 클라우드 하이퍼스케일 AI 기술총괄이 경기 분당에 있는 신사옥 '네이버 1784'에서 인공지능(AI)의 미래에 대해 설명하고 있다. 이승환 기자

한국의 대표 인공지능(AI) 에이전트인 네이버 '클로바X'가 텍스트뿐만 아니라 음성·이미지 코딩까지 생성하는 멀티모달로 본격 진화한다.

성낙호 네이버 클라우드 하이퍼스케일(Hyperscale) AI 기술총괄은 지난달 29일 경기도 성남시 분당구에 있는 '네이버 1784'에서 기자와 만나 "곧 클로바X에 눈이 생기고 귀가 생길 것"이라고 강조했다. 그러면서 그는 "현재 심혈을 기울이고 있는 것은 멀티모달로의 확장"이라며 "이와 함께 클로바X의 토대인 초거대AI 하이퍼클로바X를 업데이트하고 있다"고 설명했다.

네이버가 오픈AI의 챗GPT나 구글의 제미나이 같은 빅테크 기업의 멀티모달 서비스에 도전장을 내밀었다. 현재 클로바X를 통해 이미지를 편집할 수는 있지만 생성은 되지 않는다. 네이버 클라우드는 클로바X에 이미지와 오디오 AI를 순차적으로 탑재하고, 코딩 기능을 대폭 강화한다는 방침을 발표했다. 성 총괄은 빅테크 공세에 대해 "오픈AI가 다음 버전인 GPT-5를 론칭하면, 다른 기업과 기술 격차가 더 벌어질 것"이라면서 "관건은 추론 성능은 높이면서 동시에 비용을 낮추는 것"이라고 설명했다.

인간 두뇌의 시냅스에 해당하는 파라미터의 경우 오픈AI의 GPT-3는 1750억개에 달한다. 그만큼 추론에 큰 비용이 발생해 수익을 내기 어려운 구조다. 이에 하이퍼클로바X는 한국어와 영어, 일본어에 최적화했다. 그는 "빅테크 입장에서 한국은 매우 작은 시장이기 때문에 타깃하기 어렵다"며 "하이퍼클로바X는 한국어 데이터를 더 많이 학습해 한국어 성능이 우수하다"고 말했다. 이 때문에 번역 성능에선 클로바X가 가장 탁월하다는 것이 성 총괄의 설명이다. 성 총괄은 AI가 향후 개인화·지역화될 것으로 전망했다. 그는 "국가나 지역마다 타협할 수 없는 가치관이 있다"면서 "빅테크 기업에 '독도 영유권'을 묻는다면 분쟁 지역으로 답하지만, 하이퍼클로바X는 그렇지 않다"고 강조했다. 향후 국가별로 AI가 분화될 수밖에 없다는 얘기다.

특히 그는 국가별 AI 구축 경쟁을 핵무기 경쟁에 빗댔다. 성 총괄은 "AI 구축은 핵무기 개발과 다름없다"면서 "영국 역시 규제를 이야기하다가 만들 수 있다고 판단하니 물러서지 않았냐"고 반문했다. 그러면서 그는 "한국은 몇 안 되는 LLM(대규모언어모델) 개발 국가"라며 "최대한 성장할 수 있도록 육성해야 한다"고 말했다. 현재 네이버 클라우드는 신경망처리장치(NPU)까지 개발하고 있다. AI는 데이터세트를 학습하는 데 그래픽처리장치(GPU)가, 추론하는 데 NPU가 각각 필요하다. 성 총괄은 "클라우드에서 추론형 반도체인 NPU를 놓칠 수 없다"고 말했다. 클라우드 비즈니스상 AI를 통해 수익을 달성하려면, 추론 비용을 줄여주는 AI 칩 개발이 필수적이라고 설명한다. 성 총괄은 서울과학고 재학 시절 비전 로봇을 제작하며 AI에 입문했다. 서울대 컴퓨터공학과를 졸업하고 게임 엔진 스타트업을 창업한 뒤 이를 네오위즈에 매각했다. 엔씨소프트로 넘어가서는 강화학습 기반 게임 에이전트를 개발했다. 이후 2017년 네이버에 합류했다. 네이버에서 금융 AI, AI 상담원, 하이퍼클로바X 등을 개발했다. 현재는 하이퍼클로바X를 총괄하고 있다.

멀티모달

멀티모달은 텍스트, 이미지, 영상, 음성 등 다양한 시청각 요소를 종합적으로 판단해 의사결정을 내리는 종합 AI 서비스다. 말을 하면 그림을 그려주고, 텍스트로 질문을 입력하면 음성으로 설명한다.

[이상덕 기자 / 황순민 기자]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?