네이버 하이퍼클로바X, 이미지·음성 기능 탑재

어환희 2024. 8. 23. 00:03
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

네이버가 자체 AI(인공지능) 모델 ‘하이퍼클로바X’를 이미지·음성 처리가 가능하도록 업데이트한다. 지난해 8월 하이퍼클로바X를 출시한지 1년 만이다.

네이버는 오는 27일 대화형 AI 서비스 클로바X 업데이트를 통해 시각정보 처리 능력을 새로 추가한다고 22일 밝혔다. 클로바X는 그동안 텍스트 기반 질의응답 기능을 제공해 왔는데, 여기에 이미지 이해와 개선된 음성 인식이 가능한 ‘하이퍼클로바X 비전’ 기능을 탑재한다. 기존엔 읽고 쓰기에만 능했다면 이젠 더 자연스럽게 보고 듣고 말할 수 있게 됐다. 업데이트된 클로바X는 사진 속 현상을 묘사하거나 상황을 추론할 수 있다. 이미지나 그림 형식으로 되어 있는 표·그래프 등을 분석하고 수학 문제를 풀 수 있다. 이에 사용자들은 대화창에 올린 이미지에서 추출된 정보를 바탕으로 AI와 대화할 수 있다. 음성 인식 역시 기존보다 언어 구조 및 발음 정확도가 개선됐고, 감정 표현까지 더한 자연스러운 대화가 가능해졌다.

네이버는 이번 업데이트를 통해 하이퍼클로바X를 멀티모달 LLM(거대언어모델)으로 고도화하겠다는 구상이다. 멀티모달은 텍스트뿐 아니라 이미지·영상·음성 등 다양한 데이터 양식을 처리할 수 있는 AI의 능력을 말한다.

네이버는 그간 논리적 글쓰기, 코드 작성, 번역 등의 작업에 주로 쓰였던 클로바X가 이미지 이해 능력을 기반으로 활용 범위를 넓혀갈 수 있을 것으로 기대하고 있다. 네이버 측은 “대한민국 초·중·고 검정고시 총 1480개 문항을 AI 모델에 이미지 형태로 입력하고 문제를 풀게 한 결과, 클로바X가 약 84%의 정답률을 기록해 오픈AI의 GPT-4o의 78%보다 높은 정답률을 보였다”고 설명했다.

어환희 기자 eo.hwanhee@joongang.co.kr

Copyright © 중앙일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?