인간처럼 대화…네이버, 음성AI 공개

고민서 기자(esms46@mk.co.kr) 2024. 8. 22. 17:33
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

네이버가 자체 초대규모 인공지능(AI) 모델 '하이퍼클로바X'를 이미지와 음성 처리까지 가능한 '멀티모달 생성형 AI'로 고도화했다.

네이버는 오는 27일 대화형 AI 에이전트 서비스 '클로바X'에 하이퍼클로바X의 이미지 처리 능력을 더한 '이미지 기반 대화' 기능을 탑재할 계획이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

멀티모달 기능 고도화

네이버가 자체 초대규모 인공지능(AI) 모델 '하이퍼클로바X'를 이미지와 음성 처리까지 가능한 '멀티모달 생성형 AI'로 고도화했다. 이미 오픈AI·구글 등 글로벌 빅테크들을 중심으로 일명 AI 비서로 불리는 대화형 AI 에이전트시장이 기존 텍스트 중심에서 이미지와 소리 등 다양한 형태의 정보를 동시에 이해하고 처리하는 보다 진화된 서비스를 추구하고 있는 가운데 네이버 역시 이 시장에 본격 참전하게 된 것이다.

네이버는 하이퍼클로바X 기반의 음성 AI 기술 '스피치X'를 22일 공개했다. 기존의 음성 인식·음성 합성 기술보다 한층 발전한 모델로, 대규모언어모델(LLM)의 특징인 뛰어난 문맥 이해 및 지시문 해석 능력을 활용해 언어 구조 및 발음 정확도 개선은 물론 감정 표현까지 더한 자연스러운 대화가 가능하다는 게 회사 측 설명이다.

특히 네이버는 이 음성 AI가 실시간 음성 번역과 언어 학습, 상담과 같은 다양한 서비스에 접목될 수 있다는 점을 강조하며, 향후 기술 고도화 등 과정을 거쳐 자사 주요 서비스에 순차적으로 탑재하겠다는 복안이다.

당장 서비스로 체감할 수 있는 솔루션은 이미지 탐색 AI인 '하이퍼클로바X 비전'이다. 네이버는 오는 27일 대화형 AI 에이전트 서비스 '클로바X'에 하이퍼클로바X의 이미지 처리 능력을 더한 '이미지 기반 대화' 기능을 탑재할 계획이다.

[고민서 기자]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?