네카오·국내 통신사도 '음성 AI' 시장 뛰어들어

강영운 기자(penkang@mk.co.kr) 2026. 5. 17. 17:18
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

국내 정보기술(IT)·통신 기업이 보이스 시장 주도권을 쥐기 위해 발 빠르게 움직이고 있다.

텍스트와 음성, 이미지를 동시 처리하는 멀티모달 기술이 무르익으면서 우리말 맥락을 잘 잡아내는 '토종 인공지능(AI)'도 주목받는 모습이다.

카카오는 텍스트, 음성, 이미지를 동시에 이해하는 통합 멀티모달 언어 모델 '카나나 옴니'를 올 상반기 내 서비스에 본격 적용한다.

카카오는 정부와 추진 중인 'AI 국민비서 시범 서비스'에 음성 기능을 추가하기도 했다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

SKT, 차량용 보이스AI 내놔
카카오도 전용모델 출시 계획
한국어 음성 특화로 도전장
르노코리아의 신형 차량에 적용된 SK텔레콤의 차량용 AI 에이전트 '에이닷 오토'. SK텔레콤

국내 정보기술(IT)·통신 기업이 보이스 시장 주도권을 쥐기 위해 발 빠르게 움직이고 있다. 텍스트와 음성, 이미지를 동시 처리하는 멀티모달 기술이 무르익으면서 우리말 맥락을 잘 잡아내는 '토종 인공지능(AI)'도 주목받는 모습이다.

가장 빠르게 움직이는 곳은 통신 기업이다. SK텔레콤은 최근 르노코리아 신차 팔랑트에 AI 에이전트 '에이닷 오토'를 탑재했다. 한국어 특화 대규모언어모델(LLM) 에이닷엑스 4.0을 접목했다. "길 안내해줘" "노래 틀어줘"라는 단순한 명령은 물론이고 "엉따(좌석 발열 기능) 켜줘"와 같은 속어까지 정확히 인식한다. 차량 안에 자신만의 비서가 생기는 셈이다.

KT는 음성 서비스로 '안방'을 겨냥했다. '지니TV AI 에이전트'가 핵심이다. 대화를 통해 날씨, 뉴스, 생활 정보뿐만 아니라 시사·교양·과학 등 질문도 가능하다. LG유플러스는 AI콜 에이전트 '익시오(ixi-O)'를 선보였다. 대화 맥락과 상대방의 감정 상태, 어조까지 파악해 능동적으로 대응하고 위협을 실시간 차단하는 능동형 에이전트다.

플랫폼 강자인 네이버와 카카오도 음성에서 새로운 도약을 준비 중이다. 네이버는 기업 간 거래(B2B) 특화 시장에서 승부수를 띄웠다. 네이버웍스 클로바노트(기업용 서비스)에 다수 참석자의 목소리를 명확히 구분하는 화자 자동 식별 기능을 업데이트했다. 올 하반기에는 실시간 음성인식 기능과 요약 품질을 고도화한다는 계획이다. B2B 필수 도구로서 지위를 굳힌다는 전략이다.

카카오는 텍스트, 음성, 이미지를 동시에 이해하는 통합 멀티모달 언어 모델 '카나나 옴니'를 올 상반기 내 서비스에 본격 적용한다. 글로벌 모델에 비해 한국어 이해도가 높은 만큼 국내 시장에서만큼은 승산이 있다는 판단이다. 카카오에 따르면 카나나 옴니는 현재 국내 멀티모달 모델 동급 중 최고의 벤치마크를 기록하고 있다. 현재 제한된 인원 대상 응용프로그래밍인터페이스(API) 베타 테스트를 순조롭게 진행 중이다. 카카오는 정부와 추진 중인 'AI 국민비서 시범 서비스'에 음성 기능을 추가하기도 했다.

[강영운 기자]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지