카카오, 한국어 특화 AI 모델 ‘카나나-o’ 성능 공개

카카오가 자체 개발 중인 인공지능(AI) 거대언어모델(LLM) ‘카나나(Kanana)’ 모델군 가운데, 통합 멀티모달 언어모델인 ‘카나나-o’와 오디오 언어모델 ‘카나나-a’의 성능이 공개됐습니다.

카카오는 오늘(1일) 공식 테크 블로그를 통해 이 두 AI 모델에 대한 성능과 개발 후기를 공개했다고 밝혔습니다.

카나나-o는 국내 최초로 ‘멀티모달(multimodal)’, 즉 텍스트와 음성, 이미지 등 다양한 형태의 정보를 동시에 이해하고 처리할 수 있는 AI 모델입니다.

이용자는 텍스트와 음성, 이미지 중 어떠한 조합으로 질문을 입력하더라도 카나나-o를 통해 처리할 수 있고, 상황에 맞는 텍스트나 자연스러운 음성 입력에도 응답을 생성해 낼 수 있습니다.

카카오는 서로 다른 모델을 합치는 모델 병합 기술을 기반으로 이미지 처리에 특화된 카나나-v와 오디오 이해·생성에 특화된 카나나-a 모델을 통합해 단기간 내에 카나나-o를 개발했다고 설명했습니다.

특히 대규모 한국어 데이터셋을 활용해 한국어의 특수한 발화 구조와 억양, 어미변화 등을 정밀하게 반영했다고 전했습니다.

이에 따라 카나나-o는 제주도, 경상도 등 지역 방언을 인식하고 이를 표준어로 변환해 자연스러운 음성을 생성할 수 있습니다.

카카오는 ‘카나나-o’는 한국어 및 영어 벤치마크(성능 검증)에서 챗GPT와 구글 제미나이 등 글로벌 최고 AI 모델과 유사한 수준을 기록했고, 한국어 벤치마크에서는 높은 우위를 보였다고 밝혔습니다.

특히 감정 인식 능력에서는 한국어와 영어 모두에서 큰 우위를 기록해, 감정까지 이해하고 소통할 수 있는 AI 모델의 가능성을 입증했다고 강조했습니다.

[사진 출처 : 연합뉴스 / 카카오 제공]

■ 제보하기
▷ 전화 : 02-781-1234, 4444
▷ 이메일 : kbs1234@kbs.co.kr
▷ 카카오톡 : 'KBS제보' 검색, 채널 추가
▷ 카카오 '마이뷰', 유튜브에서 KBS뉴스를 구독해주세요!

강나루 기자 (naru@kbs.co.kr)

IT/과학