카카오, 국내 최고 수준 ‘경량 멀티모달 AI’ 오픈소스 공개
카카오가 국내 최고 수준의 경량 멀티모달 언어모델을 24일 오픈소스 형태로 공개했다.
카카오는 이날 이미지 정보 이해 및 지시 이행능력을 갖춘 경량 멀티모달 언어모델 ‘카나나-1.5-v-3b’를 개발자 플랫폼 허깅페이스에 공개했다고 밝혔다.
이는 텍스트 외에 이미지 정보도 처리할 수 있는 모델이다. 이용자가 질문하는 의도를 정확히 파악하고 높은 지시 이행 성능과 뛰어난 한국어·영어 이해 능력을 갖췄다. 경량 모델임에도 오픈AI의 ‘GPT-4o’와 견줄 정도라고 카카오는 설명했다.
카카오는 고성능의 대형 모델을 활용해 작은 모델을 학습시키는 ‘지식 증류’ 방식 등을 통해 성능을 극대화했다. 비슷한 크기의 ‘큐원 2.5’(알리바바), ‘하이퍼클로바 X 시드 비전 3B’(네이버)보다 이미지 이해 등에서 높은 점수를 기록했다고 회사 측은 밝혔다.
카카오는 이날 ‘MoE’(Mixture of Experts·전문가 혼합) 모델 ‘카나나-1.5-15.7b-a3b’도 함께 오픈소스로 공개했다. MOE란 여러 거대언어모델(LLM)을 한데 모은 뒤 작업 종류에 따라 특화된 LLM만 선택적으로 활성화하는 기술이다. 효율적인 컴퓨팅 자원 활용과 비용 절감이 강점이다.
올해 초 ‘저비용·고효율’ 모델로 전 세계에 충격을 던진 중국 딥시크가 취한 방식이 MoE다.
카카오는 지난 2월 가장 크기가 큰 플래그십 모델인 ‘카나나 플래그’ 개발을 완료한 데 이어 지난 5월에는 경량 모델 카나나-1.5 4종을 오픈소스로 공개했다. 카카오는 챗GPT 개발사 오픈AI와 함께 AI 서비스를 개발 중이다.
최민지 기자 ming@kyunghyang.com
Copyright © 경향신문. 무단전재 및 재배포 금지.
- “아리가또 하이닉스”…외국 개미, 한국 증시로 얼마나 몰려올까
- 이스라엘, 하마스 최고 군사지도자 겨냥 가자시티 공습…57명 사상
- 러시아의 우크라 도심 맹폭에 27명 사망…젤렌스키 “응징할 것”
- [속보]법원 “(이진숙) 2인 체제 방통위의 KBS 감사 임명은 적법”
- 트럼프 “대만 무기판매는 좋은 협상칩…팔 수도, 안 팔 수도”
- 배우자 외도 메시지 몰래 촬영한 사진···대법 “민사재판 증거로 인정”
- 삼성전자 노조, 결국 파업 강행하나…사측 ‘성과급 제도화’ 변화 없자 “파업 끝나고 협의”
- [속보] 외교부 “나무호 타격 비행체 잔해 한국 도착…정밀 분석 예정”
- 유승민 이어 MB 만난 오세훈…청계천 걸으며 “제 마음속 스승”
- 노조 총파업 예고 속···삼성 반도체 수장 “지금 호황 마지막 골든타임” 임원 대상 설명회