카카오, '카나나-2' 모델 4종 추가 공개…한 달 만에 업데이트
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
카카오(035720)가 자체 개발한 차세대 언어모델 'Kanana-2(카나나-2)'의 성능을 업데이트하고, 4종 모델을 추가로 오픈소스로 공개했다고 20일 밝혔다.
지난해 12월 첫 공개 이후 불과 한 달여 만의 확장이다.
카카오는 MoE 학습에 필요한 커널을 직접 개발해 학습 속도와 메모리 효율도 확보했다고 설명했다.
한편 카카오는 현재 수천억 파라미터급 MoE 모델 'Kanana-2-155b-a17b'도 학습 중이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
에이전트 AI 구현 특화…실질 업무 수행 가능
[이데일리 이소현 기자] 카카오(035720)가 자체 개발한 차세대 언어모델 ‘Kanana-2(카나나-2)’의 성능을 업데이트하고, 4종 모델을 추가로 오픈소스로 공개했다고 20일 밝혔다. 지난해 12월 첫 공개 이후 불과 한 달여 만의 확장이다.

핵심 기술은 전문가 혼합(MoE) 구조다. 전체 파라미터는 32B 규모지만, 추론 시 3B만 활성화해 연산 비용을 크게 줄인다. 카카오는 MoE 학습에 필요한 커널을 직접 개발해 학습 속도와 메모리 효율도 확보했다고 설명했다.
학습 과정도 세분화했다. 카카오는 사전학습과 사후학습 사이에 ‘미드 트레이닝(Mid-training)’ 단계를 넣고, 새로운 정보를 학습할 때 기존 능력이 훼손되는 치명적 망각을 막기 위해 ‘리플레이(Replay)’ 기법을 도입했다. 이를 통해 한국어 능력·상식 추론·지시 이행을 동시에 유지하는 균형형 모델을 구현했다는 설명이다.
카카오는 이를 기반으로 △기본(Base) 모델부터 △지시 이행(Instruct) 모델 △추론 특화(Thinking) 모델 △미드 트레이닝 모델까지 총 4종의 모델을 허깅페이스에 추가로 공개했다. 연구자용 미드 트레이닝 탐색 모델까지 포함해 오픈소스 활용도를 높였다.
또 하나의 차별점은 에이전트 AI 대응 능력이다. 카카오는 멀티턴 도구 호출 데이터를 집중 학습해 사용자 지시 이해→도구 선택→실행까지 이어지는 ‘업무 수행형’ 능력을 강화했다고 밝혔다. 실제 벤치마크에서 ‘Qwen-30B-A3B-Instruct-2507’ 대비 지시 이행 정확도·멀티턴 도구 호출·한국어 성능에서 우위를 보였다는 설명이다.
김병학 카카오 카나나 성과리더는 “고가 인프라 없이도 실용적인 에이전트 AI를 구현하기 위한 설계 철학이 반영된 결과”라며 “국내 AI 연구 생태계와 기업 도입의 대안이 되기를 기대한다”고 말했다.

카카오는 향후 글로벌 상위 수준의 파운데이션 모델 개발과 더 복잡한 에이전트 시나리오 대응을 목표로 기술 고도화를 이어간다는 계획이다.
이소현 (atoz@edaily.co.kr)
Copyright © 이데일리. 무단전재 및 재배포 금지.
- '정통 엘리트' 판·검사 줄줄이 대형로펌·대기업行[only 이데일리]
- “박나래, 이대로면 교도소 간다”…현직 변호사가 본 ‘실형 이유’
- 한덕수 근황...돈가스 핫플·호텔서 목격 '尹 사형 구형 다음 날'
- "현대차와 테슬라가 유일" 목표가 64만원 제시 이유
- '체감 -18℃' 최강한파 몰고 온 '대한'…전국 칼바람[오늘날씨]
- 트럼프 “‘그린란드 관세’ 100% 실행”…무력 사용은 답 안해
- "'동거녀 콘크리트 암매장' 했는데 벌써 출소했다고?" [그해 오늘]
- "국익앞에선 적도 동맹도 없는 트럼프…韓, 외교 유연성 발휘할 때"
- BTS 광화문 공연 성사되나? 유산청, 오늘 심의
- "전 재산 8억 날려" 곱버스 지옥문?…코스피에 맞서는 개미들