'국가대표 AI' 모델 비교해보니 … 성능은 LG, 개방성 SKT·NC

정호준 기자(jeong.hojun@mk.co.kr), 이진한 기자(mystic2j@mk.co.kr) 2026. 1. 11. 17:33
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

국가대표 인공지능(AI) 모델 개발에 나선 5개 정예팀 중 1차 단계에서 가장 뛰어난 성능을 갖춘 모델은 LG AI연구원인 것으로 나타났다.

11일 각 기업이 기술 보고서를 통해 공개한 주요 벤치마크 테스트 결과에 따르면 LG AI연구원의 'K-엑사원(EXAONE)'이 다른 모델 대비 높은 점수를 기록했다.

LG AI연구원에 따르면 K-엑사원은 독자 AI 파운데이션 모델 프로젝트의 1차 평가 기준인 13개의 벤치마크 테스트 가운데 10개에서 1위를 차지했다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

LG K-엑사원 독자 AI 평가서
13개 항목 중 10개서 1위
SKT·NC 모델은 누구나 이용
자유롭게 수정·배포도 가능

국가대표 인공지능(AI) 모델 개발에 나선 5개 정예팀 중 1차 단계에서 가장 뛰어난 성능을 갖춘 모델은 LG AI연구원인 것으로 나타났다. 모델 개방성 측면에서는 SK텔레콤과 NC AI가 두드러졌다.

11일 각 기업이 기술 보고서를 통해 공개한 주요 벤치마크 테스트 결과에 따르면 LG AI연구원의 'K-엑사원(EXAONE)'이 다른 모델 대비 높은 점수를 기록했다.

전문 분야 문제를 포함하는 고난도 한국어 벤치마크인 'KMMLU-Pro'에서는 SK텔레콤이 68.1점, LG AI연구원이 67.3점으로 각각 1위와 2위를 차지했고, 네이버와 업스테이지가 근소한 차이로 뒤를 이었다.

영어 중심의 다중 처리 능력과 종합 지식을 판단하는 'MMLU-Pro' 테스트에서는 LG AI연구원이 83.8점을 기록했으며, SK텔레콤과 업스테이지가 각각 2위, 3위를 차지했다.

수학 능력을 평가하는 AIME 2025, 코딩 능력을 보는 라이브코드벤치(LiveCodeBench)에서도 LG AI연구원이 타 모델 대비 고득점을 기록했다. LG AI연구원에 따르면 K-엑사원은 독자 AI 파운데이션 모델 프로젝트의 1차 평가 기준인 13개의 벤치마크 테스트 가운데 10개에서 1위를 차지했다. 전체 평균 점수도 72점을 기록해 5개 정예팀이 개발한 모델 중 가장 뛰어난 성능을 보였다. 이는 알리바바 '큐원3 235B'와 오픈AI의 'GPT-OSS 120B'의 성능도 넘은 수준이다.

네이버는 상대적으로 크기가 작은 경량화 모델이다 보니 주요 지표에서 다소 떨어진 것으로 추측된다.

5개의 모델은 모두 오픈소스 플랫폼에 등록돼 다른 기업이 이를 내려받을 수 있는데, 제3자 활용이 얼마나 자유로운지 가늠할 수 있는 라이선스 정책은 서로 달랐다. SK텔레콤과 NC AI는 각각 아파치 2.0과 MIT 라이선스를 적용했다. 둘 다 상업적 이용이 가능하고 모델을 자유롭게 수정해 배포할 수 있어 가장 제약이 적었다.

[정호준 기자 / 이진한 기자]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지