'국가대표 AI' 모델 비교해보니 … 성능은 LG, 개방성 SKT·NC

LG K-엑사원 독자 AI 평가서
13개 항목 중 10개서 1위
SKT·NC 모델은 누구나 이용
자유롭게 수정·배포도 가능

국가대표 인공지능(AI) 모델 개발에 나선 5개 정예팀 중 1차 단계에서 가장 뛰어난 성능을 갖춘 모델은 LG AI연구원인 것으로 나타났다. 모델 개방성 측면에서는 SK텔레콤과 NC AI가 두드러졌다.

11일 각 기업이 기술 보고서를 통해 공개한 주요 벤치마크 테스트 결과에 따르면 LG AI연구원의 'K-엑사원(EXAONE)'이 다른 모델 대비 높은 점수를 기록했다.

전문 분야 문제를 포함하는 고난도 한국어 벤치마크인 'KMMLU-Pro'에서는 SK텔레콤이 68.1점, LG AI연구원이 67.3점으로 각각 1위와 2위를 차지했고, 네이버와 업스테이지가 근소한 차이로 뒤를 이었다.

영어 중심의 다중 처리 능력과 종합 지식을 판단하는 'MMLU-Pro' 테스트에서는 LG AI연구원이 83.8점을 기록했으며, SK텔레콤과 업스테이지가 각각 2위, 3위를 차지했다.

수학 능력을 평가하는 AIME 2025, 코딩 능력을 보는 라이브코드벤치(LiveCodeBench)에서도 LG AI연구원이 타 모델 대비 고득점을 기록했다. LG AI연구원에 따르면 K-엑사원은 독자 AI 파운데이션 모델 프로젝트의 1차 평가 기준인 13개의 벤치마크 테스트 가운데 10개에서 1위를 차지했다. 전체 평균 점수도 72점을 기록해 5개 정예팀이 개발한 모델 중 가장 뛰어난 성능을 보였다. 이는 알리바바 '큐원3 235B'와 오픈AI의 'GPT-OSS 120B'의 성능도 넘은 수준이다.

네이버는 상대적으로 크기가 작은 경량화 모델이다 보니 주요 지표에서 다소 떨어진 것으로 추측된다.

5개의 모델은 모두 오픈소스 플랫폼에 등록돼 다른 기업이 이를 내려받을 수 있는데, 제3자 활용이 얼마나 자유로운지 가늠할 수 있는 라이선스 정책은 서로 달랐다. SK텔레콤과 NC AI는 각각 아파치 2.0과 MIT 라이선스를 적용했다. 둘 다 상업적 이용이 가능하고 모델을 자유롭게 수정해 배포할 수 있어 가장 제약이 적었다.

[정호준 기자 / 이진한 기자]

매일경제

IT/과학

'국가대표 AI' 모델 비교해보니 … 성능은 LG, 개방성 SKT·NC