'국가대표 AI' 모델 비교해보니 … 성능은 LG, 개방성 SKT·NC
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
국가대표 인공지능(AI) 모델 개발에 나선 5개 정예팀 중 1차 단계에서 가장 뛰어난 성능을 갖춘 모델은 LG AI연구원인 것으로 나타났다.
11일 각 기업이 기술 보고서를 통해 공개한 주요 벤치마크 테스트 결과에 따르면 LG AI연구원의 'K-엑사원(EXAONE)'이 다른 모델 대비 높은 점수를 기록했다.
LG AI연구원에 따르면 K-엑사원은 독자 AI 파운데이션 모델 프로젝트의 1차 평가 기준인 13개의 벤치마크 테스트 가운데 10개에서 1위를 차지했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
13개 항목 중 10개서 1위
SKT·NC 모델은 누구나 이용
자유롭게 수정·배포도 가능

국가대표 인공지능(AI) 모델 개발에 나선 5개 정예팀 중 1차 단계에서 가장 뛰어난 성능을 갖춘 모델은 LG AI연구원인 것으로 나타났다. 모델 개방성 측면에서는 SK텔레콤과 NC AI가 두드러졌다.
11일 각 기업이 기술 보고서를 통해 공개한 주요 벤치마크 테스트 결과에 따르면 LG AI연구원의 'K-엑사원(EXAONE)'이 다른 모델 대비 높은 점수를 기록했다.
전문 분야 문제를 포함하는 고난도 한국어 벤치마크인 'KMMLU-Pro'에서는 SK텔레콤이 68.1점, LG AI연구원이 67.3점으로 각각 1위와 2위를 차지했고, 네이버와 업스테이지가 근소한 차이로 뒤를 이었다.
영어 중심의 다중 처리 능력과 종합 지식을 판단하는 'MMLU-Pro' 테스트에서는 LG AI연구원이 83.8점을 기록했으며, SK텔레콤과 업스테이지가 각각 2위, 3위를 차지했다.
수학 능력을 평가하는 AIME 2025, 코딩 능력을 보는 라이브코드벤치(LiveCodeBench)에서도 LG AI연구원이 타 모델 대비 고득점을 기록했다. LG AI연구원에 따르면 K-엑사원은 독자 AI 파운데이션 모델 프로젝트의 1차 평가 기준인 13개의 벤치마크 테스트 가운데 10개에서 1위를 차지했다. 전체 평균 점수도 72점을 기록해 5개 정예팀이 개발한 모델 중 가장 뛰어난 성능을 보였다. 이는 알리바바 '큐원3 235B'와 오픈AI의 'GPT-OSS 120B'의 성능도 넘은 수준이다.
네이버는 상대적으로 크기가 작은 경량화 모델이다 보니 주요 지표에서 다소 떨어진 것으로 추측된다.
5개의 모델은 모두 오픈소스 플랫폼에 등록돼 다른 기업이 이를 내려받을 수 있는데, 제3자 활용이 얼마나 자유로운지 가늠할 수 있는 라이선스 정책은 서로 달랐다. SK텔레콤과 NC AI는 각각 아파치 2.0과 MIT 라이선스를 적용했다. 둘 다 상업적 이용이 가능하고 모델을 자유롭게 수정해 배포할 수 있어 가장 제약이 적었다.
[정호준 기자 / 이진한 기자]
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- 음식에 진심, ‘빨리빨리’ 문화까지…한국과 닮은 의외의 국가 [여행人터뷰] - 매일경제
- “그래도 한국인들 쿠팡 계속 쓴다 했지?”…앱 설치 연중최대 찍었다 - 매일경제
- 아들과 말다툼하다 흉기로 찔러 살해한 60대 교수…검찰, 징역 7년 구형 - 매일경제
- “언감생심, 월급모아 집 산다고?”…서울 아파트 2.5배 뛸 때 임금 40% 올라 - 매일경제
- “더 늦기 전에 올라타자”…개미들 일주일간 삼성전자 3조 폭풍 순매수 - 매일경제
- 베센트 “관세 무효 판결 나와도 환급할 돈 충분” - 매일경제
- [속보] 민주 원내대표 선거 과반 득표자 없어…한병도·백혜련 결선투표 - 매일경제
- “부처님도 등 돌릴듯” 폭력전과 39범 스님…동거녀에 ‘난도질’ 협박 - 매일경제
- “치매 엄마 위해”…‘누적 1조 매출’ 안선영 방송 포기한 사연 - 매일경제
- “성공할 확률 높아”…‘52억 FA’ LG 장현식, 지난해 아쉬움 털어내고 올 시즌 반등할까 - MK스포