뉴엔AI 'QuettaLLMs', K-AI 리더보드 1위 올라
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
인공지능(AI) 트렌드 분석 플랫폼 전문 기업 뉴엔AI(대표 배성환)는 자사의 거대언어모델(LLM) 'QuettaLLMs(모델명: QuettaLLMs-27B-Koreasoner-V3)'가 국내 AI 성능 평가의 표준으로 꼽히는 'K-AI 리더보드'에서 종합 1위를 달성했다고 10일 밝혔다.
과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 관리하는 'AI 허브' 기반의 'K-AI 리더보드'는 한국 현지 환경에 최적화된 AI 성능을 공인하는 평가 체계다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
CLIcK·KMMLU-Pro 등 고난도 벤치마크서 전 분야 고득점 획득
인공지능(AI) 트렌드 분석 플랫폼 전문 기업 뉴엔AI(대표 배성환)는 자사의 거대언어모델(LLM) 'QuettaLLMs(모델명: QuettaLLMs-27B-Koreasoner-V3)'가 국내 AI 성능 평가의 표준으로 꼽히는 'K-AI 리더보드'에서 종합 1위를 달성했다고 10일 밝혔다.
과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 관리하는 'AI 허브' 기반의 'K-AI 리더보드'는 한국 현지 환경에 최적화된 AI 성능을 공인하는 평가 체계다. K-AI 리더보드는 한국어 특유의 문화적·언어적 이해도를 측정하는 'CLIcK'과 변호사·회계사 등 전문직 자격시험을 바탕으로 고난도 추론 능력을 평가하는 'KMMLU-Pro' 등 엄격한 벤치마크를 통해 순위를 결정한다.

뉴엔AI는 이번 1위가 단순한 모델 규모의 경쟁을 넘어선 '벤치마크 최적화 전략'에 있다고 평가했다. 최근 LLM 시장은 파라미터(매개변수)의 크기뿐만 아니라 미세조정(Fine-tuning) 데이터의 질, 양자화 및 전이 학습 전략에 따라 실질적인 성능이 결정되는 추세다.
뉴엔AI는 다년간 온라인 트렌드 데이터를 분석하며 축적해온 고품질의 구어체 데이터셋을 학습에 투입해 성능을 극대화했다. 자체 최적화 알고리즘을 통해 베이스 모델이 가진 본연의 추론 능력은 보존하면서도, 한국어 특유의 문법적 미묘함과 맥락 이해도는 비약적으로 향상시켰다는 자체 분석이다.
실제 평가 결과에서도 뉴엔AI의 저력은 증명됐다. 한국어 지식 측정 지표인 'CLIcK'에서 0.794점, 복합 추론 능력을 평가하는 'KMMLU-Pro'에서 0.676점을 기록하는 등 전 분야에서 고른 고득점을 획득하며 기술적 완성도를 입증했다.
이번 모델 개발을 주도한 뉴엔AI 김광수 부장은 “이번 성과는 모델의 규모보다 데이터에 대한 깊은 이해와 수행 과제에 최적화된 학습이 한국어 특화 성능을 결정짓는 핵심임을 입증한 사례”라며, “앞으로도 한국어 맥락에 최적화된 고성능 언어모델을 지속적으로 고도화해 국내 AI 생태계 발전에 기여할 것”이라고 강조했다.
이경민 기자 kmlee@etnews.com
Copyright © 전자신문. 무단전재 및 재배포 금지.
- 추경 26.2조 틀 유지…여야, 세부 사업 줄다리기
- 피지컬 AI, 2035년 1억4500만대 전망…휴머노이드 급부상
- 정부·공공 AI 학습용 데이터 전수조사…100종 공개 목표
- 네타냐후, 총성 멈추자 바로 '법정행'…'부패 재판' 멈추려 남의 나라 때렸나
- 코스피, 美·이란 대면협상 기대에 1.4% 반등…5850선 회복
- 살인범 마음은 살인범이 안다… FBI, 길고 비치 연쇄살인범과 심층 면담
- 中서 부와 행운 상징 '8'…'8888' 번호판 벤츠 땅에 묻어줬다
- 도날드 투스크 폴란드 총리, 1박 2일 방한…13일 李대통령과 정상회담
- 위세아이텍, 4개년 제조 품질 AI 국책과제 성공적 완수…제조 AX 시장 선점 가속화
- '휴전 중재자'로 트럼프에 힘 과시한 中…정상회담서 美와 '대만 빅딜' 노리나