한국어 LLM 리더보드 ‘업그레이드’ 추론·산출추론 지표 추가
한국지능정보사회진흥원(원장 황종성, 이하 NIA)과 업스테이지(대표 김성훈(성킴))가 공동 운영하는 ‘Open Ko-LLM 리더보드’가 평가 지표를 추가하고 업그레이드되어 운영될 예정이다.
‘Open Ko-LLM 리더보드’는 지난해 9월, 민관 협업을 통해 개설되어 학계 및 업계 다양한 참여자들로부터 큰 관심을 받고 있으며, 지난 5월 말까지 참여한 LLM(초거대언어모델) 모델 수가 1,500개를 넘어섰고, 최고 점수는 70.7점을 기록했다.
이는 세계적으로 인정받는 허깅페이스의 LLM 리더보드(최고점 81.2점)에 근접한 수치로, 한국어 LLM이 발전하고 있음을 입증하는 결과다.
NIA와 업스테이지는 Open Ko-LLM 리더보드의 지속적인 발전과 개선을 위해 우선 추론 관련 지표를 추가하여 운영할 계획이다.
이번에 추가하는 지표는 허깅페이스의 오픈 LLM 리더보드에서 사용되는 평가지표 중 ‘추론 능력’ 및 ‘산출 추론 능력’ 두 개 지표로 해당 지표를 한국어에 맞게 적용함으로써, 한국어 모델의 성능 평가 체계를 국제 평가 기준과 대등한 수준으로 끌어올리는 계기가 될 것이다.
추가 지표는 AI 언어 데이터 전문 기업인 플리토가 참여하여 한국어에 맞게 번역 및 개발을 지원하였다.
NIA 황종성 원장은 “NIA와 업스테이지는 한국어 LLM 발전을 위해 리더보드 평가 지표 및 체계를 지속적인 개선할 방침”이며, “이를 통해 국내외 AI 연구자들 사이에서 더욱 활발한 교류와 협력이 이루어질 것으로 기대하고 있다”고 밝혔다.
또한 공동 운영기관인 업스테이지의 박찬준 리더는 “한국의 LLM 평가의 표준으로 인정받는 만큼, 책임감 있는 운영을 위해 지속적으로 NIA와 노력하겠다”고 포부를 밝혔다.
이번 업그레이드는 6월부터 적용되며, AI허브 사이트의 리더보드 메뉴에서 확인 할 수 있다.
안충기 기자 newnew9@joongang.co.kr
Copyright © 중앙일보. 무단전재 및 재배포 금지.
- "저 말 들어야 해?" 윤 터졌다…'형' 부르던 박범계의 훈시 | 중앙일보
- 40대 체육교사, 여고생과 부적절 교제…대전교육청 발칵 | 중앙일보
- "어떤 나라보다 한국 이득"…현대차 뒤바꿀 '150㎝ 기인' | 중앙일보
- "보험살인 엄인숙 보자마자 예뻐서 놀라…동생 입원 중 갑자기 임신" | 중앙일보
- 112 너머로 아이 울음소리만…1300세대 아파트서 발신지 찾은 경찰 | 중앙일보
- '야인시대' 정일모 "실제 주먹세계 조직 보스였다" 충격 고백 | 중앙일보
- 박세리 부친, 박세리 재단에 고소 당했다…사문서 위조 혐의 | 중앙일보
- 백종원 "이러면 홍콩반점 다 망한다"…'촬영 거부' 점주에 버럭 | 중앙일보
- '단군 이래 최대 재건축' 비상…둔촌주공 '중품아' 무산되나 | 중앙일보
- 유재환 "죽었다가 깨어났다"…5일 전 쓴 유서 공개한 이유 | 중앙일보