미디어그룹 ‘사람과숲’, 한국어 특화 LLM 리더보드에서 1위 재탈환
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
미디어그룹인 '사람과숲'은 한국정보화진흥원(NIA)과 업스테이지가 주최하는 한국어 '초거대 언어 모델'(LLM) 리더보드인 'Open Ko-LLM'에서 1위를 차지했다고 16일 밝혔다.
이번 리더보드 개발 경쟁에서 1위를 차지한 사람과숲의 LLM은 'HumanF-MarkrAI/COKAL-DPO-13b-v2'다.
하지만 사람과숲은 4주간 1위를 차지했을 뿐 아니라 꾸준히 연구개발에 나선 결과 이번 LLM 리더보드에서 최고 점수인 52.69를 기록했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
미디어그룹인 ‘사람과숲’은 한국정보화진흥원(NIA)과 업스테이지가 주최하는 한국어 ‘초거대 언어 모델’(LLM) 리더보드인 ‘Open Ko-LLM’에서 1위를 차지했다고 16일 밝혔다.
이번 리더보드 개발 경쟁에서 1위를 차지한 사람과숲의 LLM은 ‘HumanF-MarkrAI/COKAL-DPO-13b-v2’다. ‘사람과숲’이 마커와 컨소시엄을 이뤄 공동 개발한 것이다. 글로벌 IT 기업 메타에서 오픈소스로 공개한 ‘라마2’를 파운데이션 모델로 삼고 자체적으로 수집·가공한 데이터에 인스트럭트 파인 튜닝을 거쳐 개발했다.
이번 리더보드는 LLM의 한국어 성능을 겨뤄 순위를 매겼다. 50개 이상의 개인 및 조직에서 100개 이상의 LLM이 제출됐다. LLM에 대한 △추론 능력 △상식 능력 △언어 이해력 △환각 방지 능력 △한국어 상식 생성 능력 등 5가지 평가 지표에 따라 점수를 매겼고 ‘HumanF-MarkrAI/COKAL-DPO-13b-v2’ 모델이 평균 점수 52.69으로 1위를 기록했다.
‘사람과숲’은 지난 9월 28일 리더보드에서 1위를 한 이후 4주간 수차례 1위를 해왔으나 지난 1일 주최 측에서 측정지표를 바꾸면서 2순위로 밀렸다. 하지만 사람과숲은 4주간 1위를 차지했을 뿐 아니라 꾸준히 연구개발에 나선 결과 이번 LLM 리더보드에서 최고 점수인 52.69를 기록했다.
해당 연구를 이끈 정철현 박사는 “이번 LLM은 AI-허브의 한국어 공공 행정 문서와 민원 응대 데이터가 주요 데이터 소스로 활용됐다”며 “이 LLM은 공공 행정 업무를 수행하는 챗봇을 위해 튜닝한 것이지만 종합 성능이 국내 1위 수준으로 더 다양한 용도로도 활용할 수 있다”고 전했다. 한윤기 미디어그룹사람과숲 대표는 “향후 한국어 특화 LLM 리더보드가 좀 더 활성화 되어 한국어 AI의 기술 발전에 계속 기여하고, 특히 공공 행정 분야에서 가장 사랑받는 ‘한국형 챗GPT’를 만들어 나가겠다”고 포부를 밝혔다.
한준규 기자
Copyright © 서울신문. 무단전재 및 재배포 금지.
- 한동훈 장관 부인 진은정씨 첫 공개행보 [포토多이슈]
- 한고은 “어떤 남자가 쇠톱으로 집 창살 잘랐다” 소름
- 만취한 여성 ‘집단 성폭행’…몰래 찍은 ‘홈캠’ 동영상에 딱 걸렸다
- “억울하다” 목에 흉기 갖다 댄 女…경찰, 제압에 걸린 시간은 ‘3초’
- “자녀 학교에 나체사진 유포하겠다”…2만 4000% 이자
- 하마스에 납치된 3세 여아…총맞은 아빠 품속서 기어나왔다
- 추신수♥하원미, 5500평 美대저택 공개 “화장실 14개”
- “퇴근길 날벼락”…홍대 가림막 사고에 결국 ‘뇌사판정’ 받은 행인
- 이정은, 뺑소니범 잡았다…“블랙박스 2시간 뒤졌다”
- 교사가 닫은 문에 4세 아이 손가락 절단…“CCTV 영상 삭제돼”