플리토, '오픈 Ko-LLM 리더보드'에 벤치마크 데이터셋 제공
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
인공지능(AI) 언어 데이터 전문 기업 플리토는 한국어 대규모언어모델(LLM)의 성능을 비교·평가하는 '오픈 Ko-LLM 리더보드'에 벤치마크 데이터셋을 제공했다고 12일 밝혔다.
플리토는 '오픈 Ko-LLM 리더보드'를 운영 중인 업스테이지의 파트너사로서 △상식 추론과 문맥 이해 능력 △수학적 추론과 계산능력 등을 평가할 수 있는 벤치마크 데이터셋을 한국어로 제공했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
상식 추론, 수학적 추론 평가 항목 추가로 국제 평가기준 갖춰
[아이뉴스24 윤소진 기자] 인공지능(AI) 언어 데이터 전문 기업 플리토는 한국어 대규모언어모델(LLM)의 성능을 비교·평가하는 '오픈 Ko-LLM 리더보드’에 벤치마크 데이터셋을 제공했다고 12일 밝혔다.
’오픈 Ko-LLM 리더보드’는 한국지능정보사회진흥원(NIA)과 업스테이지가 함께 구축하고 운영 중인 한국어 LLM 성능 평가 플랫폼이다. 이 플랫폼은 국내 기업과 연구기관이 LLM을 등록하고 성능 경쟁을 할 수 있는 환경을 제공해 한국형 AI 개발과 자연어 처리 기술의 발전에 기여하고 있다.
플리토는 '오픈 Ko-LLM 리더보드’를 운영 중인 업스테이지의 파트너사로서 △상식 추론과 문맥 이해 능력 △수학적 추론과 계산능력 등을 평가할 수 있는 벤치마크 데이터셋을 한국어로 제공했다. 이를 통해 기존 평가 항목인 △추론 능력 △상식 능력 △언어 이해력 △환각 방지 능력 △한국어 상식 생성 능력 등 뿐만 아니라 더 풍부한 성능 테스트 비교가 가능하게 됐다.
특히 상식 추론과 수학적 추론 등 2가지 평가 항목의 추가로 국제적으로 인정받고 있는 허깅페이스의 ‘오픈 LLM 리더보드’와 평가 기준을 맞추게 돼 국내 AI 생태계 발전에 큰 의미가 있다는 회사 측의 설명이다.
플리토는 이번 데이터셋 구축 참여를 계기로 한국어 대규모 언어 모델의 성능을 평가하고 향상시키기 위한 고품질 언어 데이터 구축에 박차를 가할 예정이다. 실제로, 상용 분야에 적용된 한국어 언어모델을 평가할 수 있는 벤치마크 데이터 셋을 업스테이지와 협력해 구축 중이며, 연내 ‘Open Ko-LLM’를 통해 추가적으로 공개한다.
이정수 플리토 대표는 "이번 벤치마크 데이터셋 제공을 통해 한국어 대규모 언어 모델 리더보드가 국제적인 평가 기준을 갖췄다"며 “다년간 쌓아온 언어 데이터 구축 기술 능력을 바탕으로 한국형 인공지능 생태계 발전에 더욱 힘을 쏟겠다”고 말했다.
한편, 플리토는 지난달 9일 AI 기술 기업 업스테이지와 AI 언어 데이터 구축을 위한 업무협약을 체결했다. 양사는 태국어, 일본어, 베트남어, 라오스어, 크메르어 등 상대적으로 언어 데이터가 부족한 아시아 권역에 대한 데이터셋 구축을 중심으로 협업하기로 했다.
/윤소진 기자(sojin@inews24.com)Copyright © 아이뉴스24. 무단전재 및 재배포 금지.
- 배현진, 두산-기아전 시구 나섰다가 양쪽 모두에게 비판…이유는?
- '미스 유니버스' 도전하는 46세 엔지니어…"장벽 허물었다"
- '전신 타투' 제거했다던 한소희, 옆구리에 남겨둔 비밀스러운 '꽃 타투' 공개 [엔터포커싱]
- 권익위 "김 여사 명품백 사건 종결"…검찰만 남았다
- '초연결' 삼성 VS '공감지능' LG…AI 가전 생태계 확장 속도
- 정부 "액트지오 세금 체납, 계약 땐 몰랐다…문제는 없어"
- 동해 가스전, 7월 중 위치 확정하고 연말 시추 돌입한다
- 편의점 왕국 '흔들'…"국내 편의점은요?"
- 국회의장 "尹, 거부권 신중하게 사용해야"
- 與, 국회 보이콧 후 '정책특위' 가동…"민주 폭거 끝까지 맞설 것"