'한국형 오픈 LLM' 평가 플랫폼 나온다…업스테이지·NIA '맞손'

김승준 기자 2023. 9. 5. 16:40
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

한국형 오픈소스 거대언어모델(LLM)의 성능을 비교할 수 있는 플랫폼이 만들어진다.

업스테이지는 NIA의 인공지능 학습용 데이터 제공 플랫폼인 AI Hub의 한국어 데이터를 활용해 '오픈-코(Open-Ko) LLM 리더보드'를 9월 내 구축할 계획이다.

업스테이지는 "AI Hub의 데이터를 바탕으로 한국 문화 정서를 담아낼 수 있는 고품질의 LLM을 개발하는 것을 넘어 국내 LLM 독립을 위한 생태계 조성에 기여할 계획"이라고 설명했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

업스테이지는 한국지능정보사회진흥원, 'AI 허브(Hub) 데이터 활용 업무협약' 체결 (업스테이지 제공) 2023.09.05 /뉴스1

(서울=뉴스1) 김승준 기자 = 한국형 오픈소스 거대언어모델(LLM)의 성능을 비교할 수 있는 플랫폼이 만들어진다.

인공지능(AI) 스타트업 업스테이지는 한국지능정보사회진흥원(NIA)과 'AI 허브(Hub) 데이터 활용 업무협약'을 체결했다고 5일 밝혔다.

업스테이지는 NIA의 인공지능 학습용 데이터 제공 플랫폼인 AI Hub의 한국어 데이터를 활용해 '오픈-코(Open-Ko) LLM 리더보드'를 9월 내 구축할 계획이다.

이 리더보드에서는 한국어를 기반으로 한 LLM의 성능을 평가하고 순위를 매긴다. 추론과 상식 능력, 언어 이해 종합능력 및 환각 현상 방지 등 4가지 지표와 더불어 NIA와 학계 등 신뢰할 만한 데이터를 기반으로 윤리, 전문가 지식 등 추가 기준으로 모델을 평가한다.

업스테이지는 "AI Hub의 데이터를 바탕으로 한국 문화 정서를 담아낼 수 있는 고품질의 LLM을 개발하는 것을 넘어 국내 LLM 독립을 위한 생태계 조성에 기여할 계획"이라고 설명했다.

NIA는 이번 협력으로 업스테이지의 1T클럽에도 가입, 양질의 데이터를 제공한다. 지난달 출범한 1T클럽은 1억 단어 이상의 한국어 데이터를 기여하는 파트너와 협력하고 있다.

1T클럽 파트너들은 업스테이지가 자체 제작하는 LLM의 API(응용 프로그래밍 인터페이스)를 할인된 가격으로 사용하고, API 사업으로 창출될 수익을 공유받는다.

업스테이지는 파트너사가 제공하는 데이터를 학습 용도로만 사용하고 원문 추출이 불가능하도록 보안과 개인정보보호에 만전을 기할 계획이다.

김성훈 업스테이지 대표는 "한국형 LLM 성능과 혁신성을 증명하고 AI 발전과 보급을 위해 노력하겠다"고 말했다.

seungjun241@news1.kr

Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.

이 기사에 대해 어떻게 생각하시나요?