업스테이지, NIA와 '한국형 오픈 LLM 리더보드' 만든다

남궁경 2023. 9. 5. 15:03
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

업스테이지가 한국지능정보사회진흥원과 한국형 Open LLM 리더보드 공동 구축을 통해 국내 AI 생태계 확장에 나선다.

이번 협약에 따라 업스테이지는 NIA의 인공지능 학습용 데이터 제공 플랫폼인 AI Hub에서 제공하는 다양한 분야의 한국어 데이터를 활용, 국내 AI 산업 생태계의 발전에 기여하기 위해 'Open-Ko LLM 리더보드'를 이달 내 구축할 계획이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

1T클럽 등 AI 생태계 외연 확대
'오픈 -Ko LLM리더보드’이달 출범
업스테이지 김성훈 대표(왼쪽)와 NIA 황종성 원장이 5일 광화문 NIA 서울사무실에서 AI Hub 데이터 활용 업무협약을 맺은 뒤 기념사진을 찍고 있다.ⓒ업스테이지

업스테이지가 한국지능정보사회진흥원과 한국형 Open LLM 리더보드 공동 구축을 통해 국내 AI 생태계 확장에 나선다.

업스테이지는 5일 한국지능정보사회진흥원(NIA)과 한국형 Open LLM 리더보드를 구축하기 위해 ‘AI Hub 데이터 활용 업무협약’을 체결했다고 밝혔다. 양사는 광화문 NIA 서울사무실에서 업스테이지 김성훈 대표와 NIA 황종성 원장 등 주요 경영진이 참석한 가운데 협약식을 진행했다.

이번 협약에 따라 업스테이지는 NIA의 인공지능 학습용 데이터 제공 플랫폼인 AI Hub에서 제공하는 다양한 분야의 한국어 데이터를 활용, 국내 AI 산업 생태계의 발전에 기여하기 위해 ‘Open-Ko LLM 리더보드’를 이달 내 구축할 계획이다.

오픈 LLM 모델을 평가하는 허깅페이스 오픈 LLM 리더보드의 한국 버전인 ‘Open-Ko LLM 리더보드’는 한글 기반으로 개발된 LLM들의 성능을 평가하고 순위를 매기는 플랫폼으로 기존의 추론과 상식 능력, 언어 이해 종합능력 및 환각 현상 방지 등 4가지 지표에 NIA와 학계 등 신뢰할 만한 데이터를 기반으로 윤리, 전문가 지식 등 추가 기준을 개설, 모델을 평가한다.

업스테이지는 지난 8월 허깅페이스가 운영하는 오픈 LLM 리더보드에서 자사의 생성 AI 모델이 세계 최고 수준의 성능을 기록하며 1위를 차지했다. 이번 NIA와 협력을 통해 공동으로 리더보드를 구축, 업스테이지는 AI Hub의 데이터를 바탕으로 한국 문화 정서를 담아낼 수 있는 고품질의 LLM을 개발하는 것을 넘어 이를 국내 LLM 독립을 위한 생태계 조성에 기여할 계획이다.

NIA는 이번 협력을 통해 업스테이지의 1T 클럽에도 가입, 양질의 데이터를 제공키로 약속했다. 업스테이지의 1T 클럽은 지난달 출범해 텍스트, 책, 기사 등 다양한 형태의 1억 단어 이상의 한국어 데이터를 기여하는 파트너들과 협력하고 있으며, 이를 통해 인공지능 거대언어모델 개발을 위한 AI 생태계의 외연을 확대하고 있다.

업스테이지의 1T 클럽은 ‘1 Trillion 토큰 클럽’을 의미하는 것으로, 파트너들은 업스테이지가 자체 제작하는 LLM의 API를 할인된 가격에 사용할 수 있으며, LLM의 API 사업으로 창출될 수익을 공유 받을 수 있다. 업스테이지는 파트너사들이 제공하는 데이터를 모델의 학습 용도로만 사용하고, 원문 추출이 불가능하도록 보안과 개인정보보호에 만전을 기할 계획이다.

업스테이지 김성훈 대표는 "NIA와의 협약을 통해 한국어 데이터 부족 문제를 해결하고, 국내외 시장에서 경쟁력 있는 인공지능 플랫폼을 제공할 수 있게 됐다"며 "NIA와 함께 한국형 Open LLM 리더보드를 통해 국내 LLM들의 성능과 혁신성을 증명하고, 인공지능의 발전과 보급에 노력하겠다"고 말했다.

NIA는 AI Hub를 통해 다양한 분야의 데이터를 수집하고 가공하여 인공지능 개발자들에게 무료로 제공하고 있다. NIA는 2025년까지 1300여 종의 데이터를 구축할 계획이며, 이를 통해 국내 인공지능 산업의 성장과 활성화에 기여할 예정이다.

NIA 황종성 원장은 “글로벌에서도 인정받는 AI 스타트업 업스테이지와의 협약을 통해 AI Hub의 데이터가 국내외 인공지능 시장에서 활용될 수 있게 됐다"며 "한국형 Open LLM 리더보드를 통해 국내 LLM들의 수준과 다양성을 높이고, 인공지능 생태계 구축에 더욱 힘쓰겠다"고 했다.

Copyright © 데일리안. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?