빅테크 챗GPT 장악 맞서... 업스테이지 “LLM 독립” 선언
‘1T 클럽’은 ‘1 Trillion 토큰 클럽’을 줄인 것으로 텍스트, 책, 기사, 보고서, 논문 등 다양한 형태의 1억 단어 이상의 한국어 데이터를 기여하는 파트너사들로 구성된다.
업스테이지는 이달 초 자사가 개발한 모델이 세계 최대 머신러닝 플랫폼 허깅페이스에서 운영하는 ‘오픈 LLM 리더보드’ 평가 점수에서 72.3점을 획득, 챗GPT의 기반인 GPT-3.5 성능을 뛰어넘고 1위를 차지하며 주목을 받은 바 있다.
허깅페이스 오픈 LLM 리더보드는 오픈소스 생성 AI 모델의 바로미터로 꼽힌다. 전 세계 500여개의 오픈 모델들이 추론과 상식 능력, 언어 이해 종합능력 및 환각현상(할루시네이션) 방지 등 4가지 지표의 평균 점수로 경쟁, 공신력 있는 순위가 매겨진다. 현재 업스테이지는 73점을 돌파하는 모델을 배포, 세계 1, 2위 모델을 독식하고 있다.
’1T 클럽’은 한국어 데이터의 부족 문제 해결은 물론, 데이터 제공자와 모델 제작기업이 상생하는 생태계 확립을 통한 국내 LLM의 독립을 위해 고심한 업스테이지의 새로운 도전이다. 업스테이지는 1T클럽을 통해 한국어 데이터를 확보하고 공유함으로써, 한국문화 정서를 담아낼 수 있는 고품질의 LLM을 개발하고 이를 통해 국내 생성AI 다양한 분야의 애플리케이션에 활용, 인공지능의 발전에 기여할 수 있을 것으로 기대하고 있다.
업스테이지는 현재 20여개 언론사 및 기업, 학계 등 데이터 제공자들과 파트너십을 위한 긴밀한 협의를 진행 중이다. 또한 다양한 업계 리딩 기업들과 프라이빗 LLM 구축 협의는 물론 한국어 LLM의 발전에 기여할 다양한 분야의 파트너사들과 협력을 추진할 계획이다. ‘1T 클럽’에 관심 있는 기관은 업스테이지 공식 홈페이지를 통해 신청서를 제출할 수 있다.
업스테이지의 김성훈 대표는 “LLM은 오늘날 생성형 인공지능의 핵심 기술로, 국내 다양한 업계의 기업들도 고성능의 프라이빗 LLM을 자유롭게 활용할 수 있도록 생태계를 만드는 것이 중요하다”며 “우리는 ’1T 클럽’을 통해 데이터 제공자들의 권익을 지키고 이를 바탕으로 한국문화 정서를 담아낼 수 있는 LLM을 개발, 국내 모든 기업이 AI발전의 수혜를 볼 수 있도록 최선을 다 할 것”이라고 말했다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- 도심 한복판에 떼강도…명품 매장 습격, ‘가방·의류’ 훔쳐 달아나 - 매일경제
- “한국기업 오면 인센티브”…인구 대국이 러브콜 한 회사는 어디 - 매일경제
- “대원들이 병들어갔다”…스웨덴 참가자가 전한 잼버리 일기 ‘충격’ - 매일경제
- “혼인신고 망설인 진짜 이유?”...이제는 내집마련 길 보이네요 [매부리레터] - 매일경제
- “나 카이스트 나왔어”…유치원 교사에게 4년간 막말 쏟은 학부모 - 매일경제
- “결국 5천만원 넘었다”…확 달라진 ‘신형 싼타페’, 평균 300만원 비싸져 [왜몰랐을카] - 매일
- “광복절에 일본 여행, 어떻게 보세요”…인식조사 결과 보니 - 매일경제
- [단독] ‘바가지 수수료’ 애플…檢 ‘공정거래법’ 적용 직접수사 방침 - 매일경제
- “외로워서 관심받고 싶었다”…청량리 살인예고, 검거된 후 한 말이 - 매일경제
- 복귀 후 첫 승 거둔 류현진 “이것만 보고 재활했다” [현장인터뷰] - MK스포츠