업스테이지, 한국형 LLM 생태계 구축 잰걸음…'1T 클럽' 발족
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
인공지능(AI) 스타트업 업스테이지가 가장 '한국적인' 거대언어모델(LLM)을 개발하기 위해 머리를 맞댑니다.
업스테이지는 고성능 LLM에 쓰이는 한국어 데이터 확보를 위해 '1T 클럽'(1조 토큰 클럽)을 발족한다고 오늘(14일) 밝혔습니다.
1억 단어 이상 한국어 데이터에 기여할 수 있는 파트너사로 구성되며 현재 언론사·기업, 학계 등 데이터 제공자 20여 곳과 파트너십을 위해 협의하고 있습니다.
업스테이지는 확보한 데이터로 한국 문화·정서를 담아낼 수 있는 거대언어모델을 개발하고 다양한 분야의 생성 인공지능 애플리케이션에 활용한다고 설명했습니다.
이어 업스테이지는 기여한 토큰 수에 비례해 거대언어모델 응용프로그램 인터페이스(API)를 사용할 수 있는 비용을 할인하고. 사업 수익 일부를 파트너사들에 지급합니다.
또 파트너사들이 제공하는 데이터는 한글 프리트레이닝 학습 용도로만 사용하며, 원문을 유출할 수 없도록 자체 탈옥 방지 기술을 적용합니다.
이를 통해 인공지능이 데이터를 자동으로 수집·분류·저장하는 '크롤링'으로 발생하는 저작권 문제 등을 해결하고, 데이터 제공자와 모델 제작자 모두가 혜택을 볼 수 있도록 운영할 수 있다고 설명했습니다.
앞서 업스테이지가 자체 개발한 메타 '라마-2' 파인튜닝(미세조정) 거대언어모델은 머신러닝 플랫폼 '허깅페이스'에서 운영하는 오픈 거대언어모델(LLM) 리더보드에서 72.3점으로 1위를 차지한 바 있습니다.
짧고 유익한 Biz 숏폼 바로가기
저작권자 SBS미디어넷 & SBSi 무단전재-재배포 금지
Copyright © SBS Biz. 무단전재 및 재배포 금지.
- "애들아, 집은 다음에 줄게"…稅 부담에 증여 대신 매매
- 삼성표 '생성형 AI' 나온다…10월 테스트 시작
- 캠핑카 변신한 아빠차 '산타페'...출시 가격은?
- '10조' 넘게 몰렸다…은행권은 '엔화예금' 열풍? [손에 잡히는 재테크]
- 휘발유 싸다는 곳도 1700원...유류세 다시 오르면 2천원
- 서비스로 차별화…불황 극복 나선 건설업계
- 오늘 '광복절 특사'…재계 총수 대거 포함 전망
- "이 정도면 김치가 아니라 금치"...태풍 피해에 더 오른다?
- '신의 직장' 금융공기업, 모호한 채용공고 적발
- 서민금융 우수대부업 제도 '유명무실'…은행 차입 자금 잔액 줄어