“AI 한국어 데이터 확보 총력”… 업스테이지, ‘1T클럽’ 발족

남혜정 기자 2023. 8. 15. 03:02
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

인공지능(AI) 스타트업 업스테이지가 한국어 데이터 부족 문제를 해결하고 국내 독자적인 고성능 거대언어모델(LLM) 개발 생태계를 조성하기 위한 '1T 클럽'을 발족한다고 14일 밝혔다.

현재 업스테이지는 20여 언론사와 기업, 대학 등 데이터 제공자들과 파트너십을 위한 협의를 진행 중이다.

업스테이지는 확보한 데이터로 한국 문화와 정서를 담아낼 수 있는 고품질 LLM을 개발하고 다양한 분야의 생성 AI 애플리케이션에 활용할 예정이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

인공지능(AI) 스타트업 업스테이지가 한국어 데이터 부족 문제를 해결하고 국내 독자적인 고성능 거대언어모델(LLM) 개발 생태계를 조성하기 위한 ‘1T 클럽’을 발족한다고 14일 밝혔다.

1T 클럽은 ‘1조(Trillion) 토큰 클럽’의 약자다. 1억 단어 이상의 한국어 데이터에 기여하는 파트너사들로 구성될 예정이다. 현재 업스테이지는 20여 언론사와 기업, 대학 등 데이터 제공자들과 파트너십을 위한 협의를 진행 중이다.

업스테이지는 확보한 데이터로 한국 문화와 정서를 담아낼 수 있는 고품질 LLM을 개발하고 다양한 분야의 생성 AI 애플리케이션에 활용할 예정이다. 제공된 데이터는 탈옥방지 기술을 적용해 원문 유출을 원천적으로 차단할 계획이다.

남혜정 기자 namduck2@donga.com

Copyright © 동아일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?