업스테이지, LLM '솔라' 지원 언어 아시아권으로 확대

민단비 2024. 5. 9. 09:14
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

인공지능(AI) 기술 기업 업스테이지가 자사 거대언어모델(LLM) '솔라'의 지원 언어를 일본어, 태국어 등 아시아권 언어로 확대해 시장 확장에 나선다.

업스테이지는 이를 통해 고품질의 저자원 언어 데이터를 확보, 자사의 사전학습 LLM 솔라의 지원 언어를 더욱 확장해 동남아시아 등 다양한 지역별 언어에 특화된 맞춤형 모델을 개발하겠다는 전략이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

AI 언어 데이터 기업 플리토와 MOU
연내 일본어·태국어 지원...지역별 특화 모델 개발
권순일 업스테이지 부사장(오른쪽)과 이정수 플리토 대표가 지난 8일 서울 삼성동 플리토 사무실에서 열린 협약식에서 기념촬영을 하고 있다. ⓒ업스테이지

인공지능(AI) 기술 기업 업스테이지가 자사 거대언어모델(LLM) '솔라'의 지원 언어를 일본어, 태국어 등 아시아권 언어로 확대해 시장 확장에 나선다.

업스테이지는 AI 언어 데이터 기업 플리토와 AI 언어 데이터 구축을 위한 업무협력 협약(MOU)를 체결했다고 9일 밝혔다.

현재 빅테크 기업이 주도하는 LLM 개발은 영어에 편중돼, 상대적으로 아시아권의 언어는 학습 데이터가 부족한 실정이다. 이에 양사는 업무협력을 통해 일본어, 태국어 등 다국어 언어 데이터를 구축, 저자원 언어도 고품질 LLM을 개발할 수 있도록 기반 다지기에 나선다.

업스테이지는 이를 통해 고품질의 저자원 언어 데이터를 확보, 자사의 사전학습 LLM 솔라의 지원 언어를 더욱 확장해 동남아시아 등 다양한 지역별 언어에 특화된 맞춤형 모델을 개발하겠다는 전략이다. 솔라는 현재 한국어, 영어를 지원하며 연내 일본어와 태국어까지 지원 언어를 확대할 예정이다.

플리토는 이번 협약을 바탕으로 언어 모델의 고도화에 적극적으로 기여할 뿐 아니라, 다국어 병렬 말뭉치 구축 노하우와 저작권 이슈가 없는 텍스트·이미지·음성 데이터셋을 통해 자사 언어 수집 기술 경쟁력을 높인다는 계획이다.

김성훈 업스테이지 대표는 “언어모델로 촉발된 생성형 AI 열풍이 전 세계를 뒤흔들고 있는 상황에서 양질의 언어 데이터 확보는 필수적인 과제”라며 “업스테이지는 이번 플리토와의 협력을 통해 전 세계 더 많은 사람들이 생성형 AI 혁신을 경험할 수 있도록 데이터 고도화에 나설 것”이라고 말했다.

Copyright © 데일리안. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?