동남아 AI시장 노리는 中 알리바바

이상덕 기자(asiris27@mk.co.kr) 2023. 12. 19. 17:39
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

중국 알리바바그룹의 글로벌 연구 조직인 '다모 아카데미(Damo Academy)'가 대규모언어모델(LLM)을 출시했다고 19일 발표했다.

이 모델은 동남아시아 언어를 중심으로 설계된 것이 특징이다.

리둥빙 다모 아카데미 언어기술 연구소 소장은 "SeaLLM의 출시를 통해 기술 격차 해소에 기여하고 AI의 민주화를 촉진할 것"이라고 밝혔다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

印尼·태국·베트남 등 8개국
맞춤형 언어모델 선보여

중국 알리바바그룹의 글로벌 연구 조직인 '다모 아카데미(Damo Academy)'가 대규모언어모델(LLM)을 출시했다고 19일 발표했다. 이 모델은 동남아시아 언어를 중심으로 설계된 것이 특징이다. 각각 130억개와 70억개 파라미터 버전으로 제공된다.

동남아 LLM(Southeast Asia LLM·SeaLLM)은 베트남어, 인도네시아어, 태국어, 말레이어, 크메르어, 라오스어, 타갈로그어, 미얀마어 등 동남아 현지 언어에 최적화돼 있다. 이 지역의 문화적 구조와 법적 프레임워크에 맞춤형 조정이 가능한 대화형 모델 SeaLLM-챗을 포함한다고 설명했다.

현재 허깅 페이스(Hugging Face)에서 오픈소스로 제공된 상태다. 연구·상업적 용도로 사용할 수 있다. 리둥빙 다모 아카데미 언어기술 연구소 소장은 "SeaLLM의 출시를 통해 기술 격차 해소에 기여하고 AI의 민주화를 촉진할 것"이라고 밝혔다. 루안투안 난양공과대 교수는 "SeaLLM이 영어와 중국어 이외의 언어 사용자들에게 새로운 기회를 제공할 것"이라고 말했다.

SeaLLM의 주요 특징 중 하나는 비라틴계 언어에 대한 효율성이다. 이는 챗GPT와 같은 모델보다 더 긴 텍스트를 해석하고 처리하며, 복잡한 작업을 더 적은 토큰으로 실행한다. 이를 통해 운영 비용을 절감하고 탄소 배출을 감소시킨다는 설명이다.

130억개의 파라미터를 가진 SeaLLM-13B는 다양한 언어와 지식 관련 작업에서 뛰어난 성능을 보여준다. M3Exam 벤치마크에서는 동남아시아 언어로 된 다양한 과목에 대한 심도 있는 이해를 바탕으로 우수한 결과를 보였다. FLORES 벤치마크에서는 기계 번역에서도 높은 성능을 나타냈다고 덧붙였다.

[이상덕 기자]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?