영어학원 뿌린 돈이 얼만데…100가지 언어 술술 ‘그놈’이 나타났다

이덕주 기자(mrdjlee@mk.co.kr) 2023. 8. 23. 18:36
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

음성 텍스트 전환 자유자재
한국어 일본어 스페인어 등 지원
“특정언어 말하면 3개어 동시 통역”

페이스북 모기업인 메타플랫폼(메타)이 100여개 언어를 통역 및 번역하는 AI(인공지능) 모델을 출시했다.

메타 플랫폼의 로고 [사진출처 = 로이터 연합뉴스]
메타는 22일(현지시간) ‘심리스M4T’(SeamlessM4T)라는 이름의 새로운 AI 모델을 홈페이지를 통해서 공개했다. M4T는 ‘대규모 다국어 및 멀티모달 기계 번역’(Massively Multilingual and Multimodal Machine Translation)을 뜻하며 100여개의 언어를 지원한다.

텍스트(문자)를 텍스트로 번역하거나, 스피치(음성)를 텍스트로 바꿀 경우 100개 언어가 제공된다. 다만 텍스트를 스피치로 바꾸거나 스피치를 스피치로 통역할 경우에는 35개 언어만 지원한다. 영어, 중국어, 스페인어, 포르투갈어, 일본어 등 사용자가 많은 언어뿐만 아니라 한국어, 스웨덴어, 태국어 등 여러 언어를 지원하고 있다.

메타 플랫폼의 로고 [사진출처 = 로이터 연합뉴스]
메타는 “이전에는 서로 다른 모델에서만 사용할 수 있었던 기술을 결합해 100개 언어를 지원할 수 있도록 했다”며 “이는 언어 차이를 넘어 실시간 의사소통을 가능하게 하는 잠재적 기반이 될 것”이라고 설명했다. 메타는 이 AI 가 더글러스 애덤스의 소설 ‘은하수를 여행하는 히치하이커를 위한 안내서’에 등장하는 어떤 언어라도 번역할 수 있는 물고기인 ‘바벨피시’와 유사하다고 설명했다.

심리스M4T는 총 47만시간 이상의 데이터를 포함한 심리스얼라인이라는 데이터셋을 통해 학습됐다. 텍스트 데이터는 위키피디아, 뉴스 소스, 대본화된 연설 등에서 추출된 문장들에서 나왔으며, 음성 데이터는 공개된 웹데이터에서 얻은 4백만 시간의 원본 오디오로부터 수집됐다.

마크 저커버그 최고경영자(CEO)는 자신의 페이스북을 통해 “우리는 이 모델을 순차적으로 페이스북, 인스타그램, 와츠앱, 스레드 등에 적용할 것”이라고 밝혔다.

메타가 공개한 심리스M4T 데모에서는 특정 언어로 말하면 이것을 3가지 언어로 동시에 통·번역해준다. 한국어로 ‘안녕하세요’라고 말하면 영어, 일본어, 중국어로 번역된 텍스트와 스피치가 모두 생성된다.

메타에 따르면 심리스M4T 의 능력은 비슷한 음성-언어인식 모델인 오픈AI 의 위스퍼보다 뛰어나다. 다만 각 언어 간 번역 품질에 대해서는 공개하지 않았다.

메타는 생성형 AI의 기반이 되는 대규모 언어모델(LLM) 라마(LLaMA) 2처럼 이 AI 모델도 일반에 공개했다. 다만 라마 2 처럼 상업적인 용도로 사용할 수는 없고 학술적인 용도로만 사용 가능하다.

메타는 자신들의 ‘책임감 있는(Responsible) AI’ 원칙에 따라 AI 를 학습시켰다고 설명했다. 증오나 폭력, 욕설 또는 학대를 선동할 수 있는 유해 단어 및 민감한 단어를 식별하는 시스템도 탑재됐다고 설명했다.

AI 를 사용해 언어를 번역하거나 통역하는 서비스는 이미 많이 출시된 상태다. 하지만 심리스M4T 처럼 100여개의 언어와 이 언어의 음성까지 인식해서 제공히는 서비스는 없었다. 구글은 어시스턴트를 통해 통역 서비스를 제공하고 있다. 최근 국내에 구독서비스를 출시한 인공지능 번역 서비스인 딥엘(DeepL)은 30여개 언어의 번역을 제공한다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?