"듣고 말하기 척척" 100개국어 마스터AI 등장

이덕주 기자(mrdjlee@mk.co.kr) 2023. 8. 23. 17:30
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

메타 '심리스M4T' 공개
페북·인스타그램에 적용 예정

페이스북 모기업인 메타플랫폼(메타)이 100여 개 언어를 통·번역하는 인공지능(AI) 모델을 출시했다.

메타는 22일(현지시간) '심리스M4T'라는 이름의 새로운 AI 모델을 홈페이지를 통해 공개했다. M4T는 '대규모 다국어 및 멀티모달 기계 번역'을 뜻하며 100여 개 언어를 지원한다.

텍스트(문자)를 텍스트로 번역하거나 스피치(음성)를 텍스트로 바꿀 때 100개 언어가 제공된다. 다만 텍스트를 스피치로 바꾸거나 스피치를 스피치로 통역할 때는 35개 언어만 지원한다. 영어, 중국어, 스페인어, 포르투갈어, 일본어 등 사용자가 많은 언어뿐만 아니라 한국어, 스웨덴어, 태국어 등 여러 언어를 지원하고 있다.

메타는 "이전에는 서로 다른 모델에서만 사용할 수 있었던 기술을 결합해 100개 언어를 지원할 수 있도록 했다"며 "이는 언어 차이를 넘어 실시간 의사소통을 가능하게 하는 잠재적 기반이 될 것"이라고 설명했다.

심리스M4T는 총 47만시간 이상의 데이터를 포함한 심리스얼라인이라는 데이터셋을 통해 학습됐다. 텍스트 데이터는 위키피디아, 뉴스 등에서 추출된 문장들에서 나왔으며, 음성 데이터는 공개된 웹 데이터에서 얻은 400만시간의 원본 오디오에서 수집됐다. 마크 저커버그 메타 최고경영자(CEO)는 자신의 페이스북을 통해 "이 모델을 순차적으로 페이스북, 인스타그램 등에 적용할 것"이라고 밝혔다.

메타가 공개한 심리스M4T 데모는 특정 언어로 말하면 이것을 3가지 언어로 동시에 통·번역해준다. 한국어로 '안녕하세요'라고 말하면 영어, 일본어, 중국어로 번역된 텍스트와 스피치가 모두 생성된다.

메타에 따르면 심리스M4T의 능력은 비슷한 음성·언어인식 모델인 오픈AI의 위스퍼보다 뛰어나다. 다만 각 언어 간 번역 품질에 대해서는 공개하지 않았다. AI를 사용해 언어를 통·번역하는 서비스는 이미 많이 출시돼 있다. 하지만 심리스M4T처럼 100여 개 언어와 이 언어의 음성까지 인식해 제공하는 서비스는 없었다.

[실리콘밸리 이덕주 특파원]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?