메타, 100개 언어 번역·음성 변환하는 AI 모델 내놨다
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
페이스북, 인스타그램 운영사 메타가 텍스트와 음성을 토대로 100개 언어를 번역하거나, 말로 구현할 수 있도록 한 인공지능(AI) 모델을 내놨다.
메타는 별도 AI 모델을 하나로 결합한 '심리스(Seamless)M4T'를 출시한다고 블로그를 통해 22일(현지시간) 밝혔다.
메타 연구 과학자인 파코 구즈만은 "심리스M4T 특장점은 중간 모델에 의존하지 않고, 더 빠르게 결과를 도출할 수 있다는 것"이라고 했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
(지디넷코리아=김성현 기자)페이스북, 인스타그램 운영사 메타가 텍스트와 음성을 토대로 100개 언어를 번역하거나, 말로 구현할 수 있도록 한 인공지능(AI) 모델을 내놨다.
메타는 별도 AI 모델을 하나로 결합한 ‘심리스(Seamless)M4T’를 출시한다고 블로그를 통해 22일(현지시간) 밝혔다.
M4T는 대규모 다국어·멀티모달 기계(Massively Multilingual & Multimodal Machine)를 뜻한다. 심리스M4T는 기존 파이토치(PyTorch) 중심의 멀티태스킹 모델 아키텍처를 기반으로 구축됐으며, 이를 학습하기 위해 100만 시간의 개방형 오디오 데이터를 활용했다.
메타 연구팀은 “지원하는 리소스가 낮고, 중간 수준인 언어 성능을 개선했다”며 “영어와 스페인·독일어 등의 경우, 양질의 결괏값을 유지했다”고 전했다. 메타 연구 과학자인 파코 구즈만은 “심리스M4T 특장점은 중간 모델에 의존하지 않고, 더 빠르게 결과를 도출할 수 있다는 것”이라고 했다.
이 AI 모델은 ▲100개 언어 음성인식 ▲100개 입출력 언어에 대한 음성-문자 변환 ▲100개 입력 언어와 36개 출력 언어를 지원하는 음성 간 번역 ▲100개 언어에 대한 텍스트 간 번역 ▲100개 입력 언어와 35개 출력 언어를 지원하는 텍스트 음성 번역을 지원한다. 음성 간 번역 시 35개 언어를, 100개 언어를 텍스트에서 텍스트로 각각 전환할 수 있다는 얘기다.
메타는 대규모 다국어 음성인식(MMS) 모델과 마찬가지로, 심리스M4T 역시 오픈소스로 공개할 예정이다. 메타 측은 “AI 생태계 발전에 있어, 심리스M4T는 중요한 돌파구가 될 것”이라며 “우리 연구원들과 함께 이 기술을 공유할 수 있도록 할 것”이라고 설명했다.
김성현 기자(sh0416@zdnet.co.kr)
Copyright © 지디넷코리아. 무단전재 및 재배포 금지.
- 메타, 생성AI '오디오 크래프트'...글만으로 작사·작곡
- 메타, AI 단백질 연구 순수과학팀 해체
- 메타 "대형 기업, '라마2' 돈 내고 이용해라"
- 페이스북 알고리즘 바꿔도 '양극화' 안 없어진다
- 페이스북-인스타그램에도 AI 챗봇 생긴다
- 배달앱 수수료 7.8%로 인하...'배민 상생안' 극적 합의
- '스무돌' 맞이한 지스타 2024…주요 게임사 대표 모였다
- 설마했는데…삼성전자, '4만전자' 됐다
- 경계 사라진 비즈니스...엔비디아·어도비 등 ‘빅테크 혁신 팁’ 푼다
- 이석우 두나무-마이클 케이시 DAIS 협회장 "블록체인 산업, 외부 의존도 낮춰야"