영어학원 뿌린 돈이 얼만데…100가지 언어 술술 ‘그놈’이 나타났다
한국어 일본어 스페인어 등 지원
“특정언어 말하면 3개어 동시 통역”
페이스북 모기업인 메타플랫폼(메타)이 100여개 언어를 통역 및 번역하는 AI(인공지능) 모델을 출시했다.
텍스트(문자)를 텍스트로 번역하거나, 스피치(음성)를 텍스트로 바꿀 경우 100개 언어가 제공된다. 다만 텍스트를 스피치로 바꾸거나 스피치를 스피치로 통역할 경우에는 35개 언어만 지원한다. 영어, 중국어, 스페인어, 포르투갈어, 일본어 등 사용자가 많은 언어뿐만 아니라 한국어, 스웨덴어, 태국어 등 여러 언어를 지원하고 있다.
심리스M4T는 총 47만시간 이상의 데이터를 포함한 심리스얼라인이라는 데이터셋을 통해 학습됐다. 텍스트 데이터는 위키피디아, 뉴스 소스, 대본화된 연설 등에서 추출된 문장들에서 나왔으며, 음성 데이터는 공개된 웹데이터에서 얻은 4백만 시간의 원본 오디오로부터 수집됐다.
마크 저커버그 최고경영자(CEO)는 자신의 페이스북을 통해 “우리는 이 모델을 순차적으로 페이스북, 인스타그램, 와츠앱, 스레드 등에 적용할 것”이라고 밝혔다.
메타가 공개한 심리스M4T 데모에서는 특정 언어로 말하면 이것을 3가지 언어로 동시에 통·번역해준다. 한국어로 ‘안녕하세요’라고 말하면 영어, 일본어, 중국어로 번역된 텍스트와 스피치가 모두 생성된다.
메타에 따르면 심리스M4T 의 능력은 비슷한 음성-언어인식 모델인 오픈AI 의 위스퍼보다 뛰어나다. 다만 각 언어 간 번역 품질에 대해서는 공개하지 않았다.
메타는 생성형 AI의 기반이 되는 대규모 언어모델(LLM) 라마(LLaMA) 2처럼 이 AI 모델도 일반에 공개했다. 다만 라마 2 처럼 상업적인 용도로 사용할 수는 없고 학술적인 용도로만 사용 가능하다.
메타는 자신들의 ‘책임감 있는(Responsible) AI’ 원칙에 따라 AI 를 학습시켰다고 설명했다. 증오나 폭력, 욕설 또는 학대를 선동할 수 있는 유해 단어 및 민감한 단어를 식별하는 시스템도 탑재됐다고 설명했다.
AI 를 사용해 언어를 번역하거나 통역하는 서비스는 이미 많이 출시된 상태다. 하지만 심리스M4T 처럼 100여개의 언어와 이 언어의 음성까지 인식해서 제공히는 서비스는 없었다. 구글은 어시스턴트를 통해 통역 서비스를 제공하고 있다. 최근 국내에 구독서비스를 출시한 인공지능 번역 서비스인 딥엘(DeepL)은 30여개 언어의 번역을 제공한다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- 신림동 성폭행 살인범 30세 최윤종…본인 동의로 머그샷 공개 - 매일경제
- “8년 감방생활하고도 또”…20대 만취女 노래방 끌고간 30대男이 한짓 - 매일경제
- 실제 수리비 1800만원…8억 페라리 긁은 노인에 3만원만 달라는 청년, 왜? - 매일경제
- ‘역사상 가장 비싼 계절’ ‘미친 영수증’…K바가지 이어 난리라는 이곳 - 매일경제
- ‘묻지마 범죄’ 속출에···文정부 폐지했던 의경 부활 검토 - 매일경제
- 서이초 ‘연필사건’ 민원 학부모는 현직 경찰 간부 - 매일경제
- “이러다 진짜 고질라 나올라”…日 오염수 방류 결정에 난리난 중국 - 매일경제
- [단독] 강남역 카페서 ‘몰폰 어플’로 여성 신체 몰래 촬영한 20대 남성 - 매일경제
- 검찰, 이재명 5번째 소환 통보…쌍방울 대북송금 - 매일경제
- 골프 김효주 세계스포츠선수 TOP10…한국 유일 - MK스포츠