언어 장벽에 도전하는 엑스엘에이트가 꿈꾸는 세상
시간과 비용 30% 이상 줄여줘
학습을 통해 신조어도 최적으로 번역
“AI의 도움으로 언어 장벽을 넘어서고 싶다. 예전에 플로핏 디스크가 많이 쓰였지만 지금은 안 쓴다. 번역도 마찬가지다. 미래에는 안 쓰이는 솔루션이 될 수 있다. 그 모든 것을 위해 한 발자국씩 나아가고 있다. 언어의 장벽이 사라지는 날 모든 번역 툴도 사라질 것이다. 그것이 우리가 꿈꾸는 세상이다.”
지난달 27일 '실리콘밸리의 한국인' 행사에서 ‘기계번역, 구글을 뛰어넘고 넷플릭스에게 인정받기까지’라는 주제로 발표한 엑스엘에이트(XL8) 정영훈 대표는 엑스엘에이트가 궁극적으로 하고 싶은 일이라며 이렇게 말했다.
컬럼비아대에서 컴퓨터 공학 박사를 마치고 구글 서치팀에서 4년 간 일을 하면서 창업을 결심한 정 대표가 주목한 시장은 번역 시장이었다. 당시 글로벌 번역 시장은 수요는 증가하고 있던 반면 공급은 한정적이었다. 정 대표가 미국 생활을 하면서 언어 문제로 힘들었던 경험도 번역 시장에 관심을 가지게 된 데에 한 몫했다. 정 대표는 “언어가 통하지 않으면 고생한다. 여행도 말이 통해야 살아남을 수 있다. 언어가 통하지 않으면 햄버거 하나 주문하는 것도 쉽지 않고 동료와 친해지기도 힘들다. 새로운 언어를 배운다는 건 어려운 일이지만 그래도 배워야 한다.”라고 말했다.
그렇게 해서 2019년 창립한 회사가 인공지능(AI)를 이용한 기계번역 스타트업 엑스엘에이트다. 정 대표가 기계번역 사업을 한다고 했을 때 가장 많이 들었던 질문이 "구글에서 하는 것 아니냐"라는 질문이었다고 한다. 구글과 같은 대기업만이 할 수 있는 일이라는 의미이고 번역 시장에서 구글과 경쟁해 살아남을 수 있겠냐라는 의미의 질문이다. 똑같은 질문을 계속해서 받은 정 대표는 오히려 다른 사람들이 보지 못한 사업의 기회가 있을 것이라는 확신이 들었다고 한다. 그렇다고 무작정 번역 시장에 뛰어 든 것은 아니다. 정 대표는 엑스엘에이트가 경쟁력을 가지기 위해 미디어에 특화하는 전략을 선택했다. 정 대표는 “스타트업이 대기업을 이기는 방법으로 카운터 포지셔닝, 가격 경쟁, 시장세분화 전략이 있다. 엑스엘에이트가 선택한 전략은 시장세분화 전략이었다. 전 세계 50개가 넘는 AI 번역 회사 중에서 미디어에 특화된 스타트업은 엑스엘에이트가 유일하다.”라고 강조했다.
미디어에 특화한 정 대표의 전략은 들어맞았다. 번역 시장에 뛰어든 모든 플레이어가 문어체 번역 시장에 집중하면서 구어체 번역 시장엔 관심을 두지 않았다. 한마디로 경쟁자가 없는 시장인 셈이다. 2019년 당시 OTT 시장이 커지면서 구어체 번역 시장의 수요가 폭발적으로 증가하기 시작한 것도 시기가 맞았다. 하지만 미디어는 새로운 기술을 받아드리는데 보수적이였다. 기존의 관습대로 사람이 직접 번역을 해왔던 곳이다. 그런 미디어 환경을 보면서 정 대표는 미디어에 테크를 결합할 경우 시너지가 크게 날 것라고 생각해 미디어에 특화한 기계번역 시장에 뛰어 들게 되었다.
엑스엘에이트 솔루션의 주요 고객은 넷플릭스, 디즈니와 같은 OTT플랫폼에 영상 콘텐츠를 현지화하는 아이유노-에스디아이 등의 번역서비스 제공업체(LSP, Language Service Privider)다. 엑스엘에이트의 솔루션으로 1차 초벌 번역을 하고 난 뒤에 휴먼 번역사가 2차 번역을 해 수정하고 최종 수정된 자막을 OTT에 공급한다. 정 대표는 기자와의 인터뷰에서 “넷플릭스의 자막 대부분이 이러한 방식으로 소비자에게 전달된다. 엑스엘에이트의 번역 정확도는 80% 이상이다. 기존에 휴먼 번역사로만 진행했던 것에 비해 엑스엘에이트의 솔루션을 사용할 경우 시간과 비용을 30% 절약할 수 있다.”라고 말했다.“
엑스엘에이트 솔루션은 구어체 번역에 독보적이다. 구어체 번역을 위해 엑스엘에이트는 나라별로 자주 쓰는 신조어나 속어를 학습시켜 보다 현지 언어에 가깝게 번역해 내고 있다. 한국어의 경우 ‘하세요’, ‘합쇼’, ‘해라’ 등의 존중어, 높임말 등 각 시대나 등장 인물 관계에 따라 어울리게 번역한다. 정 대표는 “언어는 계속 변한다. 신조어들도 많이 생긴다. 엑스엘에이트의 강점 중에 하나가 최신 영상을 학습해 신조어를 학습하는 것이다. 슬랭, 속어 같은 것을 바로바로 현지화된 언어로 번역된다는 장점이 있다.”라고 말했다. 엑스엘에이트는 번역의 퀄리티를 계속해서 높이기 위해 그 동안 번역 작업을 통해 모은 데이터로 학습하고 모델을 수정해 나가고 있다.
엑스엘에이트가 창업 이후 번역한 영상 콘텐츠 분량은 총 50만 시간을 넘어섰다. 번역한 단어는 24억개, 현재 지원하는 번역은 33개 언어이며, 언어쌍의 종류는 총 66개이다.
엑스엘에이트는 최근에 영상 번역가나 크리에이터 등 개인 사업자를 겨냥한 솔루션을 출시했다. 지난달에 공개한 ‘미디어캣(MediaCAT, Media Computer Assisted Translation)은 영상을 업로드하면 몇 번의 클릭만으로 자동으로 대사를 추출해 타임코드를 맞추고 대사를 원하는 언어쌍으로 번역한 뒤 원하는 음성으로 더빙작업까지 지원한다. 영상 전문 번역가들의 반복적인 업무를 크게 덜어줘 휴먼 번역가들에게 편리하고 일원화된 MT-PE 번역솔루션(Machine Translation-Post Edit)이 되어줄 것으로 기대된다.
엑스엘에이트는 앞으로는 실시간 번역 시장에 진출할 예정이다. 실시간 번역이 필요한 OTT 서비스와 E-스포츠 방송 시장뿐만 아니라 실시간 다국어 회의 지원과 인공지능 성우를 활용한 더빙 시장에도 진출할 예정이다.
엑스엘에이트는 구글 소프트웨어 및 리서치 엔지니어팀을 리드하며 구글 인공신경망 기반 자연어처리 서비스 출시를 이끌었던 정영훈 대표와 애플 엔지니어 출신 박진형이 2019년 미국 산호세에서 설립한 스타트업이다. 엑스엘에이트는 정 대표가 구글에서 경험한 의사결정 구조를 커스터마이즈한 버텀업식 의사결정 구조를 가지고 다양한 배경을 가진 임직원이 근무하고 있다.
매일경제 조광현 연구원[hyunc@mk.co.kr]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지