“언어장벽 없애, 자유롭게 소통하는 세상 꿈꿔”
영어 한국어 등 77개 구어체 번역
정교한 데이터, 정교한 AI 만들어
몬스터엑스 원호, 팬미팅 사용해 주목
번역 솔루션만 50개...구어체 번역 드물어
“정보 장벽 무너뜨리는 것이 최종 목표”
- 삼성에서 범용 운영 체제인 타이젠의 UX 플랫폼 개발을 담당했습니다. 이후 컬럼비아대학에서 컴퓨터 석·박사 통합과정을 밟게 됐습니다. 퇴사하고 미국에서 잘 정착할 수 있을지 고민이 많았지만, 주변에서 용기를 많이 주셔서 도전하게 됐네요. 연구 주제는 작은 디바이스와 큰 컴퓨터를 어떻게 잘 유기적으로 연결할지였는데요. 특히 자연어처리(NLP) 애플리케이션을 어떻게 효율적으로 할지를 연구했습니다. 그리고 2015년 구글 검색팀에 합류했습니다. 사실 구글이 하나의 거대한 자연어 처리인데요. 키워드 하나를 입력하면 이를 파악해 답하는 것이죠. 예를 들어 자동차를 검색하면 중고차를 사고 싶은 것인지 신차를 검색하는 것인지 맥락을 잘 파악해서 찾아주는 게 구글의 목적입니다.
Q) 구글에서는 어떤 일을 했나요.
- 주로 소프트웨어 엔지니어 매니징을 했습니다. 소프트웨어 개발자를 잘 운영하다 보니, 어느 순간에 이제는 테크 팀을 꾸릴 수 있겠다고 하는 생각이 들었습니다. 그리고 2019년에 창업을 한 것이 엑스엘에이트입니다.
Q) XL8 이름이 좀 와 닿지 않는데요. 어떤 뜻이 있나요.
- 영어로 번역이 트랜스레이트 잖아요. 이를 압축하면 XL8입니다. 그리고 미디어 회사들은 다 알파벳 세글자를 쓰죠. 이니셜 세글자. 그래서 저희도 XL8로 이름을 지었습니다.
Q) 어떻게 창업하게 됐나요.
- 처음에는 아이유노라는 미디어 콘텐츠 번역을 전문적으로 하는 회사와 함께 일했습니다. 자막을 여러 언어로 만들고 더빙도 하는 그런 기업입니다. 알만한 주요 스트리밍 기업을 상대로 자막을 공급하죠. 일명 현지화 서비스 제공업체(LSP)의 위탁 자막 서비스인데요. 예를 들어 넷플릭스에서 영화를 보실 텐데요. 그 자막은 사실 대다수 위탁을 맡깁니다. 이런 LSP들이 공급하죠. 아이유노 대표님은 처음 인연을 맺은 것이 2003년이고요. 가깝게 지내다 구글에 있을 때 기계 번역이 앞으로는 번역 시장의 판도를 크게 바꿀 것이라고 말씀을 드려 투자받게 됐습니다.
- 기계 학습에 중요한 것은 데이터인데요. 저희는 이런 LSP의 내부 데이터를 학습시키면서 성장했습니다. 창업하고 자막용 번역하는 기술을 만들었습니다. 2년 반 정도 고도화를 시켰죠. 사실상 인공지능 도구라고 볼 수 있습니다. 사람의 번역을 대체하는 것이 아니라, 더 많은 양을 더 수월하게 도와줄 수 있는 툴인 것이죠.
Q) 엑스엘에이트가 사람을 대신하는 것은 아니고요?
- 사실 사람들이 번역해도 번역이 자주 틀립니다. 그래서 품질검사인 QC를 3번까지 합니다. 그 때문에 먼저 엑스엘에이트의 번역 솔루션을 사용하고 사람이 이에 맞춰 교차 검증을 하는 것이 비즈니스 모델입니다. 인공지능은 이 과정에서 지속해서 발전하고요. 품질이 점점 좋아질 수밖에 없기 때문에 손봐야 하는 것이 줄어들 수밖에 없습니다.
Q) 일반 번역 솔루션과는 무엇이 다른가요.
- 저희를 제외한 기계 번역을 하는 회사들은 이런 데이터를 인터넷에서 갖고 옵니다. 그러면 당연히 텍스트를 기반으로 하기 때문에 문어체죠. 인터넷 데이터는 누구든지 올리기 때문에 정교하지를 않죠. 안 좋은 데이터를 이겨내려고 하는 것인데요. 전 이것을 연금술이라고 생각합니다. 연금술은 실패했죠. 반면에 저희는 LSP와 파트너십을 맺고 있기 때문에 100% 꼼꼼한 데이터를 씁니다. 또 사람들과 대화를 기반으로 하고 있어서 구어체가 중심이죠.
- 물론 많습니다. 태국어와 일본어는 성별에 따른 화법이 다릅니다. 현재는 영어, 한국어, 중국어, 일본어, 인도네시아어, 말레이어, 타이어, 베트남어, 버마어, 남미, 스페인어, 브라질리안 포르투갈어, 유럽 언어(프랑스어 이탈리아어. 포르투갈어 스웨덴어) 등을 개발 완료했습니다. 언어로 따지면 약 20개고, 쌍으로 치면 77개쌍입니다.
Q) 번역은 대다수 무료인데, 비즈니스 모델은 어떤가요.
- 현재는 라이브 등을 실시간 통역해주는 이벤트캣(EventCAT)과 번역 솔루션인 미디어캣(MediaCAT)이 있습니다. 캣은 CAT(computer aided translation)라는 뜻으로 번역가들이 많이 쓰는 도구를 뜻합니다. 몬스터엑스의 원호가 팬 미팅을 할 때 한국어로 말하면 영어 일본어 자막이 나왔는데요. 바로 한국어를 모르는 팬들 역시 이해를 할 수 있었습니다. 현재는 동영상 언어를 글자로 바꿔주고, 음성합성 더빙을 할 때 시간당 과금을 하는 모델을 갖추고 있습니다.
Q) 끝으로 비전이 궁금합니다.
- 언어 장벽을 무너뜨려서, 모든 사람이 좀 더 수월하게 소통하게 하는 것이 비전입니다. 결국은 언어로 인해서 주고받지 못했던 정보 장벽을 무너뜨리는 것이 엑스엘에이트의 최종 목표입니다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- “한 대당 230억원”…무더기 결함, 세계 최고가 장갑차의 굴욕 - 매일경제
- ‘7만원 건보료’시비건 의원들, 본인것부터 까보시죠[핫이슈] - 매일경제
- “무덤이 아니라 번식지였다”…15m 괴생명체 37마리 발견된 이곳 - 매일경제
- 최대 8억 ‘뚝’ 신저가 쇼크...하락 아파트에 무슨 일이 [매부리레터] - 매일경제
- “처음엔 바위인줄 ”…염전서 인간심장 발견한 美노동자들 ‘경악’ - 매일경제
- “실축선수에 ‘원숭이’ 달았다”…준우승했다고 인종차별 佛축구팬 - 매일경제
- ‘밤 가장 긴’ 冬至 매서운 한파온다…서울 아침 최저 -9도 - 매일경제
- 거래 실종·집값 급락에…서울 강북·경기 광명 규제해제 유력 - 매일경제
- 한 총리 무단횡단 논란에…총리실 “용산서 경찰관 지시 따른 것” - 매일경제
- 백승호 ‘카타르월드컵 TOP10 골’ 선정 [오피셜] - MK스포츠