“언어장벽 없애, 자유롭게 소통하는 세상 꿈꿔”

이상덕 특파원(asiris27@mk.co.kr) 2022. 12. 21. 19:33
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

XL8 정영훈 대표 인터뷰
영어 한국어 등 77개 구어체 번역
정교한 데이터, 정교한 AI 만들어
몬스터엑스 원호, 팬미팅 사용해 주목
번역 솔루션만 50개...구어체 번역 드물어
“정보 장벽 무너뜨리는 것이 최종 목표”
XL8의 정영훈 대표
혁신의 심장 실리콘밸리에는 문어가 아닌 구어에 초점을 둔 인공지능 기계 번역 스타트업이 있다. 전 세계에 번역 솔루션을 가진 빅테크 기업과 스타트업은 약 50개에 달한다. 구글 아마존이 대표적이다. 대다수 글로 된 문어체다. 하지만 엑스엘에이트(XL8)는 실생활에서 쓰이는 구어체에 집중하고 있다. 현재 다루는 언어는 20개, 이를 통해 77개(예를 들어 한국어-영어)쌍을 번역할 수 있다. 엑스엘에이트는 왜 구어체에 집중하고 있을까. 쿠퍼티노에 있는 엑스엘에이트 사옥에서 정영훈 대표를 만났다. 그는 “언어 장벽을 무너뜨려서, 모든 사람이 좀 더 수월하게 소통하게 하고 싶다”고 설명했다. (다음은 일문일답)
“구글 검색팀에서 일하다 창업 결심”
Q) 미국으로 넘어온 계기가 궁금합니다.

- 삼성에서 범용 운영 체제인 타이젠의 UX 플랫폼 개발을 담당했습니다. 이후 컬럼비아대학에서 컴퓨터 석·박사 통합과정을 밟게 됐습니다. 퇴사하고 미국에서 잘 정착할 수 있을지 고민이 많았지만, 주변에서 용기를 많이 주셔서 도전하게 됐네요. 연구 주제는 작은 디바이스와 큰 컴퓨터를 어떻게 잘 유기적으로 연결할지였는데요. 특히 자연어처리(NLP) 애플리케이션을 어떻게 효율적으로 할지를 연구했습니다. 그리고 2015년 구글 검색팀에 합류했습니다. 사실 구글이 하나의 거대한 자연어 처리인데요. 키워드 하나를 입력하면 이를 파악해 답하는 것이죠. 예를 들어 자동차를 검색하면 중고차를 사고 싶은 것인지 신차를 검색하는 것인지 맥락을 잘 파악해서 찾아주는 게 구글의 목적입니다.

Q) 구글에서는 어떤 일을 했나요.

- 주로 소프트웨어 엔지니어 매니징을 했습니다. 소프트웨어 개발자를 잘 운영하다 보니, 어느 순간에 이제는 테크 팀을 꾸릴 수 있겠다고 하는 생각이 들었습니다. 그리고 2019년에 창업을 한 것이 엑스엘에이트입니다.

Q) XL8 이름이 좀 와 닿지 않는데요. 어떤 뜻이 있나요.

- 영어로 번역이 트랜스레이트 잖아요. 이를 압축하면 XL8입니다. 그리고 미디어 회사들은 다 알파벳 세글자를 쓰죠. 이니셜 세글자. 그래서 저희도 XL8로 이름을 지었습니다.

Q) 어떻게 창업하게 됐나요.

- 처음에는 아이유노라는 미디어 콘텐츠 번역을 전문적으로 하는 회사와 함께 일했습니다. 자막을 여러 언어로 만들고 더빙도 하는 그런 기업입니다. 알만한 주요 스트리밍 기업을 상대로 자막을 공급하죠. 일명 현지화 서비스 제공업체(LSP)의 위탁 자막 서비스인데요. 예를 들어 넷플릭스에서 영화를 보실 텐데요. 그 자막은 사실 대다수 위탁을 맡깁니다. 이런 LSP들이 공급하죠. 아이유노 대표님은 처음 인연을 맺은 것이 2003년이고요. 가깝게 지내다 구글에 있을 때 기계 번역이 앞으로는 번역 시장의 판도를 크게 바꿀 것이라고 말씀을 드려 투자받게 됐습니다.

XL8의 번역 솔루션
“사람을 지원하는 번역 솔루션”
Q) 어떤 장점이 있었을까요.

- 기계 학습에 중요한 것은 데이터인데요. 저희는 이런 LSP의 내부 데이터를 학습시키면서 성장했습니다. 창업하고 자막용 번역하는 기술을 만들었습니다. 2년 반 정도 고도화를 시켰죠. 사실상 인공지능 도구라고 볼 수 있습니다. 사람의 번역을 대체하는 것이 아니라, 더 많은 양을 더 수월하게 도와줄 수 있는 툴인 것이죠.

Q) 엑스엘에이트가 사람을 대신하는 것은 아니고요?

- 사실 사람들이 번역해도 번역이 자주 틀립니다. 그래서 품질검사인 QC를 3번까지 합니다. 그 때문에 먼저 엑스엘에이트의 번역 솔루션을 사용하고 사람이 이에 맞춰 교차 검증을 하는 것이 비즈니스 모델입니다. 인공지능은 이 과정에서 지속해서 발전하고요. 품질이 점점 좋아질 수밖에 없기 때문에 손봐야 하는 것이 줄어들 수밖에 없습니다.

Q) 일반 번역 솔루션과는 무엇이 다른가요.

- 저희를 제외한 기계 번역을 하는 회사들은 이런 데이터를 인터넷에서 갖고 옵니다. 그러면 당연히 텍스트를 기반으로 하기 때문에 문어체죠. 인터넷 데이터는 누구든지 올리기 때문에 정교하지를 않죠. 안 좋은 데이터를 이겨내려고 하는 것인데요. 전 이것을 연금술이라고 생각합니다. 연금술은 실패했죠. 반면에 저희는 LSP와 파트너십을 맺고 있기 때문에 100% 꼼꼼한 데이터를 씁니다. 또 사람들과 대화를 기반으로 하고 있어서 구어체가 중심이죠.

XL8 솔루션의 번역 정확도
Q) 구어체가 어려운 점이 없나요.

- 물론 많습니다. 태국어와 일본어는 성별에 따른 화법이 다릅니다. 현재는 영어, 한국어, 중국어, 일본어, 인도네시아어, 말레이어, 타이어, 베트남어, 버마어, 남미, 스페인어, 브라질리안 포르투갈어, 유럽 언어(프랑스어 이탈리아어. 포르투갈어 스웨덴어) 등을 개발 완료했습니다. 언어로 따지면 약 20개고, 쌍으로 치면 77개쌍입니다.

Q) 번역은 대다수 무료인데, 비즈니스 모델은 어떤가요.

- 현재는 라이브 등을 실시간 통역해주는 이벤트캣(EventCAT)과 번역 솔루션인 미디어캣(MediaCAT)이 있습니다. 캣은 CAT(computer aided translation)라는 뜻으로 번역가들이 많이 쓰는 도구를 뜻합니다. 몬스터엑스의 원호가 팬 미팅을 할 때 한국어로 말하면 영어 일본어 자막이 나왔는데요. 바로 한국어를 모르는 팬들 역시 이해를 할 수 있었습니다. 현재는 동영상 언어를 글자로 바꿔주고, 음성합성 더빙을 할 때 시간당 과금을 하는 모델을 갖추고 있습니다.

Q) 끝으로 비전이 궁금합니다.

- 언어 장벽을 무너뜨려서, 모든 사람이 좀 더 수월하게 소통하게 하는 것이 비전입니다. 결국은 언어로 인해서 주고받지 못했던 정보 장벽을 무너뜨리는 것이 엑스엘에이트의 최종 목표입니다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?