유료 버전 도입한 딥엘 번역기··· '무제한·컴퓨터 보조 번역(CAT) 지원 통할까'
컴퓨터를 활용한 번역 기술은 통계적 기계 번역, 그리고 전통적인 통계 기반 번역에서 한층 더 진화한 인공신경망 기계 번역 기술로 나뉜다. 전통적 방식의 기계 번역은 문장을 단순히 사전적 의미와 배치로만 번역하기 때문에 문맥이 어색하고, 적절하지 않은 단어로 번역되는 등의 한계가 있었다. 인공신경망 번역은 대상 문장이 사용되는 여러 범례를 분석해 문장 자체의 의미를 학습하고, 이를 토대로 결과물을 내놓는다. 2016년 구글이 인공신경망 번역을 도입한 이후 신경망 기계 번역은 빠르게 전 세계로 확산했으며 지금은 많은 번역 서비스가 이 기술을 기반으로 하고 있다.
현재 국내에서는 구글 번역과 네이버 파파고가 신경망 번역 기술의 대표 주자인데, 지난 5월 국내 서비스를 시작한 딥엘(DeepL)이 양강 구도를 흔들고 있다. 딥엘은 인공지능을 통해 언어 장벽을 허무는 것을 목표로 하는 독일 인공지능 기업으로, 2017년부터 인공지능 기반의 기계 번역 서비스를 제공한다. 현재 한국어도 지원해 구글 번역 및 파파고의 대안으로 주목받고 있으며, 지난 8월 17일에는 성능 및 보안이 강화된 유료 버전인 ‘딥엘 프로’ 서비스를 공식 개시했다. 무료 번역기가 대중화된 시점에서 왜 딥엘은 유료 버전을 내놓은 것일까?
유료 버전, 결국은 보안이 핵심
딥엘 프로는 한국어를 포함해 30개 이상의 언어 번역을 지원하며, 조직 규모와 사용 환경에 따라 스타터, 어드밴스드, 얼티밋 세 가지 구독 플랜 중 선택할 수 있다. 유료 버전은 1500자 길이 제한 없이 무제한으로 번역할 수 있고, 딥엘 API 권한을 부여받아 사내 서비스에 번역 기능을 통합할 수 있다. 또한 최대 10~20MB 크기의 파일을 업로드할 수 있다. 또 플랜에 따라 최소 5개에서 100개까지의 문서 파일을 번역 및 편집할 수 있다. 하지만 유료 버전을 이용하는 기업들은 대체로 데이터 보안 기능에 주목할 것으로 본다.
2019년, 무료 온라인 서비스인 트랜슬레이트에서 특정 석유 기업의 중요 데이터 일부가 유출되는 사고가 일어났다. 해당 기업은 관련 문서를 서비스에 통째로 업로드한 다음 번역 후 내려받기를 했고 여기까지는 문제가 없었다. 하지만 서비스 개선을 위해 진행되는 사용자 참여 번역 과정에서 해당 데이터를 다루면서 유출됐다. 업계에서는 이런 사례를 우려해 온라인 서비스로 문서를 번역할 수 없도록 보안 지침을 만들고 있다.
딥엘 프로 버전의 경우 이런 우려가 없도록 사용자가 입력한 모든 텍스트는 번역 후 삭제된다. 일반적인 번역 서비스는 온라인에 텍스트가 업로드된 이후, 서버에서 번역한 다음 데이터를 산출한다. 반면 딥엘 프로 버전은 사용자의 컴퓨터에 장착된 메모리에만 데이터를 일시 저장하고, 번역 결과물도 디스크 내에서만 저장된다. 실제로 딥엘 프로는 온라인이 아닌 별도의 프로그램을 설치해서 이를 진행한다. 또한 딥엘 자체가 서버를 자체 관리하고, 영업 과정에 하도급 업체의 개입을 최소화해 유출 우려를 줄이고 있다.
중소기업 및 중견기업 수준에서는 이 정도 보안으로도 충분한 수준의 데이터 보안을 유지할 수 있고, 서비스 인가가 필요한 대기업도 API를 활용해 내부 서비스로 구축할 수 있으니 상대적으로 안전하게 이용할 수 있다.
문서 업로드 번역도 상대적으로 안전해져
기존 구글 문서 번역은 문서 자체를 업로드한 뒤, 번역하고 다운로드한다. 구글에서 별도로 데이터를 익명화한다고 하지만 어쨌거나 데이터를 제삼자에게 전송하는 행위이므로 기밀 유지가 필수인 환경에서는 금지 행위다. 반면 딥엘 번역은 내부 서비스로 구축할 수 있고, 데이터를 학습용으로 쓰지 않는다. 물론 원칙적으로는 업로드에 해당하지만, 엄격한 기밀이 필요한 번역이 아니라면 규정상 허용할 수 있는 수준은 된다.
직접 딥엘 프로와 구글 번역으로 PDF 문서를 번역했다. 문서의 경우 AMD의 보고서를 그대로 번역했는데, 문장의 매끄러움과 이해도는 딥엘쪽의 결과물이 우수하다. 구글 역시 이해에 부족함은 없지만 문장이 잘리거나, 어색한 부분이 없지 않다. 하지만 문장력 이외의 부분은 구글 번역이 우수하다.
딥엘의 경우 문서의 폰트 크기나 배치가 어색하고, 일부 구간에서는 문장 간격에서 오류가 발생하거나, 인포그래픽 내에 있는 글씨가 이탈하는 등의 문제가 있다. 반면 구글 번역은 문단 배치나 인포그래픽 배치가 원문과 최대한 비슷하고, 그래픽도 이탈하지 않는다. 아무래도 구글 번역쪽의 변환 노하우가 훨씬 우세하기 때문인데, 그래도 데이터가 외부로 새어나갈 염려가 없으니 단순 참고용으로는 딥엘 프로 쪽이 이상적이다.
무제한 텍스트 번역, 대량 작업에 용이해
거의 모든 무료 번역 서비스는 번역 가능한 문자 수에 제한을 둔다. 서버에 업로드하는 것 자체도 비용이 들기 때문이다. 그래서 긴 문서 전체를 번역하기보다는 문단씩 끊어서 번역해야 하고, 어쩔 수 없이 문맥이 달라지는 경우도 생긴다. 딥엘 프로의 경우 길이에 제약이 없기 때문이 긴 문서는 물론 책이나 회의록, 스크립트 등 대량의 문서를 번역하기에도 적합하다.
예시에서는 1시간 분량의 4만2657자 스크립트 전체를 번역하는데 약 15초 정도가 소요됐다. 특히 양쪽의 스크롤이 연동되어 쉽게 오르내릴 수 있고, 한글 문장을 선택하면 해당되는 영어 문장을 표시하는 등 세세한 부분에서 편의성이 있다. 번역해야 하는 내용이 굉장히 방대할 경우에는 활용 가치가 상당히 높은 대목이다. 다만 번역할 때 문장을 비격식 및 격식 버전으로 설정하는 기능, 그리고 특정 단어나 문장을 규칙에 맞게 자동으로 바꾸는 ‘나만의 용어집’ 기능은 아직 한국어를 지원하지 않는다.
딥엘 프로는 다른 웹 기반 번역에서는 지원하지 않는 싱글 사인 온(SSO) 기능, 그리고 컴퓨터 보조 번역(CAT)도 활용할 수 있다. 싱글 사인 온은 하나의 로그인 인증 정보를 활용해 여러 앱에 접근할 수 있는 계정 관리 체계로, 사용자가 편리하게 다양한 서비스에 접근할 수 있도록 돕는다. 현재 SSO를 사용하고 있는 기업 환경이라면 다른 서비스를 쓰다가도 딥엘 프로를 로그인하지 않고 바로 쓸 수 있다.
또한 번역가들이 사용하는 프로그램인 컴퓨터 보조 번역(CAT)에 플러그인 형태로 활용할 수 있다. CAT는 일반 번역기능에서 전문 용어 데이터베이스나 색인, 텍스트 비교, 프로젝트 관리 소프트웨어, 번역 결과 데이터베이스화 등을 지원하는 전문가용 번역 프로그램이다. 현재 Trados Studio 2017 이상, MemoQ 8.5 이상, Wordfast, Across 등 10가지 프로그램에서 사용할 수 있어서 전문가의 활용도를 높일 수 있다.
사람들은 이미 번역기를 무료로 사용하는 데 익숙해져 있고, 그래서 딥엘 프로의 시도는 다소 무모해 보일 수 있다. 하지만 딥엘 프로는 데이터를 학습에 사용하지 않는다는 부분 하나만으로 기업 시장에서 주목받을 수 있다. 최근 삼성전자와 애플은 엔지니어들이 허가 없이 내부 코드를 챗GPT에 업로드한 사건을 계기로 임직원의 챗GPT 사용을 금지한 바 있다. 기업 입장에서는 무료 번역기 역시 챗GPT와 똑같이 위험한 경로다. 이런 우려를 해소할 수 있다는 점만으로도 한국은 물론 글로벌 시장에서 충분히 수요를 끌어올 수 있을 것이다.
다만 완성도는 더 끌어올려야 한다. 번역의 완성도에 대해 주관적으로 평가하자면, 구글이나 파파고의 결과에 비해 문맥이나 흐름은 매끄럽지만 품질이 차별화된 정도는 아니다. 유료 버전이라면 조금 더 인상적인 결과를 내놓아야 한다. 또한 문서 번역 시 배치가 틀어진다던가, 광학 문자 인식률이 떨어지는 부분 등도 해결해야 할 과제다. 구글과 네이버도 시도하지 못한 번역 유료 서비스가 국내 시장에서 얼마나 성공을 거둘지는 지켜볼 일이다.
동아닷컴 IT전문 남시현 기자 (sh@itdonga.com)
Copyright © 동아일보. 무단전재 및 재배포 금지.
- “143만원 로또 3등 용지 내밀었더니 4등이라며 5만원 줘” 황당
- 오토바이 훔쳤던 소년, 검거 경찰 찾아와 ‘큰절’ 올린 사연 [따만사]
- 신림동 공원 성폭행범 “CCTV 없는 곳 골라…너클 끼고 범행”
- “저러다 부딪히겠어”…돌고래에 과도하게 접근한 낚시어선 적발
- 산불로 초토화된 하와이…잿더미 속 멀쩡한 ‘빨간 지붕 집’ 한 채
- ‘댓글 공작’ 김관진, 파기환송심서 징역 2년 실형
- 말레이 여객기 수직으로 곤두박질…“비상 교신도 없었다”
- 54년간 연락 없던 생모 “아들 보험금 다 내 것”…법원 중재안도 거절
- “유사시 싼샤댐 파괴”…대만군, 신형 순항미사일 시험발사 공개
- 승객 태운 버스 땅 아래로 ‘쿵’…제주공항 입구 교차로서 포트홀 발생