유료 버전 도입한 딥엘 번역기··· '무제한·컴퓨터 보조 번역(CAT) 지원 통할까'

2023. 8. 18. 17:27
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

컴퓨터를 활용한 번역 기술은 통계적 기계 번역, 그리고 전통적인 통계 기반 번역에서 한층 더 진화한 인공신경망 기계 번역 기술로 나뉜다. 전통적 방식의 기계 번역은 문장을 단순히 사전적 의미와 배치로만 번역하기 때문에 문맥이 어색하고, 적절하지 않은 단어로 번역되는 등의 한계가 있었다. 인공신경망 번역은 대상 문장이 사용되는 여러 범례를 분석해 문장 자체의 의미를 학습하고, 이를 토대로 결과물을 내놓는다. 2016년 구글이 인공신경망 번역을 도입한 이후 신경망 기계 번역은 빠르게 전 세계로 확산했으며 지금은 많은 번역 서비스가 이 기술을 기반으로 하고 있다.

딥엘은 지난 5월 국내 시장에 공식 출시됐고, 지난 8월 17일 프로 버전을 출시했다 / 출처=IT동아

현재 국내에서는 구글 번역과 네이버 파파고가 신경망 번역 기술의 대표 주자인데, 지난 5월 국내 서비스를 시작한 딥엘(DeepL)이 양강 구도를 흔들고 있다. 딥엘은 인공지능을 통해 언어 장벽을 허무는 것을 목표로 하는 독일 인공지능 기업으로, 2017년부터 인공지능 기반의 기계 번역 서비스를 제공한다. 현재 한국어도 지원해 구글 번역 및 파파고의 대안으로 주목받고 있으며, 지난 8월 17일에는 성능 및 보안이 강화된 유료 버전인 ‘딥엘 프로’ 서비스를 공식 개시했다. 무료 번역기가 대중화된 시점에서 왜 딥엘은 유료 버전을 내놓은 것일까?

유료 버전, 결국은 보안이 핵심

딥엘 프로는 한국어를 포함해 30개 이상의 언어 번역을 지원하며, 조직 규모와 사용 환경에 따라 스타터, 어드밴스드, 얼티밋 세 가지 구독 플랜 중 선택할 수 있다. 유료 버전은 1500자 길이 제한 없이 무제한으로 번역할 수 있고, 딥엘 API 권한을 부여받아 사내 서비스에 번역 기능을 통합할 수 있다. 또한 최대 10~20MB 크기의 파일을 업로드할 수 있다. 또 플랜에 따라 최소 5개에서 100개까지의 문서 파일을 번역 및 편집할 수 있다. 하지만 유료 버전을 이용하는 기업들은 대체로 데이터 보안 기능에 주목할 것으로 본다.

2019년, 무료 온라인 서비스인 트랜슬레이트에서 특정 석유 기업의 중요 데이터 일부가 유출되는 사고가 일어났다. 해당 기업은 관련 문서를 서비스에 통째로 업로드한 다음 번역 후 내려받기를 했고 여기까지는 문제가 없었다. 하지만 서비스 개선을 위해 진행되는 사용자 참여 번역 과정에서 해당 데이터를 다루면서 유출됐다. 업계에서는 이런 사례를 우려해 온라인 서비스로 문서를 번역할 수 없도록 보안 지침을 만들고 있다.

딥엘 프로는 웹 기반 번역과 프로그램 기반 번역을 각각 제공한다 / 출처=IT동아

딥엘 프로 버전의 경우 이런 우려가 없도록 사용자가 입력한 모든 텍스트는 번역 후 삭제된다. 일반적인 번역 서비스는 온라인에 텍스트가 업로드된 이후, 서버에서 번역한 다음 데이터를 산출한다. 반면 딥엘 프로 버전은 사용자의 컴퓨터에 장착된 메모리에만 데이터를 일시 저장하고, 번역 결과물도 디스크 내에서만 저장된다. 실제로 딥엘 프로는 온라인이 아닌 별도의 프로그램을 설치해서 이를 진행한다. 또한 딥엘 자체가 서버를 자체 관리하고, 영업 과정에 하도급 업체의 개입을 최소화해 유출 우려를 줄이고 있다.

중소기업 및 중견기업 수준에서는 이 정도 보안으로도 충분한 수준의 데이터 보안을 유지할 수 있고, 서비스 인가가 필요한 대기업도 API를 활용해 내부 서비스로 구축할 수 있으니 상대적으로 안전하게 이용할 수 있다.


문서 업로드 번역도 상대적으로 안전해져

기존 구글 문서 번역은 문서 자체를 업로드한 뒤, 번역하고 다운로드한다. 구글에서 별도로 데이터를 익명화한다고 하지만 어쨌거나 데이터를 제삼자에게 전송하는 행위이므로 기밀 유지가 필수인 환경에서는 금지 행위다. 반면 딥엘 번역은 내부 서비스로 구축할 수 있고, 데이터를 학습용으로 쓰지 않는다. 물론 원칙적으로는 업로드에 해당하지만, 엄격한 기밀이 필요한 번역이 아니라면 규정상 허용할 수 있는 수준은 된다.

좌측이 딥엘 프로로 문서를 번역한 결과, 우측이 구글 번역으로 문서를 변환한 결과다. 문서나 문자의 배치는 구글쪽의 결과가 훨씬 좋고, 문장에 대한 이해는 딥엘 쪽이 더 좋은 느낌이다 / 출처=IT동아

직접 딥엘 프로와 구글 번역으로 PDF 문서를 번역했다. 문서의 경우 AMD의 보고서를 그대로 번역했는데, 문장의 매끄러움과 이해도는 딥엘쪽의 결과물이 우수하다. 구글 역시 이해에 부족함은 없지만 문장이 잘리거나, 어색한 부분이 없지 않다. 하지만 문장력 이외의 부분은 구글 번역이 우수하다.

딥엘의 경우 문서의 폰트 크기나 배치가 어색하고, 일부 구간에서는 문장 간격에서 오류가 발생하거나, 인포그래픽 내에 있는 글씨가 이탈하는 등의 문제가 있다. 반면 구글 번역은 문단 배치나 인포그래픽 배치가 원문과 최대한 비슷하고, 그래픽도 이탈하지 않는다. 아무래도 구글 번역쪽의 변환 노하우가 훨씬 우세하기 때문인데, 그래도 데이터가 외부로 새어나갈 염려가 없으니 단순 참고용으로는 딥엘 프로 쪽이 이상적이다.

무제한 텍스트 번역, 대량 작업에 용이해

딥엘 프로로 약 4만2천자의 스크립트를 한 번에 변환했는데, 15초 정도만 소요됐다 / 출처=IT동아

거의 모든 무료 번역 서비스는 번역 가능한 문자 수에 제한을 둔다. 서버에 업로드하는 것 자체도 비용이 들기 때문이다. 그래서 긴 문서 전체를 번역하기보다는 문단씩 끊어서 번역해야 하고, 어쩔 수 없이 문맥이 달라지는 경우도 생긴다. 딥엘 프로의 경우 길이에 제약이 없기 때문이 긴 문서는 물론 책이나 회의록, 스크립트 등 대량의 문서를 번역하기에도 적합하다.

예시에서는 1시간 분량의 4만2657자 스크립트 전체를 번역하는데 약 15초 정도가 소요됐다. 특히 양쪽의 스크롤이 연동되어 쉽게 오르내릴 수 있고, 한글 문장을 선택하면 해당되는 영어 문장을 표시하는 등 세세한 부분에서 편의성이 있다. 번역해야 하는 내용이 굉장히 방대할 경우에는 활용 가치가 상당히 높은 대목이다. 다만 번역할 때 문장을 비격식 및 격식 버전으로 설정하는 기능, 그리고 특정 단어나 문장을 규칙에 맞게 자동으로 바꾸는 ‘나만의 용어집’ 기능은 아직 한국어를 지원하지 않는다.

기존 번역에 없는 싱글 사인 온, CAT 툴 통합도 지원

SSO의 경우 기업 환경에서, CAT 툴 지원은 전문 번역가들에게 도움이 될 기능이다 / 출처=IT동아

딥엘 프로는 다른 웹 기반 번역에서는 지원하지 않는 싱글 사인 온(SSO) 기능, 그리고 컴퓨터 보조 번역(CAT)도 활용할 수 있다. 싱글 사인 온은 하나의 로그인 인증 정보를 활용해 여러 앱에 접근할 수 있는 계정 관리 체계로, 사용자가 편리하게 다양한 서비스에 접근할 수 있도록 돕는다. 현재 SSO를 사용하고 있는 기업 환경이라면 다른 서비스를 쓰다가도 딥엘 프로를 로그인하지 않고 바로 쓸 수 있다.

또한 번역가들이 사용하는 프로그램인 컴퓨터 보조 번역(CAT)에 플러그인 형태로 활용할 수 있다. CAT는 일반 번역기능에서 전문 용어 데이터베이스나 색인, 텍스트 비교, 프로젝트 관리 소프트웨어, 번역 결과 데이터베이스화 등을 지원하는 전문가용 번역 프로그램이다. 현재 Trados Studio 2017 이상, MemoQ 8.5 이상, Wordfast, Across 등 10가지 프로그램에서 사용할 수 있어서 전문가의 활용도를 높일 수 있다.

유료 사용은 생소한 번역, 국내 시장에서 통할까?

딥엘 역시 구글과 파파고와 마찬가지로 무료 번역을 제공한다. 따라서 프로 버전은 기업이나 전문가용이라고 보는 게 맞다 / 출처=IT동아

사람들은 이미 번역기를 무료로 사용하는 데 익숙해져 있고, 그래서 딥엘 프로의 시도는 다소 무모해 보일 수 있다. 하지만 딥엘 프로는 데이터를 학습에 사용하지 않는다는 부분 하나만으로 기업 시장에서 주목받을 수 있다. 최근 삼성전자와 애플은 엔지니어들이 허가 없이 내부 코드를 챗GPT에 업로드한 사건을 계기로 임직원의 챗GPT 사용을 금지한 바 있다. 기업 입장에서는 무료 번역기 역시 챗GPT와 똑같이 위험한 경로다. 이런 우려를 해소할 수 있다는 점만으로도 한국은 물론 글로벌 시장에서 충분히 수요를 끌어올 수 있을 것이다.

다만 완성도는 더 끌어올려야 한다. 번역의 완성도에 대해 주관적으로 평가하자면, 구글이나 파파고의 결과에 비해 문맥이나 흐름은 매끄럽지만 품질이 차별화된 정도는 아니다. 유료 버전이라면 조금 더 인상적인 결과를 내놓아야 한다. 또한 문서 번역 시 배치가 틀어진다던가, 광학 문자 인식률이 떨어지는 부분 등도 해결해야 할 과제다. 구글과 네이버도 시도하지 못한 번역 유료 서비스가 국내 시장에서 얼마나 성공을 거둘지는 지켜볼 일이다.

동아닷컴 IT전문 남시현 기자 (sh@itdonga.com)

Copyright © 동아일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?