웹 번역기, 인공지능 속속 탑재 '실력이 많이 느셨군요'

목정민 기자 2016. 12. 4. 20:49
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[경향신문] ㆍIT업계, 번역 품질 끌어올리기 경쟁
ㆍ구글, 알파고에 쓴 머신러닝 적용…문장 의미까지 담아
ㆍ네이버 인공신경망 ‘파파고’는 관형어구에 정확도 높아


<여기를 누르면 크게 보실 수 있습니다>

번역기가 인공신경망 기계학습이라는 최신 인공지능 기술과 결합해 더욱 똑똑해졌다. 4일 정보기술(IT) 업계에 따르면 구글, 바이두, 네이버 등 인터넷 업체들이 인공지능 기술을 번역기에 적용해 품질을 끌어올리기 위해 각축을 벌이고 있다.

■자연스러운 번역 ‘구글 번역기’

다양한 인터넷 및 모바일 번역기 가운데 가장 인기가 높은 것은 글로벌 인터넷업체 구글이 최근 출시한 번역기다. 구글 번역기는 하루 번역 횟수가 1000억회에 달했는데 최근 인공지능과 결합하면서 그 사용 횟수가 더욱 늘어날 것으로 전망된다. 구글이 새로 출시한 번역기는 복잡한 영어 문장은 물론 문학작품에 나오는 문장도 자연스럽게 번역해 낸다. 법륜 스님의 말인 ‘삶이 그대로 복인 줄 알아야 돼요’라는 문장에 대해 구글은 ‘Life must be blessed as it is’라고 번역했다. 네이버 번역기가 ‘You needs to know what life is like’라고 번역해 직역 수준의 결과를 내놓은 것과 비교하면 구글 번역이 문장의 의미나 의도, 분위기를 더 잘 담아냈다는 평가다.

구글은 인공지능 알파고에 사용된 인공신경망 머신러닝 기술을 번역기에 적용했다. 인공신경망 기술은 인간의 뇌신경망 구조와 비슷하게 컴퓨터를 프로그래밍 해 외부에서 주어진 데이터를 스스로 학습하고 이를 통해 새로운 정보를 얻는 최신 인공지능 기술이다. 과거 구글은 문장을 구문 및 단어 단위로 쪼개 번역했지만 새로 나온 번역기는 문장을 통째로 번역한다. 전체 문맥을 파악한 뒤 적합한 번역을 하고 이를 문법 규칙에 따라 재배열하는 식이다. 영어와 한국어 번역을 기계학습한 뒤 한국어와 일본어 번역을 학습하면 인공지능이 스스로 영어와 일본어 학습까지 한다. 구글 측은 이를 통해 번역기의 기계학습 시간을 줄이고 실제 번역 시간도 줄일 수 있었다. 또 기존 통계 방식을 사용했던 구글 번역기에 비해 오류를 최대 85% 줄여 번역 정확도를 높였다고 보고 있다.

■아시아 언어 번역 최강자 바이두

중국 및 아시아권 나라에 출장 및 여행을 갔을 때는 바이두 번역기의 활용도가 높은 편이다. 중국 IT업체 바이두가 출시한 바이두 번역기는 아시아권 언어 번역에 강점을 보이고 있다. 업계 관계자는 “구글이 영어와 스페인어 등 서양권 언어 번역에 강하다면 바이두는 중국어, 일본어 등 아시아권 언어 번역에 강하다”며 “전 세계 번역기의 양대 산맥은 구글과 바이두”라고 말했다. 바이두는 ‘중국판 구글’로 불리는 업체로 구글이 2010년 검열 문제로 중국 시장에서 철수하면서 급성장했다. 바이두는 현재 독일어, 중국어, 영어, 일본어, 한국어, 태국어, 프랑스어, 포르투갈어 등 27개 언어에 대한 번역 서비스를 제공하고 있다. 인공신경망 기술을 적용해 번역 품질도 높였다. 국내에 알려진 정보가 많지는 않지만 바이두는 인공지능과 딥러닝 분야의 대가로 불리는 앤드류 응 미국 스탠퍼드대 교수를 영입해 인공지능 연구소 수장을 맡겨 인공지능 관련 연구의 품질을 높이고 있다.

■일본 여행할 땐 네이버 번역기

여행 및 업무상 일본을 방문할 때는 네이버 번역기가 자주 활용된다. 네이버는 현재 통계적 기계번역 방식을 사용하고 있음에도 한·일 번역의 정확도가 높다는 평가를 받고 있다. 네이버 관계자는 “라인 등의 서비스가 일본에서 인기를 끌면서 일본 쪽 자료가 풍부하게 쌓여 이를 바탕으로 번역기 성능이 좋아진 것”이라고 말했다. 또 한국어와 일본어는 어순이 비슷해 통계적 방식으로 번역을 해도 정확도가 높은 편이다. 네이버는 지난해 열린 ‘아시아 번역 품질 평가 대회’에서 한·일 번역 분야 1위를 차지하기도 했다. 이 대회는 일본 문부성 산하 과학기술진흥기구(JST)가 주관하는 아이아권 언어 중심의 국제 번역 품질 평가 워크숍이다.

네이버 측은 올해 10월 출시한 인공신경망 번역기 ‘파파고’가 일상 회화 및 한국어 특유의 관형어구 번역에 강점이 있다는 점을 강조하고 있다. 예를 들어 ‘영어 졸라 어려워’라는 문장에 대해 파파고는 ‘It is hard to master English’라고 번역한 반면 구글 번역기는 ‘English is hard to sleep’이라는 잘못된 번역 결과를 내놨다. ‘졸라’라는 단어는 10~20대가 사용하는 ‘아주’라는 뜻의 은어다. 네이버 측은 “네이버의 1인 미디어 방송 플랫폼인 V라이브에 실시간으로 올라오는 자막과 웹툰을 파파고가 학습하고 있어 일상어에 대한 번역 실력이 좋다”고 말했다. 현재 파파고는 한국어와 영어 번역만 서비스 중으로, 서비스 초기 단계다.

한컴인터프리의 ‘한컴 말랑말랑 지니톡’도 주목해볼 만한 번역기다. 지니톡은 한국전자통신연구원과 한컴인터프리가 공동개발한 번역기로 2018년 평창 동계올림픽에서 공식 통·번역기로 사용될 예정이다. 지니톡은 통계적 방식과 규칙 기반 번역을 혼용하고 있어 한국어 기반 통·번역에 강점을 보이고 있다. 한컴 측은 “한국어 기반의 데이터를 많이 적용해 정확도를 높이고 있다”며 “언어학자들이 각 언어의 문법을 고려해 문장을 만들어주기 때문에 통역 서비스에도 알맞은 번역 결과를 내놓을 수 있을 것으로 기대된다”고 말했다. 지니톡은 29개 언어 통·번역이 가능하다.

<목정민 기자 mok@kyunghyang.com>

Copyright © 경향신문. 무단전재 및 재배포 금지.