< What >번역 기술 어디까지 왔나.. 기계식 번역서 통계식 → AI로 진화 거듭


- 문장 통째로 파악 NMT는 ‘스스로 수정’
10년 개발한 ‘통계기반 SMT’
실수잦던 기계번역 오류 잡아
데이터 쌓일수록 정확도 향상
최근 AI 기반한 ‘NMT’ 등장
아기 말 배우듯 ‘데이터 학습’
SMT보다도 품질 2배로 좋아
발음·사투리 등 음성인식 과제
2000년대 중반까지만 해도 온라인에는 번역 프로그램을 활용한 우스개들이 나돌았다. 이른바 ‘번역기 개그’였다.
동요 ‘짤랑짤랑’의 가사 ‘으쓱으쓱’ 부분을 번역기는 ‘공포의 떨림과, 공포의 떨림과(with a shudder of horror, with a shudder of horror)’로 번역했다. ‘강아지’의 ‘학교 갔다 돌아오면 멍 멍 멍’ 부분의 멍 멍 멍은 ‘타박상, 타박상, 타박상(bruise, bruise, bruise)’으로 번역됐다.
문자 그대로 ‘기계식 번역(규칙기반 기계번역·Rule-based Machine Translation)’이다. 규칙기반 기계번역 초기에 사용된 방식으로 규칙에 맞는 언어를 미리 구현해놓고 해당 단어가 등장하면 매칭되는 언어를 적용하는 방식이다. 규칙에 맞는 언어의 경우 올바르게 번역하지만 그렇지 않을 경우 번역 오류가 상당히 높다는 단점이 있다.
번역기는 ‘으쓱’을 공포의 떨림으로, ‘멍’을 타박상으로 인식해 번역했기 때문에 훌륭한 개그 소재가 될 수 있었다.
규칙기반 기계번역의 대안으로 떠오른 것이 최근 10년 동안 개발돼온 ‘통계기반 기계번역(SMT·Statistical Machine Translation)’이다. 대규모 데이터를 기반으로 단어와 문구(Phrase) 형식으로 각각 나눠 번역·조합하는 방식이다. 예전에는 단어 단위로 번역했지만 문구 형식 기반 번역으로 발전했다. 문구 단위가 단어 단위보다 모호성이 낮기 때문이다. ‘eat apple=사과를 먹다’ ‘eat banana=바나나를 먹다’를 바탕으로 ‘eat X=X를 먹다’고 번역하는 방식이다.
통계가 적중할 확률을 높이려면 많은 데이터 확보가 관건이다. 인터넷 전체를 데이터베이스화해 온 구글은 이런 면에서 강했다. 그러나 이 역시 완전하지 않았다. SMT는 많은 데이터베이스가 구축되면 번역의 정확도가 높아지지만 사용 빈도가 낮은 언어에서는 문법 정확도가 떨어지기 때문이다. 과거 구글 번역기에서 영어를 한국어로 번역하는 경우 바로 번역하는 것보다 영어를 일본어로 번역한 뒤 이를 다시 한국어로 번역하는 게 정확도가 더 높았던 이유였다.
최근 인공지능(AI)의 발전으로 성경에서 바벨탑을 쌓는 인간의 오만을 벌한 신의 뜻이 도전받고 있다. AI에 기반을 둔 인공신경망 기계번역(NMT·Neural Machine Translation)의 등장이 그것이다. NMT 방식도 다량의 데이터를 이용한다는 점에서는 통계 방식과 같지만, 방법이 전혀 다르다. NMT는 아기가 시행착오를 겪으면서 무언가를 배우듯 우리 뇌의 뉴런을 흉내 낸 AI 프로그램을 만들고 이 AI에 수많은 한글-영어 번역 데이터를 줘서 스스로 학습하도록 한다.
이 경우 단어나, 문구가 아닌 문장 전체를 분석하기 때문에 맥락에 대한 이해도가 높아진다. NMT는 먼저 문장을 통째로 파악하고 어순·의미·문맥별 의미 차이 등을 반영해 스스로 수정한 뒤 번역 결과물을 내놓는다. ‘아침에 일찍 일어나 아침을 먹는다’라는 말을 번역할 때 ‘Morning’과 ‘Breakfast’를 구분할 수 있게 된다는 의미다.
최근 NMT 방식 번역 서비스 파파고 베타를 선보인 네이버 측은 “테스트 결과 NMT 방식이 세상에 등장한 지 1∼2년밖에 안 됐는데 10년 이상 진화해온 기존 SMT보다 약 2배가량 품질이 더 좋은 것으로 나타났다”면서 “현재 지원하는 한국어, 영어, 중국어, 일본어 이외에 스페인어, 프랑스어, 인도네시아어, 태국어, 대만어, 베트남어 등 6개 언어 간의 번역 서비스도 올해 중에 확대할 계획”이라고 말했다.
다만 현재까지 소개된 번역 프로그램들의 경우 텍스트를 입력해 번역하는 것에 비해 음성 인식은 정교함이 떨어진다는 단점이 있다. 짧은 문장은 인식률이 높지만 문장이 길어질수록 오차가 커진다. 향후 고도화에 집중해야 할 부분이다. 다양한 발음에 따른 인식 정확도 개선, 사투리 등을 구분하는 고차원 기능은 음성인식 연구자가 풀어야 할 숙제로 거론된다.
임정환 기자 yom724@munhwa.com
[문화닷컴 바로가기|소설 서유기|모바일 웹]
[Copyrightⓒmunhwa.com '대한민국 오후를 여는 유일석간 문화일보' 무단 전재 및 재배포 금지(구독신청:02)3701-5555/모바일 웹:m.munhwa.com)]
Copyright © 문화일보. 무단전재 및 재배포 금지.
- "美, 북한 타격한다면 정권 괴멸 목표 전면 공격될 것"
- 별 뗐다 붙였다..김정은 현란한 '계급장 길들이기'
- < Her Story >양수경 "지금 내 재산은 제로.. 아이들 지키려 무대로"
- 미국, 日정부에 '북한에 대한 군사공격 가능성' 언급
- '나쁜 사람' 노태강 "朴, 유독 승마만 챙겨 돌아버릴 지경"
- <대선 D-27>"박지원 2선 퇴진".. 安 선대위 갈등 속 인선
- <대선 D-27>김종인 "대선 불출마".. 홍석현도 "출마 의사 없다"
- "생리 도벽.. " 금팔찌 훔쳐 엉덩이 사이 숨기는 20대녀
- 한국 여자축구, 북한 제치고 내년 아시안컵 본선행
- 백악관 北공습 질문에 "트럼프, 필요하다면 행동할것"