단어 쪼개지않고 전체 문장 번역.. 논문·외신도 알아서 척척
문학적 의미도 상당 수준 반영, 음성으로 문장 말해도 되고 日語·中語도 번역 잘해
"답은 바람 속에 있는 것이다."
올해 노벨 문학상을 수상한 미국의 전설적인 포크송 가수 밥 딜런의 대표곡 '바람만이 아는 대답(Blowin' In The Wind)'의 후렴구 'The answer is blowin' in the wind'라는 문장을 네이버의 인공지능(AI) 번역 앱 '파파고'에 입력했을 때 나온 한글 번역문이다. 한글로 번안한 문장이 '바람만이 아는 대답'이라는 점을 감안해보면 밥 딜런이 내포한 문학적 의미를 상당 수준 반영한 번역이라고 볼 수 있다.
번역 앱·서비스의 품질이 급속도로 개선되고 있다. 네이버가 지난 10월 출시한 '파파고'와 구글이 지난달 업그레이드한 '구글 번역기'는 모두 인공지능에 기반을 둬 어순과 문맥에 맞는 번역 서비스를 제공한다. 네이버 관계자는 "예전에는 사전에서 하나하나 찾는 방식이었다면, 지금의 번역 서비스 방식은 영어와 한국어를 모두 유창하게 하는 전문 번역가에게 물어보는 방식이라고 생각하면 된다"고 말했다. 과연 네이버와 구글 번역 서비스의 품질은 어느 수준이고, 어떤 기술을 기반으로 할까.
◇논문·외신 번역도 척척 "We're now an independent company within the Alphabet umbrella."
13일(현지 시각) 구글의 모(母)기업인 알파벳으로부터 독립한 자율주행자동차(무인차) 업체 '웨이모'의 존 크래프칙 최고경영자(CEO)의 말이다. 구글 번역기에 넣어 번역해보니 '우리는 이제 Alphabet(알파벳) 우산 내의 독립적인 회사입니다'고 나왔다.
알파벳이 '문자'라는 의미로 직역된 것이 아니라 회사명으로 쓰였다는 것을 정확하게 파악했다. 어순 역시 한글 어순에 맞춰서 번역했다. 정치·경제·과학 관련 외신과 논문들에 실린 원문도 구글 번역기와 네이버 파파고에 입력해보니 상당히 정확하게 번역했다. 일상생활이나 공부할 때 사용해도 전혀 불편함이 없을 정도였다. 일본어, 중국어도 한글로 번역해보니 큰 불편 없이 잘 번역했다.
음성 번역도 가능하다. 예를 들어 음성으로 문장을 말하고 이를 번역하면 영어로 다시 이야기하는 식이다. 이를 잘 활용하면 해외여행을 갔을 때 현지 언어를 잘 몰라도 의사소통이 가능하다. 식당에 들어가 주문을 할 때 "세트 A 주세요"라고 말하고 번역기를 돌리면 "Give me Set A"라고 스마트폰에서 나오고, 종업원이 "Would you like to drink something?"이라고 묻는 말을 스마트폰으로 듣고 번역하면 "뭐 마시고 싶으신 건 없으신가요?"라는 식으로 한글로 나오는 것이다.
현재 출시된 인공지능 기반 번역 서비스 가운데 가장 많은 언어를 번역하는 서비스는 구글 번역기다. 구글은 한국어와 영어를 비롯해 프랑스어, 독일어, 스페인어, 중국어, 일본어, 터키어까지 총 8개 언어를 인공지능에 기반을 둬 번역한다.
동남아시아와 인도 일대를 제외하고 가장 많이 쓰이는 언어는 모두 인공지능이 번역하는 것이다. 네이버의 파파고는 한국어·영어·일본어·중국어에 특화돼 있다. 이는 한국 사용자들이 가장 많이 찾는 언어 위주로 서비스를 구축했기 때문이다.
◇비슷한 뜻 가진 단어와 문장 묶어 분류·해석 네이버와 구글의 번역 서비스는 '인공신경망 기계 번역'(NMT) 기술에 기반을 둔다. 이 기술의 핵심은 문장을 단어별로 쪼개서 해석하는 게 아니라 전체 문장을 하나로 번역한다는 점이다. 예전에는 'I love you'라는 문장을 번역 서비스에 넣으면 '나는 사랑한다 너를'이라고 번역됐다. 한글과 영어는 어순이 달라, 단어 기준으로 번역하면 어색해진다.
하지만 NMT 기술에 기반을 두면 한글과 영어의 어순 차이를 이해하고 이를 바로잡아준다. 'I love you'를 입력하면 '나는 너를 사랑한다'는 번역 결과가 도출되는 것이다.
문맥에 따라 맞는 번역을 제공할 수도 있다. 예를 들어 '아침'이라는 단어는 한국에서 아침 식사라고 쓰이는 경우도 있고, 실제 시간상의 아침을 뜻하는 경우도 있다. 기존에는 '나는 아침 일찍 아침 준비를 했다'는 문장을 번역했을 때 둘 다 'morning'으로 썼다. 하지만 인공신경망 기계 번역이 적용되면 시간을 의미하는 아침은 'morning', 식사를 뜻하는 아침은 'breakfast'로 해석된다. 게다가 인공신경망 기계 번역은 사용량이 많아질수록 다양한 언어와 어순, 문맥을 배우고 스스로 익히기 때문에 점점 번역 품질이 올라간다. 인공지능에 기반을 뒀기 때문에 스스로 학습하는 능력이 있는 것이다.
AI는 어떻게 학습할까. 간단하게 설명하면 '카테고리 분류'라고 요약할 수 있다. 비슷한 의미를 가진 단어나 문장을 특정 기준에 맞춰 분류한 뒤 배운다는 것이다. 예를 들어 고양이를 뜻하는 'cat'이라는 단어 옆에는 새끼 고양이를 뜻하는 'kitten'을 두고, 그 반대편에는 개를 의미하는 'dog'를 두는 식이다. 이를 통해 비슷한 단어나 문장을 한 묶음으로 분류한 뒤 적절한 뜻을 가지고 오는 방식이다.
네이버 관계자는 "사람이 뇌로 생각하는 것처럼 AI 엔진이 다양한 경우의 수를 파악하고 여기서 가장 가까운 문장을 가져온다"고 말했다.
- Copyrights ⓒ 조선비즈 & ChosunBiz.com, 무단 전재 및 재배포 금지 -
Copyright © 조선비즈. 무단전재 및 재배포 금지.
- 분담금 대신 20억 돌려받는다?… 강동 상일동 고급빌라촌 재건축 ‘눈길’
- 중동 뒤흔든 작은 괴물… 현대戰 승패 좌우하는 ‘가성비’ 드론들
- “물량 끊기고 비용 폭등”…노란봉투법·중동發 악재에 우는 中企
- 위고비 중국 특허 만료 임박…글로벌 비만약 시장 가격 경쟁 확대
- [美 이란 공습] 전 세계 비료 공급망 붕괴 조짐… 애그플레이션 우려 확산
- 중고선이 새 배보다 비싸다… 초대형 유조선, 공급 대란에 이례적 ‘가격 역전’
- “한 달 기름값만 100만원 추가”... 경유 1900원 돌파에 화물차 ‘비명’
- 경기 침체·공급 과잉에 무너진 지식산업센터… ‘천안자이타워’도 공매 검토
- [재계 키맨] 실무에서 신세계그룹 키우고, 숫자로 성과 증명한 한채양 이마트 대표
- [단독] 삼성전자 임금협상 결렬 후 책임 공방… 협상 과정 공개 ‘이례적’