구글, 70개 언어 실시간 통역 ‘제미나이 3.5 라이브 트랜슬레이트’ 출시
70개 이상 언어 자동으로 인식
화자 억양·속도·감정 반영한 음성

구글은 9일(현지시간) 제미나이 3.5 라이브 트랜슬레이트를 공개하고 구글 번역, 구글 미트, 제미나이 라이브 API 등에 순차 적용한다고 밝혔다.
이번 모델은 70개 이상 언어를 자동으로 인식할 수 있다. 사용자가 사전에 언어를 설정할 필요 없이 대화를 듣고 언어를 판별해 번역한다. 여러 언어가 섞여 있는 환경에서도 작동한다.
가장 큰 변화는 번역 방식이다. 기존 실시간 번역 시스템은 한 사람이 말을 마칠 때까지 기다린 뒤 번역 결과를 내놓는 구조였다. 이 때문에 대화 흐름이 자주 끊기고 어색한 침묵이 발생했다.
반면 제미나이 3.5 라이브 트랜슬레이트는 음성이 입력되는 즉시 번역을 시작한다. 번역 품질을 높이기 위해 문맥을 일부 기다리면서도 최대한 빠르게 결과를 생성하는 균형을 AI가 스스로 판단한다. 구글은 “발화자보다 몇 초 정도만 뒤처진 상태로 자연스럽게 통역이 이어진다”고 설명했다.
단순히 단어를 바꾸는 수준도 아니다. 화자의 억양과 말하는 속도, 음 높이, 감정 표현까지 최대한 유지해 번역 음성을 생성한다. 기계가 읽는 듯한 단조로운 음성이 아니라 원래 화자의 말투를 반영한 자연스러운 음성 번역을 목표로 했다.
실제 활용 범위도 넓다. 구글은 다국어 회의, 국제 전화, 수업, 방송, 고객 상담, 관광 가이드, 차량 호출 서비스 등 다양한 환경에서 활용할 수 있다고 설명했다. 특히 소음이 많은 장소나 여러 사람이 동시에 말하는 상황에서도 동작할 수 있도록 설계됐다.
구글의 동남아시아 플랫폼 기업 그랩은 이미 해당 기술을 시험 중이다. 그랩은 운전자와 승객 간 다국어 통화를 실시간에 가깝게 번역하는 기능을 테스트하고 있다. 그랩 이용자들은 매달 1000만건 이상 음성 통화를 이용한다. 구글은 기업용 화상회의 서비스인 구글 미트에도 해당 기술을 적용한다. 지금까지는 5개 언어만 지원했지만 앞으로는 70개 이상 언어를 지원한다. 영어를 중심으로 번역하던 기존 방식에서 벗어나 하나의 회의에서 2000개 이상 언어 조합 간 통역이 가능해진다.
기업고객 대상 비공개 시험 서비스는 이달부터 시작되며 연내 일반 기업고객으로 확대될 예정이다.
일반 소비자는 이날부터 안드로이드와 iOS용 구글 번역 앱에서 이용할 수 있다. 이어폰을 연결하면 상대방 말을 실시간으로 번역해 들을 수 있다. 안드로이드에는 새로 추가된 ‘리스닝 모드’도 제공된다. 사용자가 전화 통화하듯 스마트폰을 귀에 대면 번역 음성을 이어폰 없이도 들을 수 있다.
구글은 “20년 전 기계번역 실험으로 시작한 기술이 이제 매달 수조 개 단어를 번역하는 서비스로 성장했다”며 “언어장벽 없이 자연스럽게 대화할 수 있는 미래에 한 걸음 더 다가섰다”고 밝혔다.
[실리콘밸리 원호섭 특파원]
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- “나랏빚 넘치는데 지원금 뿌리는 정치인, 뽑는 유권자…모두 원시인이죠” - 매일경제
- “삼성·LG, 인심 한번 후하게 쓰네”…가전제품 ‘반값’ 전쟁 시작 - 매일경제
- 결혼 아닌 결별…수영·정경호, 14년 열애 마침표 - 매일경제
- 이익은 TSMC 압도하는데…“삼전닉스 주가 여전히 4배 저평가” - 매일경제
- 지방선거 후폭풍?…이재명 대통령 지지율 50.4%로 급락 [KSOI] - 매일경제
- ‘투표지 50%만 인쇄’, 선관위 회의도 없이 내부 2명이 결재했다 - 매일경제
- 삼전 노조도 접었는데 카카오에서는…창사 이래 첫 파업 시작 - 매일경제
- “이거 놔두면 수능 난리납니다”…토익시험서 ‘AI글라스’ 커닝시도 첫 적발 - 매일경제
- “아들 놈이 아직 백수라서요”…70세 이상 고령 취업자, 200만명 넘었다 - 매일경제
- 이정후, 16경기 연속 안타...한국인 빅리거 타이 기록 달성 [MK현장] - MK스포츠