구글 번역, 말 끝나기 전에 옮긴다…70개 언어 실시간 번역

한영훈 2026. 6. 10. 13:19
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

AI가 대화 중 언어 자동 감지해 음성 번역
억양·말투 반영…지연 시간 몇 초 수준
번역 앱부터 적용…구글 미트는 기업 고객 시험 제공
[출처=구글 연합뉴스]
구글이 70개 이상 언어를 실시간으로 통역하는 인공지능(AI) 번역 모델을 공개했다. 상대방의 말을 끝까지 들은 뒤 번역하는 기존 방식보다 지연 시간을 줄이고, 말하는 사람의 억양과 말투까지 살리는 데 초점을 맞췄다.

구글은 9일(현지시간) 새 실시간 음성 번역 모델 ‘제미나이 3.5 라이브 트랜슬레이트’를 공개했다. 이 모델은 구글 번역 앱과 화상회의 서비스 구글 미트, 개발자용 제미나이 라이브 API(실시간 음성 기능 연동 도구) 등에 차례로 적용된다.

새 모델은 이용자가 번역할 언어를 미리 고르지 않아도 대화 속 언어를 자동으로 알아듣는다. 70개 이상 언어를 음성으로 인식해 다른 언어의 음성으로 바꿔준다. 여러 언어가 섞인 대화에서도 사용할 수 있다.

가장 큰 변화는 통역 속도다. 기존 음성 통역은 상대방의 말이 끝난 뒤 번역 음성을 내보내는 경우가 많았다. 새 모델은 상대방이 말하는 동안에도 번역 음성을 이어서 들려준다. 구글은 원래 말과 번역 음성 사이의 차이가 몇 초 수준에 그친다고 설명했다.

음성 품질도 개선했다. 단순히 문장의 뜻만 옮기는 것이 아니라, 원래 화자의 억양과 말투, 말의 빠르기, 음높이를 최대한 반영한다. 기계적으로 읽어주는 번역 음성이 아니라 실제 대화에 가까운 음성을 구현하려는 것이다.

새 모델은 안드로이드와 iOS용 구글 번역 앱에 모두 적용된다. 이용자는 이어폰을 연결해 실시간 음성 번역을 들을 수 있다. 안드로이드에서는 스마트폰을 귀에 대면 통화하듯 번역 음성을 들을 수 있는 ‘듣기 모드’도 제공된다.

이 기능을 이용하면 여행 중에도 현지인과 서로 다른 언어로 대화할 때 스마트폰을 통해 실시간에 가까운 음성 통역을 받을 수 있다.

구글 미트에는 일부 기업 고객부터 먼저 적용된다. 구글은 이달 기업용 구글 워크스페이스 고객을 대상으로 새 음성 번역 기능을 시험 제공하고, 연내 적용 대상을 넓힐 계획이다. 다국어 회의에서 발언을 실시간으로 번역해 전달하는 용도다.

개발자용은 제미나이 라이브 API와 구글 AI 스튜디오를 통해 시험 공개된다. 개발자들은 이 기능을 활용해 실시간 음성 번역 서비스를 만들 수 있다. 아고라와 라이브킷 등 실시간 미디어 플랫폼도 관련 기능 연동을 지원한다.

차량 호출 서비스 그랩은 이 모델을 운전자와 여행객 간 다국어 통화에 활용하는 방안을 테스트하고 있다. 서로 다른 언어를 쓰는 운전자와 승객이 앱 안에서 통화할 때 실시간 번역을 제공하는 방식이다.

구글은 AI가 만든 음성임을 식별할 수 있도록 모든 생성 음성에 신스ID 워터마크를 적용한다고 밝혔다. 신스ID 워터마크는 AI로 만들어진 음성에 보이지 않는 식별 표시를 넣는 기술이다.