오픈AI, 실시간 음성 AI모델 공개…새 AI기기 출시 포석인듯

권영전 2026. 5. 8. 04:08
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

챗GPT 개발사 오픈AI가 끊김 없이 이용자의 음성을 인식하는 실시간 인공지능(AI) 모델을 선보였다.

오픈AI는 GPT-5급 추론 능력을 갖추고 실제 사람들의 자연스러운 대화 행태를 반영한 음성 모델 'GPT-리얼타임-2'를 7일(현지시간) 공개했다.

오픈AI는 음성을 실시간으로 번역해주는 모델 'GPT-리얼타임-트랜슬레이트'와 실시간 받아쓰기 모델인 'GPT-리얼타임-위스퍼'도 함께 선보였다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

성인 계정에도 자해 등 위기 감지시 지인 통보 기능 도입
오픈AI [로이터=연합뉴스 자료사진. 재판매 및 DB 금지]

(샌프란시스코=연합뉴스) 권영전 특파원 = 챗GPT 개발사 오픈AI가 끊김 없이 이용자의 음성을 인식하는 실시간 인공지능(AI) 모델을 선보였다.

오픈AI는 GPT-5급 추론 능력을 갖추고 실제 사람들의 자연스러운 대화 행태를 반영한 음성 모델 'GPT-리얼타임-2'를 7일(현지시간) 공개했다.

이 모델은 이용자와 AI가 번갈아 말해야 했던 기존의 AI 모델과 달리 이용자가 AI의 답변 내용을 중간에 끊고 말하거나, 앞서 말했던 내용을 중도에 고쳐 말해도 즉각 반응하도록 한 것이 특징이다.

또 상황에 따라 말투를 조절할 수도 있고, 개발자가 빠른 답변이 필요한 업무와 신중한 답변이 필요한 업무 등에 맞춰 추론 수준을 선택할 수도 있도록 했다.

오픈AI는 음성을 실시간으로 번역해주는 모델 'GPT-리얼타임-트랜슬레이트'와 실시간 받아쓰기 모델인 'GPT-리얼타임-위스퍼'도 함께 선보였다.

오픈AI는 "실시간 음성 기술이 단순한 문답 수준을 넘어서서 대화 흐름에 따라 이용자의 말을 듣고 추론하며 번역하고 받아적으며 작업을 수행할 수 있도록 발전시키고 있다"고 개발 배경을 설명했다.

실제 기업들의 도입 사례도 소개됐다. 부동산 플랫폼 질로(Zillow)는 고객이 음성으로 설정한 조건에 맞춰 매물을 검색하고 방문 일정을 잡아주는 음성 비서를 구축 중이며, 유럽 통신사 도이체텔레콤은 고객이 가장 편한 언어로 소통할 수 있는 고객 지원 실시간 번역 서비스를 테스트하고 있다.

오픈AI가 이 같은 음성 모델을 개발한 것은 외부 기업들의 수요 외에 자체 AI 기기 준비에도 필요했기 때문으로 풀이된다.

오픈AI는 애플의 제품 디자인을 총괄했던 조니 아이브의 스타트업 'io'를 지난해 65억 달러에 인수한 이후 음성으로 조작할 수 있는 AI 기기를 준비 중이다.

오픈AI가 내놓을 제품으로는 스마트 안경이나 옷에 부착할 수 있는 핀 형태의 스마트 기기, 스마트 스피커 등이 지목되고 있다.

궈밍치(郭明錤) 대만 TF인터내셔널증권 분석가는 오픈AI가 AI 에이전트 기능을 탑재한 자체 스마트폰을 개발하고 있다는 관측을 최근 내놓기도 했다.

한편 오픈AI는 이날 챗GPT에 '신뢰할 수 있는 연락처'라는 안전 기능을 새로 도입했다고도 밝혔다.

챗GPT가 대화 중 자해를 비롯한 이용자의 정신건강 위기 상황을 감지하면 사전에 지정한 가족이나 친구 등 지인에게 알림을 보내 도움을 받을 수 있도록 연결해주는 기능이다.

이는 청소년 등 미성년자 계정에는 이전부터 있었던 기능으로, 이번에 성인 계정으로 확대된 것이다.

comma@yna.co.kr

▶제보는 카톡 okjebo

Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지