"중간에 말 끊어도 맥락 이해"…오픈AI, 새 음성모델 내놔
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
오픈AI가 음성을 자연스럽게 인식하고 반응하는 모델을 선보였다.
오픈AI는 7일(현지시간) GPT-5급 추론 능력을 갖추고 사람의 자연스러운 대화 양식을 반영한 음성 모델 'GPT-리얼타임-2'를 공개했다.
오픈AI는 음성을 실시간으로 번역해주는 모델 'GPT-리얼타임-트랜슬레이트'와 실시간 받아쓰기 모델인 'GPT-리얼타임-위스퍼'도 함께 선보였다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
사람처럼 자연스러운 대화
오픈AI가 음성을 자연스럽게 인식하고 반응하는 모델을 선보였다. 피지컬 인공지능(AI) 시대에 대비하기 위한 것이란 분석이 나온다.
오픈AI는 7일(현지시간) GPT-5급 추론 능력을 갖추고 사람의 자연스러운 대화 양식을 반영한 음성 모델 'GPT-리얼타임-2'를 공개했다. 기존 모델에서는 사용자 말을 AI가 텍스트로 변환해 인식하는 과정을 거쳤지만 새로운 모델에서는 음성 자체를 인식해 반응한다. 이용자가 AI의 답변 내용을 중간에 끊고 말하거나 내용을 중간에 고쳐 말해도 사람처럼 자연스럽게 대답한다. 경우에 따라 추론 수준도 선택할 수 있다. 지연 시간도 획기적으로 줄였다고 오픈AI 측은 설명했다.
오픈AI는 음성을 실시간으로 번역해주는 모델 'GPT-리얼타임-트랜슬레이트'와 실시간 받아쓰기 모델인 'GPT-리얼타임-위스퍼'도 함께 선보였다. 오픈AI가 음성 서비스 고도화에 나선 배경으로는 피지컬 AI가 꼽히고 있다.
자율주행차, AI 로봇, 스마트안경 등에서는 음성 인식 기능이 기초적인 인터페이스(사용자와 컴퓨터 간 소통 도구)가 될 것으로 예상된다.
오픈AI는 애플 제품 디자인을 총괄했던 조니 아이브의 스타트업 'io'를 지난해 65억달러에 인수한 후 음성 조작 AI 기기를 준비 중인 것으로 전해졌다. 오픈AI는 "실시간 음성 기술이 단순한 문답 수준을 넘어 대화 흐름에 따라 이용자의 말을 듣고 추론하며 번역하고 받아 적으면서 작업을 수행할 수 있도록 발전시키고 있다"고 설명했다. 실제 기업들의 오픈AI 음성 서비스 도입 사례도 소개됐다. 부동산 플랫폼 '질로'는 고객이 음성으로 설정한 조건에 맞춰 매물을 검색하고 방문 일정을 잡아주는 음성 비서를 구축 중이다. 유럽 통신사 도이체텔레콤은 고객이 가장 편한 언어로 소통할 수 있는 고객 지원 실시간 번역 서비스를 테스트하고 있다.
[강영운 기자]
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- 김현태 전 707단장, 재보선 인천 계양을 출마…“권력에 부당 숙청돼” - 매일경제
- [속보] 삼성전자 초기업노조 “정부 요청 수용, 사후조정 절차 돌입” - 매일경제
- “쿠팡 끄떡없겠는데?” 말해놓고…8000억원어치 지분 정리한 2대 주주 - 매일경제
- “삼성전자 전부 판 이유”…김승호 회장이 직접 밝힌다 - 매일경제
- “절대 안된다고 그렇게 말씀드렸잖아요”…‘포모’에 급증하는 빚투 - 매일경제
- ‘자금 압박’ 홈플러스, 37개 매장 영업 잠정중단…2차 구조조정 - 매일경제
- “휴전 협상한다더니”…‘호르무즈 교전’에 국제유가 상승세 반전 - 매일경제
- “코스피 7500 과열 아니다…일본 비하면 아직 덜 올랐다” - 매일경제
- 구윤철 “‘조정지역 임대아파트 양도세 중과배제 과도’ 지적 살피는 중” - 매일경제
- 한화, 양상문 코치 잔류군 투수 코치로 보직 변경…1군 박승민 코치 체제 유지 - MK스포츠