GPT의 진화…눈·입을 달았다

이덕주 특파원(mrdjlee@mk.co.kr), 이상덕 기자(asiris27@mk.co.kr) 2024. 5. 14. 18:03
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

13일(현지시간) 챗GPT를 만드는 오픈AI가 공개한 최신 인공지능(AI) 모델 'GPT-4o'와 인간이 음성으로 대화한 내용이다.

오픈AI의 챗GPT가 사람과 가까운 수준으로 음성대화 능력을 갖추게 된 것은 지연 시간을 최대한 줄이고 GPT를 '제로'부터 새롭게 만들었기 때문이다.

2022년 11월 챗GPT가 공개되고 1년 반 만에 음성으로 사람처럼 대화하는 AI까지 등장한 것이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

음성AI 도약에 세계가 들썩

◆ 진화하는 AI ◆

"오늘 오픈AI에서 무슨 중요한 발표가 있나요?"(챗GPT)

"너에 대해 발표할 거야."(인간)

"(웃음) 저에 대해서 발표한다고요? 흥미가 생기는데요?"(챗GPT)

13일(현지시간) 챗GPT를 만드는 오픈AI가 공개한 최신 인공지능(AI) 모델 'GPT-4o'와 인간이 음성으로 대화한 내용이다. 이날 공개한 GPT-4o는 영화 '그녀(Her)'에서 등장했던 여성AI에 근접한 대화능력을 갖추고 있었다. 대화를 하나씩 주고받는 것이 아니라 사람이 AI의 말을 끊고 끼어들 수 있어 실제 사람과 이야기하는 것처럼 빠른 속도로 대화가 가능하다. GPT-4o는 대화하는 사람의 음성을 인식해 감정을 이해할 수 있고 노래를 부르거나 개인교사가 되어 1대1로 인간을 가르쳐주는 것도 가능하다. 오픈AI는 이날 시연을 통해 챗GPT끼리 서로 얘기를 나누거나 챗GPT가 두 사람이 가위바위보 하는 것을 실시간으로 설명해주는 모습도 보여줬다.

오픈AI의 챗GPT가 사람과 가까운 수준으로 음성대화 능력을 갖추게 된 것은 지연 시간을 최대한 줄이고 GPT를 '제로'부터 새롭게 만들었기 때문이다. 기존 챗GPT의 음성대화 모드에서는 응답까지 기다리는 시간이 2.8초였다. 하지만 오픈AI는 GPT-4o에서 이를 평균 0.32초로 10분의 1 정도 단축했다. 이는 인간 사이 일반적인 대화에서 응답하는 속도와 비슷한 수준이다. 오픈AI에 따르면 GPT-4o는 텍스트·시각·음성을 하나로 통합한 새로운 모델을 처음부터 구축했다.

오픈AI가 기존 음성AI보다 훨씬 진일보한 모델을 공개하면서 음성AI 개발 경쟁에 불이 붙었다. 구글이 자체 개발한 AI인 제미나이 음성AI 비서를 업그레이드할 것으로 예상되는 가운데 애플도 다음달 음성AI '시리'의 새로운 버전을 발표할 예정이다. 삼성전자의 '빅스비'와 아마존의 '알렉사'도 오픈AI 따라잡기에 나설 것으로 전망된다.

한편 GPT-4o는 AI의 발전 속도가 점점 가속화되고 있음도 보여줬다. 2022년 11월 챗GPT가 공개되고 1년 반 만에 음성으로 사람처럼 대화하는 AI까지 등장한 것이다.

이같이 급속하게 발전하는 AI와 '인공지능 위험'을 주제로 미국과 중국은 14일 스위스 제네바에서 첫 고위급 회담을 열었다. 이번 회담은 작년 11월 양국이 정상회담에서 AI 분야에 관한 대화가 필요하다는 데 공감한 것에 따른 것이다.

[실리콘밸리 이덕주 특파원 / 이상덕 기자]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?