사람처럼 '실시간 대화' AI 나왔다…오픈AI, 'GPT-4o' 출시

오수연 2024. 5. 14. 07:03
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

챗GPT 개발사 오픈AI가 13일(현지시간) 실제 사람처럼 자연스럽게 대화할 수 있는 새로운 AI 모델을 공개했다.

주로 텍스트를 통해 대화하던 기존 모델과 달리 'GPT-4o'는 이용자와 실시간 음성 대화를 통해 질문하고 답변을 요청할 수 있는 AI 모델이다.

오픈AI는 'GPT-4o' 모델이 기존 GPT-4 터보보다 두 배 더 빠르고 비용은 2분의 1 수준이라고 밝혔다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

사람처럼 보고 듣고 응답
구글 행사 하루 전 '정면 승부'

챗GPT 개발사 오픈AI가 13일(현지시간) 실제 사람처럼 자연스럽게 대화할 수 있는 새로운 AI 모델을 공개했다. 구글의 연례 개발자 회의(I/O)를 하루 앞두고 정면 승부에 나섰다.

이날 미라 무라티 오픈AI 최고기술책임자(CTO)는 라이브 행사를 통해 'GPT-4o'(GPT-포오)를 공개했다.

주로 텍스트를 통해 대화하던 기존 모델과 달리 'GPT-4o'는 이용자와 실시간 음성 대화를 통해 질문하고 답변을 요청할 수 있는 AI 모델이다. 텍스트뿐 아니라 청각, 시각으로도 추론하고 답할 수 있는 것이다. 새 모델의 'o'는 '모든'이라는 뜻의 '옴니'(omni)에서 따왔다.

응답시간도 대폭 짧아졌다. GPT-4o의 응답 시간은 최소 232밀리초, 평균 320밀리초다. 오픈AI는 인간의 응답시간과 비슷한 수준이라고 설명했다. 이전 모델인 GPT-3.5는 평균 2.8초, GPT-4가 응답에 5.4초가 걸렸다. 반응 지연을 극복하고 실제 사람같이 실시간 대화가 가능해진 것이다.

GPT-4o는 시연에서 다양한 말투와 목소리, 감정, 톤을 바꿔가며 말하는 모습을 보였다. 비전 인식을 통해 간단한 수학 문제(3x+1=4)를 푸는 시연도 했다. 풀이법을 보여달라고 하자 차근차근 단계별로 설명했다. 사람처럼 세상을 보고, 듣고, 해답을 내놓는 것이다.

영화 '그녀(HER)'에서 주인공이 AI 사만다와 대화를 나누는 장면이 떠오른다. 샘 올트먼 오픈AI 최고경영자(CEO)는 이날 행사가 끝난 뒤 X(옛 트위터)에 'her'이라는 단어를 게시하기도 했다.

실시간 번역 기능도 제공한다. 오픈AI는 'GPT-4o' 모델이 기존 GPT-4 터보보다 두 배 더 빠르고 비용은 2분의 1 수준이라고 밝혔다. GPT-4 터보는 지난해 11월 선보인 최신 버전이다. 또 한국어 등 50개 언어에 대한 품질과 속도가 향상됐다.

모든 글로벌 이용자들에게 무료로 제공하지만, 기존 유료 이용자는 무료 이용자보다 5배 많은 질문을 할 수 있다. GPT-4o는 이날부터 사용 가능하며, AI 음성 모드는 몇 주 내에 공개될 예정이다.

무라티 CTO는 "사용 편의성에 관해 우리가 정말로 큰 진전을 이뤘다고 생각하는 것은 이번이 처음"이라고 말했다.

오픈AI의 이날 발표로 거대기술기업(빅테크) 간 AI 경쟁이 더욱 치열해질 전망이다. 구글은 최대 행사 중 하나인 연례 개발자 회의를 하루 앞두고 있다. 애플은 다음 달 열리는 연례 세계 개발자 회의(WWDC)에서 AI 전략을 발표할 것으로 보인다.

오수연 기자 syoh@asiae.co.kr

Copyright © 아시아경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?