“AI와 연애” 더 이상 영화 아니다…오픈AI, 사람처럼 말하는 GPT-4o 출시

2024. 5. 14. 09:24
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

보고 듣고 사람과 비슷한 속도로 응답
올트먼, AI 영화 ‘그녀’ 뜻하는 ‘her’ 적어
구글 행사 하루 전날 전격 공개
미라 무라티 오픈 AI 최고기술책임자(CTO)가 13일(현지시간) 라이브 행사에서 ‘GPT-4o(GPT-포오)’라는 이름의 새 AI 모델을 시연하고 있다. [오픈AI 유튜브 채널 캡처]

[헤럴드경제=김영철 기자] 2013년 개봉한 영화 ‘그녀(her)’는 편지 대필 작가인 주인공이 ‘사만다’라는 인공지능(AI)과 사랑에 빠지는 이야기다. 사만다는 회의 시간을 알려주는 것은 물론이고 주인공의 속마음까지 들어주는 친구다. 아내와의 별거로 우울한 삶을 살아가는 주인공을 위해 사만다는 놀이동산에 가자는 제안도 한다. AI와 사랑에 빠진다는 설정의 이 영화는 이제 더이상 SF(공상과학)가 아니게 됐다.

생성형 AI 선두주자 오픈AI가 13일(현지시간) 보고 듣고 말하는 새로운 AI 모델 ‘GPT-4o(GPT-포오)’를 공개했다. ‘o’는 모든 것이라는 ‘옴니(omni)’를 의미한다. 이 모델은 텍스트는 물론이고 청각과 시각으로도 추론하고 이용자 질문에 즉각적인 답변이 가능하다. 영화 속 AI처럼 완벽하지는 않지만 근접해 가고 있는 셈이다.

샘 올트먼 오픈AI 최고경영자(CEO)는 이날 ‘GPT-4o’를 공개한 뒤 소셜미디어 엑스(X·옛 트위터)에 이 영화를 뜻하는 ‘her’라고 적었다. 그러면서 “새로운 음성과 영상 모드는 내가 사용한 컴퓨터 인터페이스 중 최고”라고 자평했다.

올트먼은 “(AI 모델이)영화에 나오는 AI처럼 느껴지고, 그것이 현실이라는 게 조금 놀랍다”며 “인간 수준의 반응 시간과 표현력에 도달하는 것은 큰 변화”라고 말했다.

GPT-4o의 응답 시간은 최소 232밀리초, 평균 320밀리초로, 이는 인간의 응답시간과 비슷하다고 오픈AI는 설명했다. 이전 모델인 GPT-3.5는 평균 2.8초, GPT-4는 5.4초가 걸렸는데 GPT-4o는 사람과 같은 수준이다. 답 제공 중에 끼어들어도 대화는 끊어지지 않는다. 또 마치 감정과 표현력이 있는 것처럼 이용자의 요구에 다양한 목소리와 감정, 톤으로 바꿔가며 이야기를 들려준다.

오픈AI가 이날 라이브로 진행한 시연에서 ‘내가 좀 긴장한 상태인데 어떻게 진정할 수 있을까’라고 묻자, ‘숨을 깊이 들이마시라’는 음성 답이 돌아왔다. ‘잠을 잘 자지 못하는 친구를 위해 잠자리 이야기를 들려달라’는 명령에 이 AI 모델은 다양한 목소리와 감정, 톤으로 바꿔가며 이야기를 들려줬다.

다른 시연에서는 종이에 적힌 수학 문제(3x+1=4)를 보여주고 “답을 말하지 말고 풀어달라”고 하자 시각 기능을 이용해 단계별 과정을 제공했다.

실시간 번역 기능도 담았다. 오픈AI는 ‘GPT-4o’ 모델이 기존 GPT-4 터보보다 두 배 더 빠르고 비용은 2분의 1 수준이라고 설명했다. GPT-4 터보는 지난해 11월 선보인 최신 버전이다.

또 새 모델로 한국어 등 50개 언어에 대한 챗GPT의 품질과 속도가 향상됐으며 이날부터 개발자들이 새 모델을 사용해 애플리케이션을 구축할 수 있도록 오픈AI의 API(응용 프로그램 인터페이스)를 통해서도 이용할 수 있다고 오픈AI는 덧붙였다.

무료로 제공되지만 기존 유료 구독자는 무료 이용자보다 5배 많은 질문을 할 수 있다. 이날 시연된 AI 음성 모드는 몇 주 안에 공개될 예정이다.

직접 시연에 나선 미라 무라티 최고기술책임자(CTO)는 “사용 편의성에 관해 우리가 정말로 큰 진전을 이뤘다고 생각하는 것은 이번이 처음”이라고 말했다.

샘 올트먼 오픈AI 최고경영자(CEO). [샘 올트먼 X(엑스, 옛 트위터) 캡처]

오픈AI의 GPT-4o는 구글의 연례 개발자 회의인 ‘I/O’ 행사를 하루 앞두고 나왔다. 먼저 공격에 나선 모습으로 AI를 둘러싼 또 한번의 치열한 경쟁이 예상된다.

구글이 어떤 내용을 발표할 것인지는 알려지지 않았지만, AI 모델인 제미나이의 업그레이드 관련 내용이 담겨 있을 것으로 관측된다. 애플은 내달 연례 세계 개발자 회의(WWDC)에서 AI 전략을 발표할 예정이다. AI 경쟁에서 뒤처졌다는 평가를 받아온 애플은 자사의 음성 비서인 시리(Siri)에 생성형 AI를 탑재할 것으로 전해졌다.

yckim6452@heraldcorp.com

Copyright © 헤럴드경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?