영화 ‘Her’가 현실로…오픈AI, 보고 듣고 말하는 AI ‘GPT-4o’ 공개

배문규 기자 2024. 5. 14. 08:11
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

라이브 행사 통해 새 AI 모델 공개
이용자 질문에 곧바로 대답 제공
오픈AI 직원들이 ‘GPT-4o’를 통해 수학 계산을 시연하는 모습. 유튜브영상 갈무리

오픈AI 직원: “내가 좀 긴장한 상태인데 진정할 수 있게 도와줄 수 있나요?”

GPT 4o: “지금 시연을 하고 있는 건가요? 굉장한데요. 숨을 깊게 들여마셔봐요.”

오픈AI 직원: “흐허, 흐허, 흐허, 흐허.”

GPT 4o: “오우 당신은 진공청소기가 아니잖아요.(좌중 웃음) 숨을 들이마시고, 천천히 내쉬어요.”

GPT 개발사 오픈AI가 13일(현지시간) 보고 듣고 말하는 새로운 인공지능(AI) 모델 ‘GPT-4o’(GPT-포오)를 공개했다.

오픈AI의 미라 무라티 최고기술책임자(CTO)는 이날 라이브 행사를 통해 새 AI 모델을 공개하고, 각종 기능을 시연했다. GPT-4o는 텍스트를 통해 대화할 수 있었던 기존 모델과 달리 이용자와 실시간 음성 대화를 통해 질문하고 답변을 요청할 수 있는 AI 모델이다.

새 모델명의 ‘o’는 모든 것이라는 라틴어 ‘옴니(omni)’를 뜻한다. 텍스트 이해, 음성 인식, 이미지 인식 기능 등이 통합돼 실시간 상호작용이 가능한 멀티모달(Multimodal, 다중 모드) 모델이다. 채팅창에 입력한 텍스트뿐만 아니라 사람이 말하는 내용이나 제시된 이미지가 무엇인지 이해하고 답을 말할 수 있다. GPT4 수준의 추론을 훨씬 빠른 속도로 제공한다고 오픈AI는 설명했다.

GPT-4o는 사람처럼 대화가 가능하다. 이용자 질문에 곧바로 답이 제공되며, 답 제공 중에 끼어들어도 대화는 계속 이어진다. GPT-4o의 응답 시간은 최소 232밀리초(ms·1000분의 1초), 평균 320밀리초로, 이는 인간의 응답시간과 비슷하다. 이전 모델인 GPT-3.5는 평균 2.8초, GPT-4는 응답에 5.4초가 걸렸다.

이날 오픈AI 직원 두 사람의 시연은 영화를 떠올리게 했다. 2013년 개봉한 영화 <Her>에서 주인공과 사랑에 빠지는 AI 운영체제 ‘사만다’처럼 대화를 나누거나 도움을 받을 수 있었다.

‘잠을 잘 자지 못하는 친구를 위해 잠자리 이야기를 들려달라’고 하자, 이 AI 모델은 다양한 목소리와 감정, 톤으로 바꿔가며 이야기를 들려줬다. 종이에 수학 문제(3x+1=4)를 써서 보여주고 답을 말하지 말고 풀어달라고 하자, 이를 시각적으로 인지해 단계별 풀이를 도왔다. 시연자가 종이에 “I♡ChatGPT”라고 써서 보여주자, “스윗하다”며 기뻐하기도 했다. 사람이 육성으로 묻는 코딩 관련 질문에 답을 하는 등 복잡한 상호작용도 가능했다.

오픈AI는 GPT-4o 모델이 기존 GPT-4 터보보다 2배 더 빠르고 비용은 2분의 1 수준이라고 설명했다. GPT-4 터보는 지난해 11월 선보인 최신 버전이다.

외국어 음성을 실시간으로 번역하는 기능도 시연했다. 새 모델로 한국어 등 50개 언어에 대한 챗GPT의 품질과 속도가 향상됐으며, 이날부터 개발자들이 새 모델을 사용해 애플리케이션을 구축할 수 있도록 오픈AI의 응용 프로그램 인터페이스(API)를 통해서도 이용할 수 있다고 오픈AI는 덧붙였다.

무료로 제공되지만 기존 유료 구독자는 무료 이용자보다 5배 많은 질문을 할 수 있다. 이날 시연된 AI 음성 모드는 몇 주 안에 공개될 예정이다. 무라티 CTO는 “사용 편의성에 관해 우리가 정말로 큰 진전을 이뤘다고 생각하는 것은 이번이 처음”이라고 말했다.

GPT-4o가 시연자의 요청에 따라 코딩 내용을 검토하는 모습. 유튜브 라이브 갈무리
GPT-4o는 시연자의 실시간 영상을 보고 ‘현재 어떤 기분일지 맞춰보라’고 하자 ‘행복해 보인다’며 자연스럽게 대화를 이어갔다.

샘 올트먼 오픈AI 최고경영자(CEO)는 이날 X(옛 트위터)에 “her”라고 짧은 글을 남겼다. 자신의 블로그에는 “영화에 나오는 AI 같은 느낌”이라며 “이것이 현실이라는 사실이 아직도 조금 놀랍다”고 썼다. GPT-4o가 영화적 상상을 현실로 만들어주고 있음을 의미하는 것으로 보인다.

현재 글로벌 빅테크들은 사람과 비슷하거나 넘어서는 수준의 범용인공지능(AGI) 개발을 위해 천문학적인 돈을 쏟아붓고 있다. GPT-4o를 통해 인간과 비슷한 AI에 한 발짝 더 다가간 셈이다.

오픈AI의 이날 발표는 AI를 둘러싼 또 한번의 치열한 경쟁도 예고했다. 구글의 연례 개발자회의(I/O)를 하루 앞두고 발표했기 때문이다. 구글이 어떤 내용을 공개할지는 알려지지 않았지만, AI 모델 ‘제미나이’의 업그레이드 관련 내용이 담겨 있을 것으로 예상되고 있다.

AI 경쟁에서 뒤처졌다는 평가를 받아온 애플은 다음달 10일 세계개발자회의(WWDC)에서 AI 전략을 발표할 예정이다. 애플은 자사의 음성 비서인 ‘시리’에 생성형 AI 기능을 탑재할 것으로 전해졌다. 애플은 현재 오픈AI, 구글과 관련 협의를 진행 중인 것으로 알려졌다.

배문규 기자 sobbell@kyunghyang.com

Copyright © 경향신문. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?