영화 'HER'가 현실로...사람과 대화하기 시작한 챗GPT [비즈니스포커스]

2024. 5. 22. 10:32
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.



배경은 2025년 로스앤젤레스. 편지 대필 작가 테오도르는 감정을 다루는 직업을 가졌지만 외롭기만 하다. 그러던 중 기업 엘리먼트 소프트웨어가 만든 인간 맞춤형 인공지능(AI)을 구매했다. 테오도르는 해당 AI가 ‘여성’으로서의 정체성을 갖도록 설정한다. ‘그녀(HER)’가 된 AI는 자신의 이름을 사만다로 정했다. 사만다는 농담을 비롯해 사람과 자연스럽게 대화하고 스스로 그림을 그리고 작곡도 한다. 사만다와 테오도르는 교감을 나누며 점차 서로 사랑하게 된다. 2013년에 개봉한 영화 ‘허(HER)’의 줄거리다.

SF 영화의 얘기가 현실이 됐다. 이제 AI는 사람과 자연스러운 대화를 나누고 카메라 렌즈를 통해 세상을 볼 수도 있다. 오픈AI는 신형 모델 ‘GPT-4o(포오)’를 5월 13일(현지 시간) 발표했다. 모델 이름의 o는 ‘모든’을 의미하는 ‘옴니(omni)’에서 따왔다. AI가 입력 및 출력하는 과정에서 텍스트·음성·이미지·영상 등을 폭넓게 활용함을 뜻한다. 이날 미라 무라티 최고기술책임자(CTO)는 웹 발표회에서 “지금까지 (AI) 모델의 지능을 높이는 데 주력해 왔으나 사용 편의성 측면에서 큰 전진을 이룬 건 이번이 최초다”라고 강조했다.

 

 “입이 ‘떡’ 벌어져” 새 모델의 혁신은

이전 모델과 비교해 이번 모델은 처리 속도가 2배 빨라졌다. 운용 비용은 절반으로 줄었다. 목소리로 말을 걸면 마치 사람 수준의 반응 속도로 대화한다. GPT-4o의 음성에 대한 반응 속도는 빠를 경우 232밀리초(1밀리초는 1000분의 1초), 평균 320밀리초다. 사람이 대화할 때와 같은 수준이다. 종전 모델인 GPT-3.5, GPT-4의 응답속도는 각각 평균 2.8초, 5.4초다. 새로운 음성 모드는 처리 과정을 대폭 줄여 빨라진 응답속도를 제공한다. 기존 3단계 ‘받아쓰기(transcription)-논리(intelligence)-텍스트 음성변환(text to speech)’의 처리 과정을 한꺼번에 수행한다. 이에 니혼게이자이신문은 그간 약점이던 반응 지연을 극복해 AI 활용 범위가 커질 것으로 평가했다.

또 한국어를 포함한 50개 언어를 지원한다. API를 제공해 개발자들에게도 유용하다. 문자, 이미지, 음성을 모두 인식해 실시간 번역 외에도 스마트폰 카메라를 사용해 사람의 표정을 이해하고 그래프를 읽거나 수학 문제를 풀기도 한다. 발표를 앞둔 사람의 숨소리를 듣고 그가 긴장하고 있다고 판단도 한다. 목소리 톤 조절로 감정을 표현할 수도 있다.

GPT-4o가 실시간 카메라 렌즈로 주변 상황을 들여다보며 사람을 안내하는 영상도 눈길을 끈다. 오픈AI는 5월 14일 ‘내 눈이 되어 주는 GPT-4o(Be My Eyes Accessibility with GPT-4o)’란 제목의 영상을 공개했다. 해당 영상엔 GPT가 시각장애인의 택시 탑승을 돕는 장면이 나온다. 카메라 렌즈를 통해 GPT는 택시 한 대가 이용자 방향으로 접근하고 있는 것을 파악한다. 이에 영상 속 GPT는 “지금 택시가 당신의 왼편을 향해 달려오고 있어요. 손을 흔들어 탑승하세요”라며 이용자를 보조하기도 한다.

챗봇끼리 성능으로 우열을 다투는 챗봇 아레나(Chatbot Arena)에서 이번 옴니 모델은 압도적인 1위를 기록했다. 오픈AI 연구원 사이먼 윌리슨은 지난 4월 ‘im-also-a-good-gpt2-chatbot’이란 가명으로 GPT-4o가 1위를 기록한 차트를 5월 13일(현지 시간) 자신의 X에 공유했다. 이 모델은 1310점을 얻었다. 이어 GPT-4터보, GPT-4가 각각 1253점, 1250점으로 2, 3위를 차지했다. 그리고 제미나이1.5프로, 클로드3 오퍼스 등이 뒤를 이었다.


 

 애플 곧 모바일 기기에 GPT 탑재할 수도

오픈AI가 주목받는 이유는 또 있다. 애플과의 협업이다. 아이폰에 생성형 AI인 GPT가 탑재될 예정이다. 블룸버그통신, 뉴욕타임스(NYT) 등 외신에 따르면 애플은 6월 10일 미국 세계개발자콘퍼런스(WWDC)에서 새로운 시리를 공개할 것으로 예상된다. 앞서 블룸버그통신은 아이폰에 챗GPT를 탑재하기 위한 애플과 오픈AI의 계약이 임박했다고 5월 10일 전했다. 계약이 이뤄질 경우 6월 열리는 애플의 WWDC에서 관련 발표를 진행하게 된다.

생성형 AI가 탑재된 시리는 기존보다 더 자연스러운 대화가 가능해진다. 애플은 시리의 해당 기능을 클라우드가 아닌 기기 자체에서 온디바이스 AI 형태로 구동할 방침이다. 차기 아이폰 운영체제인 iOS18에서 챗GPT를 도입하는 방식으로 진행된다. 그간 애플은 관련 라이선스를 두고 오픈AI와 협상 중인 것으로 전해졌다. 다만 애플은 알파벳 구글과도 챗봇 제미나이 라이선스 협상을 벌이고 있다고 블룸버그통신이 전했다.

웨드부시증권의 댄 아이브스 애널리스트는 “오픈AI와의 독점 계약, iOS의 챗GPT 기반 AI 기능과 다가오는 9월 출시 예정인 아이폰16에 이를 탑재하는 것이 쿡과 애플에 황금알을 낳는 거위가 될 것”이라고 분석했다. 반면 미즈호증권 조던 클라인 애널리스트는 애플이 진행하는 협상의 영향이 그리 크진 않을 것으로 분석했다. 그는 “어떤 논지도 이들 주식을 바꾸진 못한다고 생각한다”고 밝혔다.




윤소희 인턴기자 ysh@hankyung.com 

Copyright © 한경비즈니스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?