보고 듣고 말하고…AI야 사람이야?

임선우 외신캐스터 2024. 5. 17. 11:16
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[앵커]

인공지능이 이번 주 전 세계를 또 놀라게 했습니다.

이제는 상상을 초월한 기술들이 등장하고 있는데요.

인간이 만든 '인공' 지능이 아니라, 사고력과 판단력을 가진 실제 인간을 만난 것 같은 착각을 불러일으킬 정도입니다.

임선우 캐스터와 자세히 짚어보겠습니다.

오픈AI가 공개한 새로운 인공지능 모델, 깜짝 놀랐습니다.

[캐스터]

오픈AI의 챗GPT가 입을 달았습니다.

보고 듣고 말하고, 정말 인간과 비슷해졌는데요.

영상부터 보시죠.

[챗GPT-4o : (안녕, 잘 지내니?) 그럼요, 잘 지내요. 당신은 어때요? 오픈AI 후드 입고 있는 모습 멋지네요. 좋은 선택이에요. 저 천장은 또 뭔가요? 멋진 사무실에 있나 봐요? (내가 보여주는 것들을 토대로 무엇을 하고 있는지 짐작할 수 있겠니?) 제가 보는 대로라면 녹음실 같은 곳에 있는 것 같네요. 삼각대랑 마이크도 보이고요. 아마도 촬영 준비 중인 것으로 보이네요.]

[앵커]

예전에 본 영화 'her'에서 주인공이 AI와 대화를 나누는 장면 같습니다.

[캐스터]

마치 사람과 대화를 하는 것처럼 자연스럽죠.

시연자가 스마트폰 카메라를 통해 보여준 주변 환경을 사람처럼 보고, 듣고, 주제에 맞게 대화까지 이어가는 모습인데요.

텍스트와 오디오, 이미지 등 다양한 형태의 데이터를 사람과 주고받을 수 있고요.

메모리 기능까지 갖춰 사용자와 나눈 대화를 통해 학습도 할 수 있게 됐습니다.

[앵커]

이번에 공개된 버전에 붙여진 이름이 GPT-4o, 여기서 o는 라틴어 옴니, 그러니까 '모든'이라는 단어의 첫 글자인데, 정말 모든 걸 바꿀 수도 있겠어요.

[캐스터]

옴니라는 이름에 걸맞게 멀티 모달리티를 대폭 강화했습니다.

쉽게 말해 텍스트와 오디오, 이미지 등으로 입력과 출력을 할 수 있게 된 건데요.

이미 나와 있는 기술 아니냐, 하시는 분들도 계실 겁니다.

맞습니다.

멀티 모달 기술은 이미 1년 전에 나왔지만, 이번에 획기적인 변화가 있습니다.

기존에는 텍스트와 이미지, 음성 레이어가 각각 따로따로 정렬되어 있었습니다.

그런데 오픈AI가 이 각각의 레이어층을 하나로 통합했습니다.

'엔드 투 엔드' 신경망이라고도 부르는데, 이 수많은 층의 레이어들이 하나로 합쳐지면서 속도가 훨씬 더 빨라졌습니다.

이전 버전인 챗GPT-4 터보와 비교했을 때 무려 2배나 더 빨라졌고요, 가격은 절반으로 낮아졌습니다.

글자 제한도 5배로 늘어났고요.

[앵커]

하나로 합쳐졌다. 

인간의 뇌와 같이 하나의 중추신경에서 인식과 판단, 반응까지 가능해졌다는 건가요?

[캐스터]

이번에도 제가 설명해 드리기 전에 영상부터 보실까요?

[챗GPT-4o : (지금 무대 위에 올라와 있어. 라이브 데모를 하는 중인데 솔직히 떨리네. 내가 진정할 수 있도록 도와줄래?) 지금 라이브 데모 중이라고요? 정말 대단해요! 숨을 깊게 들이마셔요. 당신이 전문가라는 걸 기억해요.]보신 것처럼 감정표현이 들어가 있고요.

대화 역시 자연스럽죠.

제일 중요한 건 질문을 듣고, 답하는 속도가 굉장히 빠르다는 겁니다.

인간의 평균 응답속도가 320밀리초라고 하는데, GPT4o는 평균 230밀리초로 일반적인 사람보다 더 빠르게 답할 수 있습니다.

이전 버전의 가장 큰 단점으로 꼽혔던 게 바로 느린 반응 속도였죠.

응답까지 평균 5.4초가 걸렸었는데, 새로운 버전은 틈이 안 느껴질 정도로 빨라졌습니다.

영상 하나 더 보시죠.

[챗GPT-4o : (이 문제를 풀기 위해 어떤 것부터 해야 하지?) 먼저 한쪽에는 X가 있고 다른 쪽에는 상수를 둬야 해요.]다시 봐도 인간처럼 느껴지죠?

예전에는 음성 언어를 텍스트로 바꾸고, 결과물을 다시 트랜스포머 엔진에 넣어서 출력한 뒤, 이를 텍스트 투 스피치, 그러니까 음성 언어로 또 변환하는 복잡한 작업을 거쳐야 했다면 이제는 여러 층의 레이어를 통과하는 게 아니라, 하나의 통합된 신경망에서 모든 게 처리되기 때문에 그만큼 시간이 단축될 수 있습니다.

[앵커]

속도도 속도지만, 감정이 느껴집니다.

[캐스터]

맞습니다.

목소리에 감정까지 넣을 수 있게 됐는데, 지금 보실 영상이 놀랍습니다.

보시죠.

[챗GPT-4o : 어머 귀염둥이야 안녕! 우리 솜뭉치 이름이 뭐니? (이 아이 이름은 바우저야.) 안녕, 바우저! 어쩜 이리 작고 사랑스럽니!]

카메라를 통해 비춰진 사물이 강아지라는 걸 확인하자 목소리 톤을 바꾸고, 마치 사람처럼 귀엽다는 감정을 표현하죠.

여기서 끝이 아닙니다.

대화 중에 끼어들기도 할 수 있습니다.

[챗GPT-4o : 바이트라는 호기심 많은 로봇이 있었어요. 항상 탐구… (조금 더 감정을 담아 줘. 더 드라마틱하게.) 알았어요. 더 극적으로 해보죠. 옛날 옛적 지금과 크게 다르지 않던 시절 바이트라는… (아니 아니, 감정을 최대로 끌어올려 줘.) 알았어요. 더욱더 드라마틱하게 해보죠. 옛날 옛적….]

이런 식으로 계속 말을 끊고 들어가도 매끄럽게 대화가 가능하고요.

새로운 요구사항도 곧장 반영되는 걸 확인할 수 있습니다.

심지어 AI가 대화 중에 인간의 감정을 이해하고 반응하기까지 합니다.

예를 들어, 사용자가 대화 중 숨이 가빠지면 "조금 진정해 보는 건 어떨까요?"라고 물어본다든지, 이용자의 감정과 몸 상태까지 인식할 수 있는 수준으로 올라왔습니다.

여기에 지원하는 언어도 50개로 대폭 늘어나면서 실시간 통역도 가능해졌는데요.

눈여겨볼 점은, 그 수가 많아진 것뿐만 아니라, 각 언어마다 최적화가 됐다는 점입니다.

[앵커]

영어뿐만 아니라 우리 말도 업그레이드가 됐다는 건가요?

[캐스터]

명령어를 넣게 되면 이를 토큰이라는 조각으로 나누게 되는데요.

GPT 이전 버전은 굉장히 비효율적이었습니다.

우리 말을 예로 들면 "안녕하십니까. 제 이름은 GPT-4o입니다. 저는 새로운 유형의 언어모델입니다. 만나서 반갑습니다." 이 문장을 말하는데 과거 45개의 토큰이 들어갔는데, 이제는 27개로, 약 1.7배 감소했습니다.

토큰 압축률이 증가했다는 건 그만큼 효율성이 좋아지고, 비용도 대폭 줄어들었다는 의미입니다.

그리고 이제 텍스트, 음성뿐만 아니라 카메라를 통해 실시간으로 사물을 인식하면서 실제 세상과 상호작용이 가능해졌고요. 이 모든 기능이 현재로선 경쟁사들을 압도하고 있습니다.

여러 전문 영역에 대한 객관식 평가인 MMLU를 비롯해 추론과 수학, 코딩 벤치마크 모두 기술적 격차가 크다는 분석이 나옵니다.

챗봇 아레나라고 불리는 블라인드 테스트에서도 무려 1310점이라는 높은 점수를 기록하면서 나 홀로 질주하는 모습을 확인할 수 있는데요.

화면상 보시면 맨 왼쪽에 자리하고 있는데, 점수 격차가 굉장히 큰 걸 볼 수 있고요.

바로 옆에 있는, 직전까지 가장 뛰어난 성능을 보였던 챗GPT-4터보보다도 훨씬 뛰어나고요.

메타의 라마나 구글의 제미나이 등과 비교해 봐도 100점 이상 차이를 보이며 월등한 모습을 보여줬습니다.

[앵커]

구글 AI 언급하셨는데, 구글도 이번 주에 새로운 제미나이를 공개했잖아요?

[캐스터]

검색 엔진에 제미나이를 탑재시키는 초강수를 들고나왔습니다.

이용자들은 대화를 통해 자유롭게 원하는 주제를 검색할 수 있는데요.

텍스트나 사진뿐만 아니라 동영상으로도 검색이 가능해졌고요.

이 기능을 통해 제미나이는 다단계 추론을 거친 뒤 다양한 요소를 고려한 답변을 제공합니다.

여기에 검색 페이지를 주제별로 분류하고 요약 제공하는 기능도 활용할 수 있게 돼 편의성이 대폭 강화됐고요.

이 밖에도 사람처럼 보고 듣고, 대화를 나눌 수 있는 음성비서 '프로젝트 아스트라'부터, 텍스트를 동영상으로 만들어주는 '비오' 등 구글의 AI 비전을 실현시켜줄 다양한 신기술들이 공개됐습니다.

제미나이가 탑재된 새 검색 기능은 미국을 시작으로, 순차적으로 다른 국가에도 적용되는데요.

주요 외신들은 구글 검색이 등장한 이후 25년 만의 가장 큰 변화, 혁신이라고 평가했습니다.

다만, 하루 전 오픈AI의 발표가 워낙 놀라웠기 때문에 구글의 발표는 살짝 묻히는 분위기였습니다.

중요한 건, AI 혁신 경쟁이 이제 본격적으로 시작됐고, 무섭게 빠른 속도로 진행되고 있다는 겁니다.

[앵커]

오늘(17일)도 흥미로운 내용, 잘 봤습니다.

당신의 제보가 뉴스로 만들어집니다.SBS Biz는 여러분의 제보를 기다리고 있습니다.홈페이지 = https://url.kr/9pghjn

저작권자 SBS미디어넷 & SBSi 무단전재-재배포 금지

Copyright © SBS Biz. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?