미래엔 인간 감각까지 인식하는 초지능형 AI 나온다

김지현 테크라이터 2024. 5. 7. 09:01
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

AI가 소프트웨어와 하드웨어 직접 조종하는 ‘AI 에이전트’ 시대 곧 도래

세계를 강타한 챗GPT발(發) 인공지능(AI) 쇼크는 LLM(Large Language Model·거대언어모델) 기술 덕에 가능했다. 올해 들어 LLM 수준이 더 높아지는 동시에 개별 산업에서 활용도도 상승해 AI는 SLM(Small Language Model·소형언어모델)으로 분화하고 있다. 여기서 한 걸음 더 나아가 언어뿐 아니라 인간이 지각(知覺)하는 이미지, 영상, 음성 등 다양한 형태의 데이터를 인식·생성하는 LMM(Large Multimodal Model·거대멀티모달모델)이라는 새로운 차원의 기술 발전도 이뤄지고 있다.

‘기술적 특이점' 가까워진 AI 기술

노태문 삼성전자 모바일경험(MX)사업부 사장이 1월 17일(현지 시간) 미국 캘리포니아주에서 열린 ‘갤럭시 언팩 2024’ 행사에서 세계 최초 인공지능(AI) 스마트폰 갤럭시 S24 시리즈를 공개하고 있다. [삼성전자 제공]
코딩, 번역, 검색, 데이터 분석, 문제풀이 등 기초 분야에서 쓰이던 AI는 점차 기술적 특이점(singularity)에 다가서고 있다. 인식 가능한 정보 종류가 비약적으로 늘어나고 그 결과 생성되는 데이터와 콘텐츠도 다종다양해지고 있는 것이다. 최근 챗GPT가 기본 기능으로 이미지를 인식해 생성하는 게 대표 사례다. 챗GPT 개발사 오픈AI는 이미 AI 동영상 생성 서비스 '소라(Sora)'를 선보였다. 그간 AI 경쟁에서 두각을 나타내지 못하던 애플은 최근 아이폰의 제한된 메모리·리소스에서도 실행할 수 있는 경량화 LLM에 대한 연구 결과를 발표했다. 또한 아이폰 카메라로 촬영한 짧은 영상을 바탕으로 3차원(3D) 아바타 애니메이션을 만들 수 있는 '헉스'를 선보이기도 했다. 삼성전자는 세계 최초 AI 스마트폰인 갤럭시 S24에 자체 개발한 '가우스'와 구글의 '제미나이 프로·나노' 등 AI를 탑재해 통화 내용 자동 통역 서비스를 제공하고 있다.

현실 세계에서 AI의 존재감이 두드러지는 LAM(Large Action Model·거대행동모델) 등장도 주목을 끈다. 올해 1월 'CES(국제전자제품박람회) 2024'에서 미국 스타트업 래빗(Rabbit)이 AI 단말기 R1을 발표했다. 사용자가 음성으로 명령하면 클라우드의 버추얼 컴퓨터가 작동해 미리 입력해둔 아마존, 우버 등 서비스에서 필요한 상품이나 서비스를 찾아 주문해준다. AI가 사람 대신 스마트폰 애플리케이션(앱)을 작동시키는 LAM이다.

손가락에서 AI로… 디지털 기기 사용법 일대 혁신

미국 스타트업 래빗(Rabbit)이 ‘CES(국제전자제품 박람회) 2024’에서 선보인 AI 단말기 R1. [래빗 제공]
스마트폰, 개인용 컴퓨터(PC) 등 기존 디지털 기기도 LAM을 품고 더 똑똑해지고 있다. 한 사례로 도이치텔레콤은 2월 'MWC(모바일월드콩그레스) 2024'에서 앱프리 AI 폰을 내놓았다. 말 그대로 애플리케이션(앱)을 다운로드하지 않아도 AI 에이전트에 명령만 하면 항공편, 호텔 예약 등을 대신 해주는 기능을 갖췄다. 애플이 발표한 언어모델 '패럿(Ferret) UI'는 스마트폰에 특화된 LAM이다. 스마트폰 아이콘과 텍스트 메뉴를 인식해 사용자 명령에 따라 화면을 컨트롤한다. 마이크로소프트(MS)가 '윈도우 12'에 적용한 '코파일럿(Copilot)'은 사용자가 마우스를 움직이지 않아도 필요한 작업을 대신해준다. 이처럼 LAM 기반의 AI 기술이 더 발전한다면 디지털 기기를 사람 손가락으로 움직여 작동시키던 기존 사용법에 일대 혁신이 일어날 것이다.

최근 AI 기술의 발전 흐름을 보면 'AI 에이전트(Agent)'로 귀결됨을 알 수 있다. 언어를 이해하는 것은 물론, 인간 감각마저 인식해 다양한 작업을 수행하는 자동화된 초지능형 AI로 발전하고 있는 것이다. AI 에이전트 기술이 정착되면 영화 '아이언맨'에서 주인공을 돕는 AI 비서 '자비스'처럼 기계와 소프트웨어, 인터넷 서비스가 한데 묶인 초자동화 서비스가 가능해질 전망이다. 이 같은 AI 에이전트 시대로 가는 AI 기술의 삼두마차가 바로 LLM, LMM, LAM이라고 할 수 있다. 미래에는 소프트웨어와 하드웨어를 인간이 아닌 AI가 직접 조종하게 될 것이다. AI가 진정한 의미에서 인간의 디지털 동반자가 되는 AI 에이전트 시대가 머지않았다.

*유튜브와 포털에서 각각 '매거진동아'와 '투벤저스'를 검색해 팔로잉하시면 기사 외에도 동영상 등 다채로운 투자 정보를 만나보실 수 있습니다.

김지현 테크라이터

Copyright © 주간동아. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?