스마트폰 다음은 내 손안의 AI[이경전의 행복한 AI 읽기](5)

2024. 1. 22. 05:31
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

AI Pin을 웃옷 정면에 부착하고, 손으로 갖다 댄 다음 대화를 시작하는 사용자 /휴메인



미국에서 1967년 시작된 한 전시회에 다녀왔다. 인공지능(AI)이 가장 큰 테마를 이룰 것이라는 전망이 있었고, 실제로도 많은 인공지능 응용 회사가 나왔다. 하지만 현재 인공지능 기술의 최첨단을 달리는 회사들은 오히려 전시장에 부스를 설치하지 않았다. 필자는 AI Pin(인공지능 핀)이라는 제품을 만든 휴메인(Humane)사가 나오기를 기대했지만, 나오지 않았다. AI Pin은 챗GPT로 대표되는 인공지능 시대를 이끌 잠재력이 있는 기계다. 아직 시중에 나오지는 않았지만, 지금 주문을 받고 있으며(가격은 699~799달러), 3월부터 배송이 될 것이라고 밝히고 있다.

AI Pin은 디스플레이가 없는 스마트폰이다. 삼성은 폴더블 디스플레이 스마트폰을 내세우며 시장을 선도하고 있고, LG는 이번 전시회에서 세계 최초 무선 투명 올레드(OLED) TV를 내세우는 등 한국 회사들은 디스플레이를 강조한다. 휴메인은 그러나 디스플레이가 없는 것을 내세운다. AI Pin은 말 그대로 핀처럼 옷에 꽂고 다닐 수 있는, 가로세로 5㎝ 이하, 두께 1.5㎝ 이하의 장치다. 자석을 이용해 부착하는 형태다. 마이크가 있고, 스피커가 있어 사용자는 말로 명령하고, AI는 말로 대답한다.

2013년 영화 <HER>에서 주인공은 이동 중에 말로만 AI와 상호작용하는 모습을 관객에게 보여줘 충격을 주었는데, AI Pin은 영화 <HER>를 실현하는 하나의 장치다. 디스플레이가 없는 것은 사실 아니다. 아래 그림에서 보는 것처럼, 몸에 부착된 AI Pin이 빔프로젝터처럼 영상을 분사하면, 손바닥 같은 곳에 비춰서 볼 수 있다. AI Pin은 “접촉 너머, 화면 그 이상(Beyond touch, beyond screens)”을 표방한다.

AI Pin의 레이저 잉크 디스플레이는 20cm에서 40cm 사이에 영상을 분사한다. 휴메인



카메라도 있고, 소리 내 말을 하며 자기 생각을 기록하는 동시에 AI에게 의견을 물을 수도 있다. 종일 사용자 주변의 사진을 찍고, 사용자의 목소리를 늘 듣는 서비스라는 점에서 프라이버시가 중요하다. 휴메인은 다음과 같이 약속한다. “사용자가 자신의 데이터를 소유할 수 있는 권리가 있다고 믿으며, 개인 정보는 보호돼야 한다. 프라이버시가 최우선 가치이며 수집하는 데이터에 대해 투명하다. 사용자의 경험 개선을 위해 데이터를 처리하지만, 결코 제3자에게 판매되거나 기업 이익을 위해 활용되거나 모델 훈련에 사용되지 않는다. 사용자가 로그인하지 않은 제3자 서비스를 사용할 때는 어떠한 개인 식별 정보도 생략한다.”

그렇다. AI 회사는 살아남아 성장하기 위해서라도 프라이버시를 최우선으로 삼아야 한다. 인터넷 회사와 AI 회사를 극명하게 나누는 기준이 프라이버시다. 인터넷 회사는 사용자의 데이터를 서버에 저장해야만 사업을 할 수 있었다. 그러나, AI 사업자는 그렇지 않다. 사용자의 데이터를 사용자 쪽에 그대로 두고도, AI 서비스를 할 수 있는 방법이 있다. 그것이 온디바이스(On-Device) AI이다. 현재 구글의 Pixel 8 Pro 폰이, 최초의 온디바이스 AI가 되는 스마트폰이다. 구글의 인공지능인 제미나이 나노가 탑재돼 있다. 2024년 1월 17일에 발표된 삼성전자의 새로운 갤럭시 폰 S24도 온디바이스 인공지능 폰이다. 삼성의 자체 AI 모델인 가우스가 탑재된다.

아직 온 디바이스 AI의 능력은 작지만, 이제 시작일 뿐이다. 무어의 법칙 또는 황의 법칙이 가동되므로 1년에 온디바이스 AI의 성능과 기능은 두 배 정도 또는 그 이상 성장해 나갈 것이다. AI Pin은 영상이나 음성이 캡처되거나 녹음될 때 ‘트러스트 라이트(Trust Light)’가 켜져 사용자와 주변인의 프라이버시를 보호한다. 음성으로 AI를 불러내는 이른바 ‘웨이크 워드’가 없고, ‘항상 듣고’ 있거나 ‘항상 녹음’하는 상태도 아니다.

Rabbit의 R1



AI Pin은 안드로이드나 iOS가 아닌, 코스모스라는 새로운 운영체제에 기반해 돌아간다. 이 운영체제는 자연어를 우선시하며 필요할 때만 디스플레이를 활성화해 필수 정보만을 보여줌으로써 앱을 다운로드하고, 관리하고, 실행하는 시대를 종식시키겠다고 한다. 손목의 기울기와 회전, 손가락의 움직임 등 제스처, 사용자가 말하고, 하는 행동, 쥐고 있는 것, 그리고 빛·위치·운동 센서를 사용해 사용자의 맥락을 이해하고, 고객이 원하는 것을 예측해 제공한다.

이번 전시 기간에 AI Pin과 유사한 R1이라는 제품이 전격적으로 발표됐다. 래빗(rabbit.tech)의 R1은 AI Pin과 마찬가지로 AI 장착 기반의 휴대용 기기이며, 특히 최초의 인공지능 에이전트 기기라고 할 수 있다. R1에서는 거대언어모델(LLM)이라는 말 대신 LAM(Large Action Model), 즉 거대행동모델이라는 용어를 제시한다. 사용자의 명령과 현재 앱의 화면을 보고 다음에 수행할 액션을 선택하는 Rabbit OS라는 AI 전용 운영체제를 탑재했다. AI Pin의 코스모스 운영체제에 해당한다. 차이점이라면, AI Pin은 극단적으로 기기에 스크린을 없앤 대신, R1에는 터치스크린이 되는 작은 화면이 있다는 점이다. 마이크와 스피커가 있고, 오른쪽 버튼을 누르고 음성 명령을 내린다.

R1이나 AI Pin이나 모두 해결하려는 문제는 스마트폰에서처럼 원하는 일을 하기 위해 각각의 앱을 실행해야 하는 귀찮음을 없애는 일이다. 2023년 12월 텐센트에서 발표한 앱에이전트(AppAgent)는 GPT-4로 앱 화면을 인식하는 방법을 통해 여러 앱을 열어 인간 사용자가 하는 일을 자동으로 할 수 있음을 보여줬다. R1의 Rabbit OS가 이 개념을 상용화한 최초의 기기로 여겨진다. LLM은 텍스트만 출력되지만, LAM은 텍스트와 함께 사용자 환경(UI) 액션까지 같이 나온다. R1의 가격은 199달러다. 기기만 구입하면 별도의 사용료도 없다. 래빗 CEO는 연설 동영상에서 699달러에 매월 사용료도 있는 AI Pin에 비해 저렴하다고 홍보 중이다. 이미 가격 경쟁까지 선언한 상태인 셈이다.

이경전 경희대 경영학과·빅데이터 응용학과·첨단기술 비즈니스 학과 교수

Copyright © 주간경향. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?