"AI가 인간처럼 앱 실행"…구글·오픈AI '차세대 AI' 선점 경쟁
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
구글·오픈AI가 각자의 접근법으로 차별화한 차세대 AI 에이전트 기술(AI가 인간처럼 직접 컴퓨터 조작 또는 서비스 앱 실행)을 공개하며 플랫폼 선점 경쟁을 본격화했다.
10일 IT 업계에 따르면 구글은 이달 7일(현지시간) AI 에이전트가 컴퓨터 GUI(그래픽 사용자 인터페이스)와 직접 상호작용할 수 있는 '제미나이 2.5 컴퓨터 유즈'(Gemini 2.5 Computer Use) 모델을 프리뷰 형태로 공개했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
복잡한 업무 여전히 한계…AI 에이전트 확산에 해킹 우려도 커져

(서울=뉴스1) 김민석 기자 = 구글·오픈AI가 각자의 접근법으로 차별화한 차세대 AI 에이전트 기술(AI가 인간처럼 직접 컴퓨터 조작 또는 서비스 앱 실행)을 공개하며 플랫폼 선점 경쟁을 본격화했다.
10일 IT 업계에 따르면 구글은 이달 7일(현지시간) AI 에이전트가 컴퓨터 GUI(그래픽 사용자 인터페이스)와 직접 상호작용할 수 있는 '제미나이 2.5 컴퓨터 유즈'(Gemini 2.5 Computer Use) 모델을 프리뷰 형태로 공개했다.
제미나이 2.5 컴퓨터 유즈는 이용자 프롬프트와 컴퓨터 화면을 분석해 △마우스 클릭·스크롤 △키보드 타이핑 등 13가지 UI 액션을 실행할 수 있다. 이 모델은 스크린샷과 작업 기록을 분석한 후 다음 행동을 결정·실행하는 순환 구조로 작동한다. 개발자는 '구글 AI 스튜디오'와 '버텍스 AI'(Vertex AI)를 통해 이용할 수 있다.
구글은 시연 영상도 공개했다.
영상에는 AI가 반려동물 예약 정보가 담긴 사이트에서 캘리포니아 거주 동물의 데이터를 추출한 후 이를 별도의 CRM 웹사이트에 스스로 입력하거나 특정 전문의를 찾고 진료 예약 등을 자동으로 수행하는 장면이 담겼다.
구글은 제미나이 2.5 컴퓨터 유즈 성능이 경쟁 모델을 앞질렀다고 강조했다. 웹보이저 벤치마크에서 제미나이는 79.9%의 성능을 기록해 클로드(69.4%) 오픈AI(61.0%)를 상회했다.

오픈AI는 챗GPT를 중심으로 모든 서비스를 담아 AI 시대의 새로운 운영체제(OS)가 되겠다는 목표다.
오픈AI는 이를 실현하는 단계로 지난 6일(현지시간) 열린 연례 개발자 회의 '데브데이 2025'에서 '앱 SDK'를 공개했다.
앱 SDK는 이용자 요청에 따라 AI가 챗GPT 내에서 △질로우 △캔바 △스포티파이 등 외부 서비스를 직접 실행해 작업을 완료한다. 대화창에 '캔바를 활용해 반려견 산책 스타트업 포스터를 만들어줘'라고 요청하면 자동으로 템플릿을 선택해 완성된 디자인을 생성하는 식이다.
오픈AI는 캔바·스포티파이·질로우 외 코세라·피그마·익스피디아·부킹닷컴 등과 협약을 맺었다고 발표했다. 우버 서비스도 연내 추가한다는 방침이다.

전문가들은 양사가 기존 API 방식의 한계를 돌파한 기술을 선보였다고 평가하면서도 한계점이 아직 있다고 분석했다. 간단한 작업은 높은 정확도로 수행하지만, 고난도의 복잡한 작업을 명령하면 실패하는 경우가 많기 때문이다.
AI 에이전트 확산에 따른 보안·해킹 우려도 점점 커지고 있다.
스톡홀름국제평화연구소(SIPRI)는 "AI 에이전트 간 상호작용은 현재 겪는 사이버보안 문제를 훨씬 관리하기 어렵게 만들 수 있다"며 "악의적 행위자들이 에이전트 간 상호작용을 해킹해 민감한 정보를 빼내거나 바이러스를 전파할 경우 연쇄적 효과를 예측하기 힘들게 될 것"이라고 우려했다.
ideaed@news1.kr
<용어설명>
■ API
API는 응용프로그램 인터페이스(Application Programming Interface)로 하나의 소프트웨어 컴포넌트가 다른 소프트웨어 컴포넌트와 상호작용할 수 있도록 설계된 인터페이스다. 즉, 소프트웨어끼리 서로 정보를 주고받고 기능을 사용하게 해주는 중간다리다.
■ MCP
MCP(Model Context Protocol)는 인공지능(AI) 대형언어모델(LLM)과 외부 데이터 소스·도구·애플리케이션을 연결해주는 개방형 표준 프로토콜이다. AI 모델이 실시간으로 외부 정보를 가져오고 다양한 도구를 활용할 수 있도록 하는 범용 인터페이스 역할을 한다.
■ SDK
SDK(Software Development Kit·소프트웨어 개발 키트)는 특정 하드웨어·소프트웨어 플랫폼에서 개발자가 새로운 애플리케이션을 개발할 수 있도록 도와주는 패키지(도구 모음·라이브러리·문서·예제 코드·API 등)다.
Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.
- '아들 외도 논란' 홍서범, "아버지 바람 피워" 과거 발언도 재조명
- "황석희, 만취여성 모텔 데려갔는데 집유?…조진웅 사례와 비슷" 법조계 분석
- '음료 3잔 고소' 취하한 점주…"충청도에선 일 못한다" 협박 녹취 또 터졌다
- "이번엔 탕수육 2접시 먹은 여자들 8만2000원 안내고 '슥'…10번 신고해도 미결"
- 공사판 사고로 전신마비…애들이 '아빠 보기 싫다' 는데 이혼이 답인가요
- 오영실 "부부싸움 중 '잡놈이랑 놀다 왔다' 했더니 남편 물건 던지며 광분"
- 아들 안은 에릭에 전진·앤디…신화 유부 멤버, 이민우 결혼식 부부 동반 총출동
- 전소미, 수천만원대 명품 액세서리 분실에 허탈 "눈물…내 가방 어디에도 없어"
- "8살 차 장모·사위, '누나 동생' 하다 불륜…처제랑 난리 난 사례도"
- '국힘 오디션 심사' 이혁재 "'룸살롱 폭행' 10년전 일…날 못 죽여 안달"