스스로 일하는 사람같은 AI 온다… 에이전트 경쟁 본궤도

팽동현 2024. 10. 23. 18:10
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

앤스로픽 '클로드 3.5 하이쿠' 출시
명령 수행 넘어 자율적으로 작업
네이버·카카오 등 韓업체도 러시
클로드 3.5 소네트 새 버전과 하이쿠 및 주요 기반모델들의 벤치마크 테스트 결과. 앤스로픽 홈페이지 캡처

생성형 인공지능(AI)의 진화가 본격화됐다. 하나하나 명령어를 주지 않아도 사람이 하는 일부 업무를 AI가 자동으로 대신 수행하는 'AI 에이전트'가 핵심이다. AI 기업들은 이에 맞춰 AI모델과 서비스를 발전시켜 가고 있다.

오픈AI 대항마로 평가받는 AI스타트업 앤스로픽은 22일(이하 현지시간) 자사 '클로드 3.5 소네트'의 업그레이드 버전과 새로운 경량모델 '클로드 3.5 하이쿠' 출시를 발표했다. 회사는 대형언어모델(LLM) '클로드' 제품군을 기본 '소네트', 경량 '하이쿠', 고급 '오푸스'로 구성하고 있다.

새로운 '클로드 3.5 하이쿠'는 경량모델임에도 여러 벤치마크에서 기존 고급모델인 '클로드 3 오푸스'를 능가했다. 이달 말 텍스트 전용 모델로 먼저 제공되고 추후 이미지 입력 기능도 추가 예정이다.

특히 눈에 띄는 것은 '클로드 3.5 소네트'에 이날부터 베타버전으로 새로 추가된 '컴퓨터 사용(Computer Use)' 기능이다. 화면을 보고 커서를 움직이고 버튼을 클릭하고 텍스트를 입력하는 등 사람과 같은 방식으로 컴퓨터를 사용하도록 AI모델에게 지시할 수 있다. 웹 기반 통합개발환경(IDE) 서비스 리플릿(Replit)은 이 기능을 자사 에이전트 제품에 적용해 구축 중인 앱을 평가하는 기능을 개발하고 있다.

앤스로픽 측은 "클로드 3.5 소네트는 공개 베타 버전으로, 컴퓨터 사용 기능을 제공하는 최초의 프런티어 AI 모델"이라며 "컴퓨터 사용 관련해 근본적으로 새로운 시도를 하고 있다. 개별 작업 완료에 도움이 되는 특정 도구를 만드는 대신, 일반적인 컴퓨터 기술을 가르쳐서 사람을 위해 만들어진 다양한 도구와 프로그램을 사용할 수 있게 하고 있다"고 설명했다.

AI에이전트의 정의는 통일돼 있지 않지만, 일련의 작업을 대신 수행하는 AI 기반 소프트웨어(SW)를 주로 말한다. 주어진 명령만 수행하는 게 아니라 자율적으로 작업을 한다는 점에서 기존 챗봇이나 로봇프로세스자동화(RPA) 솔루션과 구별된다. IT리서치 가트너는 자율 에이전트에 대해 인간의 개입 없이 정해진 목표를 달성하는 결합 시스템으로 정의한다.

지난 21일 마이크로소프트(MS)도 영국 런던에서 개최한 'AI투어' 행사에서 '자율 에이전트' 관련 업데이트를 발표했다. '코파일럿 스튜디오'에서 사용자가 자율 에이전트를 직접 생성하는 기능을 내달 퍼블릭 프리뷰로 제공하고, '다이나믹스365'에 10개의 새로운 자율 에이전트를 도입해 영업·서비스·재무·공급망 업무 혁신을 돕는 게 골자다. 각 기업은 자율 에이전트를 맞춤형으로 만들어 쓸 수 있다.

세일즈포스도 지난달 연례 컨퍼런스 '드림포스 2024'를 통해 자율형 AI 에이전트 '에이전트포스'를 공개했다. 실시간 데이터를 기반으로 변화하는 상황에 적응하고 조직의 가이드라인에 따라 독립적으로 작동한다.

이밖에도 글로벌 빅테크와 AI기업들 대다수가 AI에이전트 분야에 뛰어들고 있다. 국내에서도 AI에이전트 바람이 거세다. 네이버는 자사 '하이퍼클로바X' 모델 기반으로 기업들과 협업해 맞춤형 에이전트를 구축·제공하고 있다. 전날 카카오가 공개한 '카나나' 모델은 처음부터 'AI 메이트'로 포지셔닝하고 있다. SK텔레콤도 '에이닷'을 '멀티 LLM 에이전트'라는 PC버전으로도 출시했다. KT와 LG유플러스도 AI에이전트 서비스들을 내놓고 있다. 삼성SDS는 '패브릭스' 플랫폼에 '멀티에이전트' 기능을 추가했다. LG CNS는 금융권 등에서 맞춤형 에이전트 구축사업을 수행하고 있다.

AI에이전트는 산업 전반에서 쓰일 전망이지만, 가장 빠르게 파고드는 곳 중 하나는 SW 개발현장이다. 이날 앤스로픽은 새로운 모델들 모두 코딩 역량이 한층 개선됐다는 점을 강조했다. 특히 '클로드 3.5 소네트'는 SWE벤치마크에서 "오픈AI o1 프리뷰와 같은 추론 모델과 에이전트 코딩용으로 설계된 특수 시스템을 포함한 모든 공개 모델보다 높은 점수를 기록했다고 밝혔다.

오픈AI도 앤스로픽을 견제하기 위해 새로운 도구를 준비 중이다. 코딩에 있어선 오픈AI 모델보다 앤스로픽 모델이 뛰어나다는 평을 의식한 것으로 보인다. 22일 디인포메이션은 오픈AI가 SW 프로그래밍 도구 개선에 더 많은 노력을 기울이고 있으며, MS 비주얼스튜디오코드 등 주요 개발도구에서 AI를 보다 쉽게 사용하거나 더 큰 규모의 개발 작업을 할 수 있는 도구를 개발 중이라고 보도했다. 또, 내부 AI 연구자들을 위한 도구를 이미 개발해 호평받고 있지만, 이를 공개할지는 불분명하다고 덧붙였다.

팽동현기자 dhp@dt.co.kr

Copyright © 디지털타임스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?