센티언트, AI 코딩 에이전트 정확도 최대 50% 향상 '에보스킬' v1.1.0 공개

서희원 2026. 5. 11. 13:05
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

실패 경험 학습해 재사용 가능한 기술로 축적…Docker·Daytona 기반 원격 실행 환경 지원
사진=센티언트 제공

인공지능 기술이 단순 응답형 서비스를 넘어 실제 업무를 수행하는 '에이전틱 AI(Agentic AI)' 단계로 진화하면서, AI 에이전트의 정확성과 안정성을 확보하는 문제가 산업계 핵심 과제로 떠오르고 있다. 특히 복잡한 워크플로우를 수행하는 과정에서 발생하는 단계별 오류와 예기치 못한 실패는 기업 도입 확대의 주요 한계로 지적되고 있다.

기존 거대언어모델(LLM) 기반 에이전트들은 실패 사례를 체계적으로 학습 자산으로 전환하지 못해 반복적인 오류가 누적되는 문제가 있었다. 이에 따라 실행 과정에서의 실패를 분석하고 이를 재사용 가능한 기술 형태로 축적하는 자가 진화형 프레임워크 필요성이 커지고 있다는 평가다.

오픈소스 AGI(범용 인공지능) 개발 기업 센티언트 랩스(Sentient Labs)는 AI 코딩 에이전트 성능을 최대 50%까지 향상시키는 자가 학습 프레임워크 '에보스킬(EvoSkill)'의 신규 버전 v1.1.0을 공개했다고 밝혔다.

에보스킬은 에이전트가 작업 수행 중 발생한 실패 사례를 분석해 이를 재사용 가능한 구조적 기술(skills)로 자동 변환하는 태스크 애그노스틱(task-agnostic) 기반 프레임워크다. 복합적인 추론과 실행 과정에서 오류가 반복적으로 누적되는 기존 LLM 에이전트의 한계를 개선하기 위해 개발됐다.

기술 핵심은 실행자(Executor), 제안자(Proposer), 스킬 빌더(Skill Builder)로 구성된 '자가 진화 루프(Self-Evolving Loop)' 구조에 있다. 에이전트 실행 과정에서 오류가 발생하면 제안자가 실패 원인을 분석하고 교정 방향을 제시하며, 스킬 빌더가 이를 재사용 가능한 '스킬 플레이북' 형태로 저장한다. 반복 학습이 이어질수록 파편화된 실행 경험은 구조화된 지식으로 축적돼 에이전트의 작업 숙련도를 높이는 방식이다.

최근 글로벌 AI 업계에서는 단순 질의응답을 넘어 실제 개발·운영 업무를 수행하는 AI 에이전트 기술 경쟁이 본격화되고 있다. 특히 소프트웨어 개발 자동화와 업무 생산성 향상을 위한 AI 코딩 에이전트 시장이 빠르게 성장하면서, 에이전트의 오류 감소와 신뢰성 확보가 핵심 경쟁 요소로 꼽히고 있다.

센티언트에 따르면 에보스킬은 주요 성능 평가에서도 개선 효과를 보였다. OfficeQA 벤치마크에서는 정확도가 기존 60.6%에서 67.9%로 7.3%포인트 상승했으며, SealQA에서는 26.6%에서 38.7%로 12.1%포인트 향상됐다. 회사 측은 이를 통해 코딩 에이전트의 전체 성능이 최대 50% 수준까지 개선됐다고 설명했다.

이번 v1.1.0 업데이트에는 엔터프라이즈 환경 활용성을 높이기 위한 기능도 추가됐다. Docker와 Daytona 기반 원격 실행 환경을 지원하며, 프로그램 상태(.claude/)와 루프 상태(.evoskill/)를 분리해 안정성을 강화했다. 또한 OfficeQA 데모 스크립트를 제공해 개발자들의 테스트와 접근성을 높였다.

센티언트는 폴리곤(Polygon) 공동 창업자 샌딥 네일월(Sandeep Nailwal)과 프라모드 비스워나스(Pramod Viswanath) 프린스턴대 교수 등이 설립한 프로젝트다. 회사는 피터 틸(Peter Thiel)의 파운더스 펀드(Founders Fund)를 비롯해 판테라 캐피털(Pantera Capital), 프레임워크 벤처스(Framework Ventures) 등으로부터 총 8,500만 달러(약 1,100억 원) 규모의 시드 투자를 유치한 바 있다.

센티언트 관계자는 “에보스킬은 실패 경험을 통해 스스로 진화하는 에이전틱 AI 시대의 핵심 인프라 역할을 하게 될 것”이라며 “한국을 포함한 아시아 개발자 생태계와 협력을 지속 확대해 나갈 계획”이라고 말했다.

서희원 기자 shw@etnews.com

Copyright © 전자신문. 무단전재 및 재배포 금지.