센티언트, AI 코딩 에이전트 정확도 최대 50% 향상 '에보스킬' v1.1.0 공개

인공지능 기술이 단순 응답형 서비스를 넘어 실제 업무를 수행하는 '에이전틱 AI(Agentic AI)' 단계로 진화하면서, AI 에이전트의 정확성과 안정성을 확보하는 문제가 산업계 핵심 과제로 떠오르고 있다. 특히 복잡한 워크플로우를 수행하는 과정에서 발생하는 단계별 오류와 예기치 못한 실패는 기업 도입 확대의 주요 한계로 지적되고 있다.
기존 거대언어모델(LLM) 기반 에이전트들은 실패 사례를 체계적으로 학습 자산으로 전환하지 못해 반복적인 오류가 누적되는 문제가 있었다. 이에 따라 실행 과정에서의 실패를 분석하고 이를 재사용 가능한 기술 형태로 축적하는 자가 진화형 프레임워크 필요성이 커지고 있다는 평가다.
오픈소스 AGI(범용 인공지능) 개발 기업 센티언트 랩스(Sentient Labs)는 AI 코딩 에이전트 성능을 최대 50%까지 향상시키는 자가 학습 프레임워크 '에보스킬(EvoSkill)'의 신규 버전 v1.1.0을 공개했다고 밝혔다.
에보스킬은 에이전트가 작업 수행 중 발생한 실패 사례를 분석해 이를 재사용 가능한 구조적 기술(skills)로 자동 변환하는 태스크 애그노스틱(task-agnostic) 기반 프레임워크다. 복합적인 추론과 실행 과정에서 오류가 반복적으로 누적되는 기존 LLM 에이전트의 한계를 개선하기 위해 개발됐다.
기술 핵심은 실행자(Executor), 제안자(Proposer), 스킬 빌더(Skill Builder)로 구성된 '자가 진화 루프(Self-Evolving Loop)' 구조에 있다. 에이전트 실행 과정에서 오류가 발생하면 제안자가 실패 원인을 분석하고 교정 방향을 제시하며, 스킬 빌더가 이를 재사용 가능한 '스킬 플레이북' 형태로 저장한다. 반복 학습이 이어질수록 파편화된 실행 경험은 구조화된 지식으로 축적돼 에이전트의 작업 숙련도를 높이는 방식이다.
최근 글로벌 AI 업계에서는 단순 질의응답을 넘어 실제 개발·운영 업무를 수행하는 AI 에이전트 기술 경쟁이 본격화되고 있다. 특히 소프트웨어 개발 자동화와 업무 생산성 향상을 위한 AI 코딩 에이전트 시장이 빠르게 성장하면서, 에이전트의 오류 감소와 신뢰성 확보가 핵심 경쟁 요소로 꼽히고 있다.
센티언트에 따르면 에보스킬은 주요 성능 평가에서도 개선 효과를 보였다. OfficeQA 벤치마크에서는 정확도가 기존 60.6%에서 67.9%로 7.3%포인트 상승했으며, SealQA에서는 26.6%에서 38.7%로 12.1%포인트 향상됐다. 회사 측은 이를 통해 코딩 에이전트의 전체 성능이 최대 50% 수준까지 개선됐다고 설명했다.
이번 v1.1.0 업데이트에는 엔터프라이즈 환경 활용성을 높이기 위한 기능도 추가됐다. Docker와 Daytona 기반 원격 실행 환경을 지원하며, 프로그램 상태(.claude/)와 루프 상태(.evoskill/)를 분리해 안정성을 강화했다. 또한 OfficeQA 데모 스크립트를 제공해 개발자들의 테스트와 접근성을 높였다.
센티언트는 폴리곤(Polygon) 공동 창업자 샌딥 네일월(Sandeep Nailwal)과 프라모드 비스워나스(Pramod Viswanath) 프린스턴대 교수 등이 설립한 프로젝트다. 회사는 피터 틸(Peter Thiel)의 파운더스 펀드(Founders Fund)를 비롯해 판테라 캐피털(Pantera Capital), 프레임워크 벤처스(Framework Ventures) 등으로부터 총 8,500만 달러(약 1,100억 원) 규모의 시드 투자를 유치한 바 있다.
센티언트 관계자는 “에보스킬은 실패 경험을 통해 스스로 진화하는 에이전틱 AI 시대의 핵심 인프라 역할을 하게 될 것”이라며 “한국을 포함한 아시아 개발자 생태계와 협력을 지속 확대해 나갈 계획”이라고 말했다.
서희원 기자 shw@etnews.com
Copyright © 전자신문. 무단전재 및 재배포 금지.
- 韓, 싱가포르·홍콩에 밀려 …암참 “삼성전자 파업 글로벌 공급망·투자 타격”
- 5대 은행 1분기 가계대출 일제히 감소…총량 규제에 '역성장'
- 당근, 7년 만에 英서 철수…'밑빠진 독' 해외 투자 재편 시급
- [인터뷰]정태식 ETRI 본부장 “AI 고속도로는 韓 AI G3 도약 핵심 기반...ETRI가 구축 핵심 역할 할 것
- 韓 지난해 중소형 OLED 점유율 64%…中 경쟁 시작 후 첫 반등
- 무협영화 주인공처럼 폭포 위를 훨훨 날아…中 '선녀 체험' 뭐길래
- 고속도로서 '만취' 상태로 '오토파일럿' 켜놓고 곯아떨어진 테슬라 운전자
- 반도체·조선 상승, 건설은 33개월째 한파…4월 고용보험 가입자 27만명 증가
- 복지부, 시니어 일자리 고도화…기간산업·ESG로 돌아온 '베테랑'
- 트럼프 미디어그룹, 비트코인 투자 실패로 1분기 손실만 6000억