업스테이지 개발 AI, 최고수준 입증...허깅페이스 거대언어모델 평가 2위

메타 '라마2' 모델 1위 차지

국내 인공지능(AI) 스타트업 업스테이지가 개발한 AI 모델이 글로벌 AI 플랫폼인 허깅페이스에서 운영하는 오픈 거대언어모델(LLM) 리더보드에서 2위를 차지했다.

19일 업스테이지에 따르면 허깅페이스는 다양한 언어와 산업에 대한 LLM을 제공하는 글로벌 AI 플랫폼이다. 오픈(Open)AI의 챗GPT, 구글의 바드 등 초거대AI 모델들과 비견되는 300여개의 AI 모델들이 허깅페이스의 오픈 LLM 리더보드에서 경쟁하고 있다. 매일 수 십 개의 AI 모델들이 업데이트되고 있으며, 리더보드는 모델의 추론과 상식 능력 뿐만 아니라 언어 이해 종합 능력과 환각현상(할루시네이션) 방지 등 생성AI 평가에 꼭 필요한 4가지 지표의 평가 점수 평균으로 최종 순위를 결정한다.

업스테이지는 이달 초 자체 구축한 모델을 허깅페이스의 리더보드에 제출해 성능을 평가 받았다. 그 결과 업스테이지의 모델은 메타의 '라마2' 모델에 이어 평균 64.7점으로 2위를 차지했다. 특히 업스테이지의 모델은 생성AI의 가장 큰 문제점 중 하나인 환각현상 방지 지표에서는 56.5점을 기록해 '라마2' 모델의 52.8점의 평가를 뛰어넘는 결과를 기록했다.

특히 비교적 작은 사이즈인 300억 개 매개변수(30B) 모델 규모에서 1위를 차지했다는 점이 주목 받는다.

65B(650억)이하의 작은 규모 LLM은 1조를 넘는 매개변수를 가진 것으로 알려진 빅테크의 초거대AI와 달리 가벼운 규모로 비용 절감효과가 크고 내부 서버에 설치 및 운영이 가능하다. 이에 개별 기업이 활용할 프라이빗 AI 등 활용성이 높을 것으로 점쳐진다. 이번 업스테이지가 완성한 AI 모델을 통해 기업과 기관들은 정보유출에 대한 부담 없이 생성AI를 자체적으로 구축하고 활용할 수 있을 전망이다.

아울러 업스테이지는 추가적으로 국내 다양한 산업의 기업들의 요구에 부응하기 위해 한국어 데이터를 추가 학습시킬 예정이다. 김성훈 업스테이지의 대표는 "업스테이지의 AI 기술력이 치열한 경쟁을 벌이고 있는 생성AI 글로벌 톱 플랫폼의 평가에서도 세계 최고의 성과를 거둬 무척 기쁘다"며 "이번에 입증된 업스테이지의 기술력을 바탕으로 국내 기업은 물론 전세계 모든 기업들이 AI를 편리하게 사용할 수 있도록 노력할 것"이라고 전했다.

파이낸셜뉴스

IT/과학

업스테이지 개발 AI, 최고수준 입증...허깅페이스 거대언어모델 평가 2위