업스테이지 개발 생성 AI, '챗GPT 능가' 평가 받아

(서울=뉴스1) 김승준 기자 = 국내 인공지능(AI) 스타트업 '업스테이지'가 개발한 생성 AI 모델이 오픈AI의 챗GPT의 기반인 GPT-3.5 보다 좋은 성능을 가졌다는 평가를 받았다.

업스테이지는 자사가 개발 생성 AI 모델이 세계 최대 머신러닝 플랫폼 허깅페이스에서 운영하는 '오픈 거대 언어 모델(LLM) 리더보드' 평가 점수에서 72.3점을 획득해 챗GPT의 기반인 GPT-3.5 성능을 뛰어넘어 1위를 차지했다고 1일 밝혔다.

허깅페이스 오픈 LLM 리더보드는 오픈소스 생성 AI 모델의 바로미터로 꼽힌다. 전 세계 500여개의 공개 AI 모델들이 추론과 상식 능력, 언어 이해 종합능력 및 환각현상(할루시네이션) 방지 등 4가지 지표로 평가 받고 있다.

앞서 지난 달 업스테이지가 허깅페이스를 통해 공개한 30B(300억) 매개변수 모델은 평균 67점을 획득해 같은 날 발표된 메타의 '라마(LLaMA) 2' 70B(700억) 매개변수 모델을 추월하고 국내 LLM 최초 1위 달성을 했다.

업스테이지는 더 많은 데이터로 '라마 2' 70B 모델을 파인튜닝한 LLM을 만들었다. 그 결과 새롭게 공개된 업스테이지 70B 모델은 리더보드 평가에서 72.3점을 기록했다. 그 결과 미국 스테빌리티(Stability) AI의 '스테이블 벨루가2' 모델(71.4점)을 제치고 세계 1위를 재탈환했다.

업스테이지의 최신 모델은 챗GPT의 기반이 되는 GPT-3.5의 벤치마크 평가(71.9점) 점수를 넘겼다.

업스테이지에 따르면 허깅페이스 리더보드 기준 GPT-3.5의 점수를 능가한 사례는 업스테이지가 최초다.

업스테이지는 세계적인 경쟁력을 인정받은 자사의 AI 모델 상용화를 통해 본격적인 '프라이빗(Private) AI' 시장 개척에 나선다.

프라이빗AI는 기업 내부 데이터만 학습해 정보 유출을 막는데 특화된 솔루션으로 보안 이슈 등으로 생성 AI 도입을 주저하는 기업들에게 매력적인 대체재로 각광받고 있다.

업스테이지는 "최소 수천억이 넘는 매개변수로 구성된 빅테크 기업의 거대 LLM보다 경량화된 모델 사이즈로 더욱 뛰어난 성능을 제공, 도입 및 운용 비용도 크게 절감할 수 있다"고 설명했다.

김성훈 업스테이지 대표는 "업스테이지의 생성 AI 모델이 챗GPT를 능가하는 성능으로 세계 최고 수준의 기술력을 확인해 기쁘다"며 "앞으로 압도적인 기술력을 바탕으로 국내외 프라이빗AI 시장 지배력 강화에 박차를 가할 것"이라고 말했다.

seungjun241@news1.kr

IT/과학

업스테이지 개발 생성 AI, '챗GPT 능가' 평가 받아