엔씨, LLM 성능 검증 모델 'VARCO Judge LLM' 출시
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
엔씨소프트는 국내 최초로 거대언어모델(LLM)의 성능과 수행능력을 검증하는 평가모델 'VARCO Judge LLM'을 출시했다고 23일 밝혔다.
VARCO Judge LLM은 다른 LLM이 얼마나 빠르고 정확하게 작업을 수행하는지 검사하는 평가모델이다.
이번 평가모델 출시를 통해 자체 LLM 바르코(VARCO)의 품질 향상과 함께 LLM 모델 평가 분야에서 선도적 위치를 확보한다는 계획이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
엔씨소프트는 국내 최초로 거대언어모델(LLM)의 성능과 수행능력을 검증하는 평가모델 ‘VARCO Judge LLM’을 출시했다고 23일 밝혔다.
VARCO Judge LLM은 다른 LLM이 얼마나 빠르고 정확하게 작업을 수행하는지 검사하는 평가모델이다. 최근 기업들은 시장에서 서비스 중인 다양한 유형, 규모의 LLM 가운데 적합한 모델을 찾기 위해 많은 시간을 소비하고 있다.
이 모델을 사용하면 보다 효과적으로 자사 AI 서비스에 적합한 LLM 모델을 검증할 수 있다. 즉 자사 LLM의 성능 수준을 평가모델로 검증해 타 모델 대비 성능 우위를 증명하거나, 약점을 빠르게 파악해 보강할 수 있다는 얘기다.
VARCO Judge LLM은 우수한 LLM 편향(Bias) 문제해결 능력과 뛰어난 한국어 성능을 자랑한다. 동급 모델 중 가장 높은 성능을 갖췄다. 특히 엔씨는 올해 세계적인 권위를 갖는 자연어처리(NLP) 학회 'EMNLP(Empirical Methods in Natural Language Processing)'에 LLM 평가모델 논문을 게재하며 글로벌 무대에서도 기술력을 입증하기도 했다.
국내 게임사 최초로 자체 언어모델을 개발한 엔씨는 게임 개발 과정과 사내 업무 효율화 전반에 AI 기술을 적극 활용하고 있다. 이번 평가모델 출시를 통해 자체 LLM 바르코(VARCO)의 품질 향상과 함께 LLM 모델 평가 분야에서 선도적 위치를 확보한다는 계획이다.
이연수 엔씨 리서치본부장은 "빠르게 진화하는 AI 시장에서 각자 산업에 맞는 최적의 모델을 선별하고 적용하는 서비스가 더욱 중요해지고 있다"며 "VARCO Judge LLM은 기존 LLM 기반 서비스의 품질 향상을 넘어 AI 비즈니스에서 없어서는 안 될 중요한 도구로 자리매김할 것"이라고 말했다.
강나훔 기자 nahum@asiae.co.kr
Copyright © 아시아경제. 무단전재 및 재배포 금지.
- 31일간 '빅맥'만 썩지 않았다…햄버거 회사가 답한 그 이유[햄버거 썩히기]④ - 아시아경제
- 4년간 女 5명과 결혼·동거…"드라마도 이렇게 못 써" - 아시아경제
- 라면·김밥 주문 후 동전 세더니 '주문 취소'한 모자…"대신 계산했는데 오지랖인가요?" - 아시아
- "靑 가면 죽는다 경고했는데 가겠나"…명태균 녹취파일 추가 공개한 민주당 - 아시아경제
- 이혼 전문 변호사 "율희, 양육권 소송 승산 있다" - 아시아경제
- "설거지·가사도우미로 月160만원 벌며 살아보니" 최강희 고백 눈길 - 아시아경제
- '트럼프 측근' 된 머스크, 美 대선으로 29조원 벌어 - 아시아경제
- '소녀상 모욕' 美유튜버 "내 사과 받아달라" 태도 돌변 - 아시아경제
- "짐 싸 캐나다 간다" 해리스 지지층 '캐나다 이주' 검색량 급증 - 아시아경제
- "감옥 보내고 수백만명 구하자"…北 대표부 건물에 걸린 '죄수 김정은' - 아시아경제