올거나이즈, 한국어 문서 생성·요약 특화 모델 출시

김미정 기자 2024. 6. 3. 11:14
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

한국어 문서 생성과 요약을 전문으로 하는 경량화 언어모델이 등장했다.

올거나이즈(대표 이창수)는 한국어 실무용 모델 '알파-인스트럭트'를 출시한다고 3일 밝혔다.

올거나이즈는 알파-인스트럭트 모델이 한국어 이해도가 높아 문서 생성과 요약 등 실무에 특화됐다는 입장이다.

 올거나이즈의 알파-인스트럭트 모델은 글쓰기 및 이해 부분에서 타 모델보다 높은 점수를 보였다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

'알파-인스트럭트' 오픈소스로 공개…"한국어 추론·글쓰기 점수도 높아"

(지디넷코리아=김미정 기자)한국어 문서 생성과 요약을 전문으로 하는 경량화 언어모델이 등장했다. 

올거나이즈(대표 이창수)는 한국어 실무용 모델 '알파-인스트럭트'를 출시한다고 3일 밝혔다. 

알파-인스트럭트 모델은 메타 오픈소스 모델 '라마3'로 이뤄졌다. 매개변수 80억 개로 구성됐다. 한국어를 잘 이해할 수 있도록 라마3를 개량한 모델과 지시사항을 따르는데 특화된 라마3의 인스트럭트 모델을 결합해 제작됐다.

올거나이즈는 한국어 실무용 모델 '알파-인스트럭트'를 출시했다.

보편적인 답변 선호도를 반영한 지시사항 데이터셋 2천 개를 추가 학습시켰다. 동일 대답 반복, 불필요한 영어 대답 등의 오류를 최소화한 셈이다.

올거나이즈는 알파-인스트럭트 모델이 한국어 이해도가 높아 문서 생성과 요약 등 실무에 특화됐다는 입장이다. 한국어 언어모델의 다분야 사고력을 측정하는 리더보드 '로지코'에서도 높은 점수를 기록했다는 설명도 덧붙였다. 로지코는 한국어 추론, 수학, 글쓰기, 코딩, 이해 등의 요소를 점수 매긴다. 올거나이즈의 알파-인스트럭트 모델은 글쓰기 및 이해 부분에서 타 모델보다 높은 점수를 보였다.

올거나이즈는 알파-인스트럭트 모델을 오픈소스로 공개했다. 라이센스 제한 없이 누구나 자유롭게 사용 가능하다. 올거나이즈의 알리 플랫폼 내에서 알파-인스트럭트 모델을 사용할 수 있다. 기업 맞춤형 특화모델로 파인튜닝하거나 모델을 내부 데이터에 연결해 검색증강생성(RAG) 솔루션과 결합할 수 있다.

이창수 올거나이즈의 대표는 "완성도 높은 한국어 모델을 만들기 위해 공들여 데이터셋을 구성하고, 다양한 방법론들에 대한 수많은 테스트를 거침으로써 극히 적은 리소스만으로 성능 좋은 모델을 만들 수 있었다"며 "앞으로 최신 오픈소스 모델의 성능을 계속 평가하고, 고객이 효율적으로 잘 활용할 수 있는 모델을 지속적으로 만들어 나갈 것"이라고 밝혔다.

김미정 기자(notyetkim@zdnet.co.kr)

Copyright © 지디넷코리아. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?