[에듀플러스]고려대, 한국어 특화 LLM '구름3' 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
임희석 고려대 컴퓨터학과 교수가 이끄는 NLP&AI 연구실과 HIAI연구소는 한국어 특화 LLM(Large language model) '구름3(KULLM3)'을 12일 공개했다.
임 교수는 "요즘 한국어 private LLM과 On-premise 방식의 LLM 구축에 관심이 많다"며 "실질적인 한국어 생성 성능이 월등한 '구름3'가 좋은 대안이 될 수 있을 것"이라고 말했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
임희석 고려대 컴퓨터학과 교수가 이끄는 NLP&AI 연구실과 HIAI연구소는 한국어 특화 LLM(Large language model) '구름3(KULLM3)'을 12일 공개했다. 실제 활용할 수 있는 수준으로 한국어 생성 능력을 향상하는 것을 목표로 했다.
연구팀은 고품질 한국어 지시어(instruction) 데이터 셋을 제작하는 데 공을 들였다. 이를 활용해 한국어 지시를 따르는(instruction-following) 능력을 향상했다. 연구팀은 여러 가지 데스크에 관한 다양한 한국어 데이터 셋을 제작하고, 구름3 모델만을 위한 특수 데이터도 제작했다. 고품질 데이터는 Upstage의 SOLAR-10.7B 모델에 적용돼 지시 튜닝(instruction-tuning) 학습을 통해 '구름3(KULLM3)'이 탄생했다.
GPT-4-Turbo를 활용해 분석한 결과 구름3의 생성 답변은 기존 한국어 모델보다 매우 우수했다. 연구팀이 제시한 성능에 따르면 모델이 생성한 답변의 △유창성(Fluency) △응집성(Coherence) △정확도(Accuracy) △완결성(Completeness) △총점(Overall Quality) 평가에서 우수한 성능을 보였다.
연구팀은 구름3 모델이 한국어로 된 지시 사항을 이해하고 실행하는 능력이 뛰어난 것으로 봤다. 이를 활용해 AI 상담 챗봇과 RAG 기반 질의응답시스템 등 다양한 분야에서 활용할 것으로 기대하고 있다.
임 교수는 “요즘 한국어 private LLM과 On-premise 방식의 LLM 구축에 관심이 많다”며 “실질적인 한국어 생성 성능이 월등한 '구름3'가 좋은 대안이 될 수 있을 것”이라고 말했다.
이지희 기자 easy@etnews.com
Copyright © 전자신문. 무단전재 및 재배포 금지.
- 尹 국정기조 변화 불가피…의료개혁 등 브레이크
- 총선 패배로 멈춘 '尹 3대 개혁'… “도어스테핑 재개로 민심 소통 물꼬 터야”
- LG전자, 헬스케어 데이터 기반 신기술 살핀다
- 한국지역정보개발원-한국지방재정학회, 데이터 기반 지방재정 정책 활성화 맞손
- 아이폰15부터 수리비 저렴해진다… “중고부품 수리 가능”
- 정부, 4차 클라우드 기본계획 착수…AI 시대 클라우드 대비한다
- '16조원 횡령' 베트남 초대형 금융사기범, 결국 '사형' 선고
- 애플, AI 칩으로 맥 라인업 전면 개편… “주가 4.3% 상승”
- 한은, 기준금리 연 3.50% 유지…10회 연속 동결
- 태평양 무인도에 나타난 영화 같은 'HELP' 신호는 무엇?