고려대, 한국어 특화 LLM ‘구름3’ 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
고려대 NLP&AI 연구실과 HIAI 연구소가 협력하여 개발한 한국어 특화 LLM인 '구름3(KULLM3)'가 공개됐다.
임희석 고려대 컴퓨터학과 교수가 이끄는 NLP&AI 연구실과 HIAI 연구소는 2023년 6월 'KULLM(구름)'을 처음 공개하며, 지금까지 실제 활용할 수 있는 수준으로 한국어 생성 능력을 향상하는 것을 목표로 했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
고려대 NLP&AI 연구실-HIAI 연구소 협력하여 개발
[이데일리 김현아 기자]고려대 NLP&AI 연구실과 HIAI 연구소가 협력하여 개발한 한국어 특화 LLM인 ‘구름3(KULLM3)’가 공개됐다.
임희석 고려대 컴퓨터학과 교수가 이끄는 NLP&AI 연구실과 HIAI 연구소는 2023년 6월 ‘KULLM(구름)’을 처음 공개하며, 지금까지 실제 활용할 수 있는 수준으로 한국어 생성 능력을 향상하는 것을 목표로 했다.
이를 위해 고품질의 한국어 지시어(instruction) 데이터 셋을 제작하는 데 공을 들였고, 이를 활용해 한국어 지시를 따르는(instruction-following) 능력을 대폭 향상했다.
연구팀은 여러 가지 데스크에 관한 다양한 한국어 데이터 셋을 제작했으며, ‘구름3(KULLM3)’ 모델만을 위한 특수 데이터도 제작했다. 이러한 고품질의 데이터는 Upstage의 SOLAR-10.7B 모델에 적용되어 지시 튜닝(instruction-tuning) 학습을 통해 ‘구름3(KULLM3)’이 탄생했다.
연구팀이 GPT-4-Turbo를 활용하여 분석한 결과 ‘구름3(KULLM3)’의 생성 답변은 기존의 한국어 모델보다 매우 우수했으며, GPT-3.5 Turbo와 GPT-4 Turbo에 준하는 능력을 보였다.
연구팀이 제시한 성능에 따르면 모델이 생성한 답변의 ‘유창성(Fluency)’, ‘응집성(Coherence)’, ‘정확도(Accuracy)’, ‘완결성(Completeness)’, ‘총점(Overall Quality)’ 평가에서 우수한 성능을 보였다.
연구팀은 ‘구름3(KULLM3)’ 모델이 한국어로 된 지시 사항을 이해하고 실행하는 능력이 뛰어남을 강조했고, 이를 활용해 AI 상담 챗봇과 RAG 기반 질의응답시스템 등 다양한 분야에서 활용할 것으로 기대했다.
임희석 고려대 컴퓨터학과 교수는 “요즘 한국어 private LLM과 설치형(On-premise) 방식의 LLM 구축에 관심이 많다”면서 “실질적인 한국어 생성 성능이 월등한 ‘구름3(KULLM3)’가 좋은 대안이 될 수 있을 것이라 기대한다.”라고 밝혔다.
고려대 NLP&AI 연구실과 HIAI 연구소는 매년 자연어처리 분야의 최우수 학술대회에서 국내 최고 수준의 논문을 발표하고, LLM을 이용한 일상의 AI를 위한 연구에 매진하는 등. 국내 인공지능 분야의 선도그룹이다.
김현아 (chaos@edaily.co.kr)
Copyright © 이데일리. 무단전재 및 재배포 금지.
- 파주 호텔서 남녀 4명 사망…이유는 '미스터리' [사사건건]
- “아파트 공원에 개 앉혀두고 뭐하는 짓”…女 만행에 공분
- 7시간 동안 ‘8살 동생’ 맞는 모습 지켜봐…“범인은 무속인 부모”
- “공무원들 촉이 맞았다”…총선 참패, 예견된 밸류업 좌초[최훈길의뒷담화]
- 끈에 몸 묶인 채…서울 한복판서 20대 남성 숨진 채 발견
- 한동훈 “잘 지내세요” 끝인사 했지만…정치권 복귀에 쏠린 눈
- ‘대마초 중독’ 남편의 기막힌 소송, 어떡하죠[양친소]
- 무제한 휴가에 휴가비 200만원까지…‘이 회사’ 정체는[복지좋소]
- ‘순한 개'만 상습 입양해 죽인 20대 ‘구속’…"최종 처벌 수위는?"[댕냥구조대]
- '나혼산' 안재현, 전셋집 공개 "통장에 돈 無…200억 벌기 목표"