인텔리콘연구소, 법률 특화 sLLM '코알라' 개발…할루시네이션 방지

손지혜 2024. 2. 23. 17:33
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

인텔리콘연구소는 한국 법률에 특화된 언어모델(sLLM)인 '코알라(KOALLA, Korean Adaptive Legal Language AI)' 개발에 성공했다고 23일 발표했다.

인텔리콘은 미국의 거대언어모델 API를 이용하는 대신 한국 법률에 특화된 거대언어모델을 직접 적용함으로써 보안 문제를 해결하고 서비스 정확도를 높일 수 있을 것으로 기대했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

인텔리콘연구소는 한국 법률에 특화된 언어모델(sLLM)인 '코알라(KOALLA, Korean Adaptive Legal Language AI)' 개발에 성공했다고 23일 발표했다.

이번에 개발한 '코알라1.0'은 리걸테크의 다양한 응용 서비스에 적용될 수 있다. 기업이나 로펌의 대용량 문서를 기반으로 하는 생성AI(RAG) 시스템에도 장착이 된다. 기업의 다양한 환경과 요구에 부응하는 온-프레미스(On-Premise) 또는 설치형(Appliance) 방식의 법률특화 생성AI 도입이 가능해진다.

코알라는 메타의 Llama-2를 파인튜닝해 개발됐다. 인텔리콘은 코알라의 성능을 높이기 위해 직접선호최적화(DPO) 기법 외에도 학습 데이터 구성 자체를 최적화하는 데이터 재규격화(Renormalization) 기술을 개발해 추가 학습에 사용했다. 수 백만개의 법률, 판례, 상담자료, 주석자료 등을 기반으로 학습 데이터 규격화 작업을 한 후, 성능향상에 도움이 되는 데이터만을 선별해 재규격화했다.

인텔리콘은 미국의 거대언어모델 API를 이용하는 대신 한국 법률에 특화된 거대언어모델을 직접 적용함으로써 보안 문제를 해결하고 서비스 정확도를 높일 수 있을 것으로 기대했다.

임영익 인텔리콘 대표는 “개발과정에서 모델성능의 본질은 모델 자체가 아니라 데이터에 있다는 결론을 내렸다”며 “앞으로 다른 모델도 활용해 코알라2.0 개발 및 고도화를 진행하고 경량모델 블랜딩(Blending) 기술을 적용해 거대언어모델에 근접시키는 '앙상블 브레인'을 개발할 계획”이라고 말했다.

손지혜 기자 jh@etnews.com

Copyright © 전자신문. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?