한양대, ‘양자화 인식 지식 증류 학습 기술’ 개발
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
한양대는 최정욱 융합전자공학부 교수 연구팀이 초저정밀도(삼진 양자화) 언어 모델 양자화 인식 훈련을 위한 지식 증류 기법 알고리즘을 개발했다고 23일 밝혔다.
3진 양자화 인식 학습을 위한 토큰 단위 지식 증류 기술은 생성형 언어 모델이 양자화에 보이는 특성을 기반으로 제안됐고, 양자화로 인해 성능 하락으로 이어지는 영향을 최소화한 기술이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
한양대는 최정욱 융합전자공학부 교수 연구팀이 초저정밀도(삼진 양자화) 언어 모델 양자화 인식 훈련을 위한 지식 증류 기법 알고리즘을 개발했다고 23일 밝혔다.
생성형 언어 모델의 추론 연산을 할 때 막대한 저장 공간 및 연산 비용이 필요하다. 가중치 양자화 방식의 압축 기법은 언어 모델의 구조를 유지하면서 모델 가중치를 저장하는 데 사용되는 데이터의 정밀도를 낮추는 방식이다. 이 중 3진 양자화 방식은 모델의 가중치를 -1, 0, 그리고 1까지 총 3가지 값으로만 나타내는 방식이다. 하지만 모델이 가지고 있는 본래의 성능이 크게 떨어진다는 한계가 있다. 이를 보완하기 위해 양자화를 적용한 학생 모델에 지식 증류 기법을 사용해 양자화 인식 학습을 적용하는 방법이 활발히 연구되고 있다.
3진 양자화 인식 학습을 위한 토큰 단위 지식 증류 기술은 생성형 언어 모델이 양자화에 보이는 특성을 기반으로 제안됐고, 양자화로 인해 성능 하락으로 이어지는 영향을 최소화한 기술이다. 이를 통해 기존 지식 증류 기술 대비 더 높은 성능 향상을 끌어낼 수 있었다.
연구팀은 다양한 생성형 언어 모델에 대해서 언어 모델링 및 상식 추론 수행 작업을 통해 TSLD 방법론을 검증했다. 그 결과 3진 양자화를 적용한 모델이 부동 소수점 모델과 비교했을 때 1 미만의 정확도 하락이 나타나는 최고 성능을 기록했다.
임춘한 기자 choon@asiae.co.kr
Copyright © 아시아경제. 무단전재 및 재배포 금지.
- "보약까지 먹였는데…골프광 남편, 같은 아파트 사는 유부녀와 바람났다" - 아시아경제
- "아무리 연습이어도"…옥주현 길거리 흡연 논란에 '시끌' - 아시아경제
- 女에 7번 차이고 '인형'과 결혼한 日 남성, 결혼 6주년 맞았다 - 아시아경제
- '이혼' 김민재, 아내에게 재산분할만 500억?…"추측만 가능" - 아시아경제
- 학부모 채팅방서 만나 불륜…애들 버리고 동거하던 中 커플 '징역형' - 아시아경제
- 48세 연하 여자친구에 "내가 잡은 월척"…美 70대, 알고보니 - 아시아경제
- 세탁기 사려다 당근서 '경악'…판매글에 '알몸' 고스란히 노출한 남성 - 아시아경제
- 축구 경기 중 날벼락…번개 맞은 선수, 끝내 사망 - 아시아경제
- "백종원 믿었는데…" 비추 후기 쏟아진 백종원 축제, 왜? - 아시아경제
- "시동 어떻게 꺼"…'강남 8중 추돌' 무면허 20대, 사고 직후 어머니와 통화 - 아시아경제