KAIST, 소량의 데이터로 딥러닝 정확도 높이는 기술개발

심영석 기자 2021. 10. 27. 13:00
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

KAIST 전산학부 이재길 교수 연구팀이 딥러닝 훈련 데이터 부족 현상을 완화할 새로운 모델 훈련 기술을 개발했다.

현재 적용되고 있는 방법 대비 최대 12% 정확도를 향상시킨 이 기술은 오는 12월 국제학술대회 '신경정보처리시스템학회 2021'에서 발표될 예정이다.

27일 KAIST에 따르면 이번에 개발된 기술은 심층 학습 모델의 훈련에서 바람직하지 않은 특성을 억제해 충분하지 않은 훈련 데이터를 가지고도 높은 예측 정확도를 달성할 수 있게 해준다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

비선호 특성 억제 방법 활용
기존대비 최대 12% 정확도↑
연구팀에서 개발한 `비선호(比選好) 특성 억제' 방법론의 동작 개념도. (KAIST 제공) © 뉴스1

(대전=뉴스1) 심영석 기자 = KAIST 전산학부 이재길 교수 연구팀이 딥러닝 훈련 데이터 부족 현상을 완화할 새로운 모델 훈련 기술을 개발했다.

현재 적용되고 있는 방법 대비 최대 12% 정확도를 향상시킨 이 기술은 오는 12월 국제학술대회 ‘신경정보처리시스템학회 2021’에서 발표될 예정이다.

27일 KAIST에 따르면 이번에 개발된 기술은 심층 학습 모델의 훈련에서 바람직하지 않은 특성을 억제해 충분하지 않은 훈련 데이터를 가지고도 높은 예측 정확도를 달성할 수 있게 해준다.

연구팀은 바람직하지 않은 특성을 억제하기 위해 분포 외(out-of-distribution) 데이터를 활용했다.

훈련 데이터에 존재하는 바람직하지 않은 특성은 분포 외 데이터에도 존재할 수 있다는 점에 주목했다.

따라서 다량의 분포 외 데이터를 추가로 활용해 여기에서 추출된 특성은 영(0) 벡터가 되도록 심층 학습 모델의 훈련 과정을 규제해 바람직하지 않은 특성의 효과를 억제했다.

연구팀은 이 정규화 방법론을 ‘비선호 특성 억제’라 명명하고, 이를 이미지 데이터 분석의 세가지 주요 문제에 적용했다.

그 결과, 기존 최신 방법론에 비해 이미지 분류 문제에서 최대 12% 예측 정확도를 향상시켰다.

또, 객체 검출 문제에서 최대 3% 예측 정확도가 높아졌으며, 객체 지역화 문제에서는 최대 8% 예측 정확도를 끌어 올렸다.

이재길 교수는 “이 기술이 텐서플로우(TensorFlow) 혹은 파이토치(PyTorch)와 같은 기존의 심층 학습 라이브러리에 추가되면 기계 학습 및 심층 학습 학계에 큰 파급효과를 낼 수 있을 것”이라고 말했다.

km5030@news1.kr

Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.

이 기사에 대해 어떻게 생각하시나요?