카이스트 연구팀, 인공지능 새 학습 데이터 선택 기술 개발
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
카이스트(KAIST)는 전기및전자공학부 황의종 교수 연구팀이 시간에 따라 데이터의 분포가 변화하는 드리프트 환경에서도 인공지능(AI)이 정확한 판단을 내리도록 돕는 새로운 학습 데이터 선택 기술을 개발했다고 14일 밝혔다.
황의종 교수 연구팀은 이러한 문제를 해결하기 위해 데이터를 학습했을 때 AI 모델의 업데이트 정도와 방향을 나타내는 그래디언트(gradient)를 활용한 개념을 도입해 제시한 개념이 드리프트 상황에서 학습에 효과적인 데이터를 선택하는 데에 도움을 줄 수 있음을 이론적으로 실험적으로 분석했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
[이데일리 한광범 기자] 카이스트(KAIST)는 전기및전자공학부 황의종 교수 연구팀이 시간에 따라 데이터의 분포가 변화하는 드리프트 환경에서도 인공지능(AI)이 정확한 판단을 내리도록 돕는 새로운 학습 데이터 선택 기술을 개발했다고 14일 밝혔다.
하지만 이러한 가정과는 다르게 SK하이닉스의 반도체 공정 과정에서 시간에 따른 장비의 노화와 주기적인 점검으로 인해 센서 데이터의 관측값이 지속적으로 변화하는 드리프트 현상이 관측되고 있다.
시간이 지나면서 데이터와 정답 레이블 간의 결정 경계 패턴이 변경되면 과거에 학습됐던 AI 모델이 내린 판단이 현재 시점에서는 부정확하게 되면서 모델의 성능이 점차 악화될 수 있다.
황의종 교수 연구팀은 이러한 문제를 해결하기 위해 데이터를 학습했을 때 AI 모델의 업데이트 정도와 방향을 나타내는 그래디언트(gradient)를 활용한 개념을 도입해 제시한 개념이 드리프트 상황에서 학습에 효과적인 데이터를 선택하는 데에 도움을 줄 수 있음을 이론적으로 실험적으로 분석했다.
그리고 이러한 분석을 바탕으로 효과적인 학습 데이터 선택 기법을 제안해 데이터의 분포와 결정 경계가 변화해도 모델을 강건하게 학습할 수 있는 지속 가능한 데이터 중심의 AI 학습 프레임워크를 제안했다.
이번 학습 프레임워크의 주요 이점은 기존의 변화하는 데이터에 맞춰서 모델을 적응시키는 모델 중심의 AI 기법과 달리, 드리프트의 주요 원인이라고 볼 수 있는 데이터 자체를 직접 전처리를 통해 현재 학습에 최적화된 데이터로 바꿔줌으로써 기존 AI 모델 종류에 상관없이 쉽게 확장될 수 있다는 점에 있다.
실제로 해당 기법을 통해 시간에 따라 데이터의 분포가 변화됐을 때에도 AI 모델의 성능, 즉 정확도를 안정적으로 유지할 수 있었다.
제1저자인 김민수 박사과정 학생은 “이번 연구를 통해 인공지능을 한번 잘 학습하는 것도 중요하지만 그것을 변화하는 환경에 따라 계속해서 관리하고 성능을 유지하는 것도 중요하다는 사실을 알릴 수 있으면 좋겠다?고 밝혔다. 연구팀을 지도한 황의종 교수는 “AI가 변화하는 데이터에 대해서도 성능이 저하되지 않고 유지하는 데에 도움이 되기를 기대한다”고 말했다.
이번 연구에는 카이스트 전기및전자공학부의 김민수 박사과정이 제1저자, 황성현 박사과정이 제2저자, 그리고 황의종 교수가 교신 저자로 참여했다. 이번 연구는 지난 2월 캐나다 밴쿠버에서 열린 인공지능 최고 권위 국제학술 대회인 ‘국제 인공지능 학회(AAAI)’에서 발표됐다. (논문명: Quilt: Robust Data Segment Selection against Concept Drifts)
한편, 이 기술은 SK하이닉스 인공지능협력센터(AICC)의 지원을 받은 ‘노이즈 및 변동성이 있는 FDC 데이터에 대한 강건한 학습’ 과제 (K20.05) 와 정보통신기획평가원의 지원을 받은 ‘강건하고 공정하며 확장가능한 데이터 중심의 연속 학습’ 과제 (2022-0-00157) 와 한국연구재단의 지원을 받은 ‘데이터 중심의 신뢰 가능한 인공지능’ 과제 성과이다.
한광범 (totoro@edaily.co.kr)
Copyright © 이데일리. 무단전재 및 재배포 금지.
- 전공의 파업에 환자들 `발길 뚝`…빵집도, 약국도 `울상`
- "번호이동해도 50만원 지원 안됩니다"…전환지원금 첫날 혼선
- '2억명이 이용했다'…성인물 1위 '온리팬스', 성장비결은
- 이선균 협박녀, 또 법정에 아기 안고…“계속 데려올 거냐” 묻자
- 500억 신화 ‘장사의 신’ 은현장 “풍비박산…직원 다 나갔다”
- 김흥국 "평소 존경했던 박정희…'건국전쟁'에 감동받아 다큐 제작"
- '네 마녀'도 못 막았다…코스피, 밸류업 타고 2년 만 2700 돌파
- 싫다는데도 “사진 한번만”…비키니 백인女 추행한 중국 남성들(영상)
- "피해자는 궁금하지 않습니다"...출소 앞둔 정준영, 기억해야할 [그해 오늘]
- 비트코인 가격 또 올랐다...7만3800달러 육박