"스스로 업데이트 하는 AI" 학습 프레임워크 개발
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
AI를 훈련시키고 성능을 테스트할 때 데이터 분포가 변하지 않는 정적인 환경을 가정하기 때문에 시간이 지남에 따라 성능이 떨어지는 현상이 다수 나타나고 있다.
KAIST는 전기및전자공학부 황의종 교수팀이 AI가 시간흐름에 따라 데이터 분포가 변화하는 드리프트 환경에서도 정확한 판단을 유지하도록 돕는 새로운 학습데이터 선택기술을 개발했다고 14일 밝혔다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
AI를 훈련시키고 성능을 테스트할 때 데이터 분포가 변하지 않는 정적인 환경을 가정하기 때문에 시간이 지남에 따라 성능이 떨어지는 현상이 다수 나타나고 있다.
실제 SK하이닉스 반도체 공정에서 장비 노화와 주기적 점검으로 센서데이터 관측값이 지속적으로 변하는 드리프트 현상이 발견됐다.
이는 시간이 지나면서 데이터와 정답레이블 간 결정경계 패턴이 변해 과거에 학습한 AI 모델의 판단이 현재 시점에서 부정확해지기 때문이다.
KAIST는 전기및전자공학부 황의종 교수팀이 AI가 시간흐름에 따라 데이터 분포가 변화하는 드리프트 환경에서도 정확한 판단을 유지하도록 돕는 새로운 학습데이터 선택기술을 개발했다고 14일 밝혔다.
연구팀은 AI가 데이터를 학습했을 때 모델 업데이트 정도와 방향을 나타내는 그래디언트 개념을 적용해 드리프트 상황에서도 AI가 효과적인 데이터를 선택하는데 도움을 줄 수 있음을 이론 및 실험으로 확인했다.
또 이를 바탕으로 데이터 분포와 결정경계가 변해도 모델을 강건하게 학습시키는 지속가능한 데이터 중심 AI 학습 프레임워크를 제시했다.
학습 프레임워크는 기존 변화하는 데이터에 맞춘 모델 중심 AI 기법과 달리 드리프트의 주요 원인인 데이터 자체를 직접 전처리해 현재 학습에 최적화된 데이터로 바꿔주는 것으로, 기존 AI 모델 종류에 상관없이 쉽게 확장될 수 있는 것이 특징이다.
실제 연구팀은 이 기법으로 실험한 결과 시간에 따라 데이터 분포가 변해도 AI 모델 정확도를 안정적으로 유지함을 확인했다.
황 교수는 “인공지능이 변화하는 데이터에도 성능이 저하되지 않고 유지하는 데에 도움이 되기를 기대한다”고 말했다.
대덕특구=이재형 기자 jh@kukinews.com
Copyright © 쿠키뉴스. 무단전재 및 재배포 금지.
- ‘킬러·준킬러’ 빠진 수능, 작년보다 쉬웠다…최상위권 변별력 비상
- 세 번째 ‘김건희 특검법’ 본회의 통과…야당 단독 처리
- “세대분리 성공해 자립하고 싶어요” 독립제약청년들의 바람 [이상한 나라의 세대분리법⑨]
- 이재명 운명의날 임박하자…친윤·친한, ‘특감’으로 뭉쳤다
- 수능 국어 지문 링크에 ‘尹정권 퇴진’ 집회 일정…수사 의뢰
- 야6당 합심해 김건희 특검법 처리…尹거부권 맞서 재표결 준비
- “수능 수학, 지난해보다 쉽게 출제…미적분·기하 다소 어려워”
- 이재명에 쏠리는 청년층 지지…尹반사효과인가 전략적 성과인가
- 전 세계에 김도영을 알렸다…그를 어찌 막으랴
- ‘손흥민 A매치 130경기’ 한국, 쿠웨이트전 선발 발표