AI, `가짜 정보` 막는다…상황에 따라 알아서 업데이트 `척척`

이준기 2024. 3. 14. 19:18
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

최근 AI 기술의 급격한 발전에 힘입어 인간의 능력을 뛰어 넘을 정도로 높은 성능의 AI 모델이 속속 개발되고 있다.

하지만 AI 모델은 시간이 지남에 따라 성능이 점점 떨어져 이전보다 안전하고 신뢰할 수 있는 판단을 내리는 데 한계가 있다.

하지만 시간에 따라 데이터와 정답 레이블 간 결정 경계 패턴이 바뀌는 드리프트 현상이 발생해 과거에 학습했던 AI 모델이 내린 판단이 현재 시점에서는 부정확해져 모델 성능이 점차 악화될 수 있다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

KAIST, 데이터 중심 AI학습 프레임워크 개발
데이터 변화 영향 안 받고, 최적화된 데이터 선택
아이클릭아트 제공
KAIST는 시간에 따른 데이터 분포 변화에 영향받지 않고, 적절한 학습 데이터를 선택해 AI 모델 성능을 유지할 수 있는 데이터 중심의 AI 학습 프레임워크 기술을 개발했다. KAIST 제공

최근 AI 기술의 급격한 발전에 힘입어 인간의 능력을 뛰어 넘을 정도로 높은 성능의 AI 모델이 속속 개발되고 있다. 하지만 AI 모델은 시간이 지남에 따라 성능이 점점 떨어져 이전보다 안전하고 신뢰할 수 있는 판단을 내리는 데 한계가 있다.

실제로, 반도체 공정에서 시간에 따른 장비의 노후화와 주기적인 점검 등으로 센서 데이터 관측값이 지속 변화하는 드리프트 현상이 관측되고 있다. 드리프트는 AI 모델에 사용된 데이터 특성이나 분포가 시간이 지나면서 변화하는 현상을 의미한다. 이런 변화로 인해 AI 모델이 학습한 데이터와 현재의 데이터 간 불일치가 발생해 성능이 저하된다.

이 때문에 지속가능한 AI 학습 기술에 대한 필요성이 커지고 있으며, 시간의 경과에 영향을 받지 않고 최적화된 학습 데이터로 제공함으로써 AI가 정확한 판단을 수행하도록 돕는 기술이 요구되고 있다.

KAIST는 황의종 교수 연구팀이 시간에 따라 데이터 분포가 변화하는 드리프트 환경에서도 AI가 정확한 판단을 내리도록 돕는 새로운 학습 데이터 선택기술을 개발했다고 14일 밝혔다.

일반적으로 AI 모델은 데이터 분포가 변하지 않는 정적인 환경을 가정해 훈련시키고 성능을 테스트하기 때문에 대부분 신뢰할 만한 결과를 얻을 수 있다.

하지만 시간에 따라 데이터와 정답 레이블 간 결정 경계 패턴이 바뀌는 드리프트 현상이 발생해 과거에 학습했던 AI 모델이 내린 판단이 현재 시점에서는 부정확해져 모델 성능이 점차 악화될 수 있다. 이를 주기적으로 개선하지 않으면 결국에는 안전하고 신뢰할 만한 결과를 AI를 통해 얻을 수 없다.

연구팀은 이런 문제를 해결하기 위해 데이터를 학습했을 때 AI모델의 업데이트 정도와 방향을 나타내는 '그래디언트'를 활용한 개념을 도입했다. 드리프트 상황에서 학습에 효과적인 데이터를 선택할 수 있도록 함으로써 데이터의 분포와 결정 경계가 변화해도 AI 모델이 안정적으로 작동하고, 성능을 유지하도록 AI 프레임워크를 구현했다.

이 프레임워크는 변화하는 데이터에 맞춰 모델을 적응시키는 모델 중심의 AI 기법과 달리 데이터 자체를 직접 전처리해 현재 학습에 최적화된 데이터로 바꿔준다. 기존 AI 모델의 종류에 상관없이 쉽게 확장할 수 있고, 시간에 따라 데이터 분포가 변화해도 AI 모델 성능이 안정적으로 유지할 수 있다고 연구팀은 설명했다.

황의종 KAIST 교수는 "AI를 한 번에 잘 학습시키는 것 뿐 아니라, 그것을 변화하는 환경에 따라 계속해서 관리하고 성능을 유지하게 하는 것도 중요하다는 것을 제시한 연구"라며 "AI가 변화하는 데이터에 영향을 받지 않고 성능 저하 없이 활용되는 데 기여할 것"이라고 말했다.

이 연구결과는 지난 2월 캐나다 밴쿠버에서 열린 인공지능 분야 국제학술 대회 '국제 인공지능 학회'에서 발표됐다. 이준기기자 bongchu@dt.co.kr

Copyright © 디지털타임스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?