KAIST, 연속학습 AI 개발
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
인공지능(AI) 심층신경망 모델의 추천시스템에서 시간이 지남에 따라 사용자의 관심이 변하더라도 변화한 관심 또한 효과적으로 학습할 수 있는 AI 훈련 기술 개발이 요구되고 있다.
KAIST는 전산학부 이재길(사진) 교수 연구팀이 다양한 데이터 변화에 적응하며 새로운 지식을 학습함과 동시에 기존의 지식을 망각하지 않는 새로운 연속 학습 기술을 개발했다고 6일 밝혔다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
최대 14% 정확도 향상 달성
인공지능(AI) 심층신경망 모델의 추천시스템에서 시간이 지남에 따라 사용자의 관심이 변하더라도 변화한 관심 또한 효과적으로 학습할 수 있는 AI 훈련 기술 개발이 요구되고 있다.
사용자의 관심이 급변하더라도 기존 지식을 유지하며 새로운 지식을 축적하는 AI 연속 학습을 가능하게 하는 기술이 국내 연구진에 의해 개발됐다.
KAIST는 전산학부 이재길(사진) 교수 연구팀이 다양한 데이터 변화에 적응하며 새로운 지식을 학습함과 동시에 기존의 지식을 망각하지 않는 새로운 연속 학습 기술을 개발했다고 6일 밝혔다.
최근 연속 학습은 훈련 비용을 줄일 수 있도록 프롬프트(prompt) 기반 방식이 대세를 이루고 있다. 각 작업에 특화한 지식을 프롬프트에 저장하고, 적절한 프롬프트를 입력 데이터에 추가해 심층신경망에 전달함으로써 과거 지식을 효과적으로 활용한다.
이 교수팀은 기존 접근방식과 다르게 작업 간의 다양한 변화 정도에 적응할 수 있는 적응적 프롬프팅(adaptive prompting)에 기반한 연속 학습 기술을 제안했다. 현재 학습하려는 작업이 기존에 학습했던 작업과 유사하다면 새로운 프롬프트를 생성하지 않고 그 작업에 할당된 프롬프트에 추가로 지식을 축적한다. 즉 완전히 새로운 작업이 입력될 때만 이를 담당하기 위한 새로운 프롬프트를 생성하도록 하고 연구팀은 새로운 작업이 들어올 때마다 클러스터링이 적절한지 검사해 최적의 클러스터링 상태를 유지하도록 했다.
연구팀은 이미지 분류 문제에 대해 작업 간의 다양한 변화 정도를 가지는 실세계 데이터를 사용해 방법론을 검증했다. 이 결과 기존 프롬프트 기반 연속 학습 방법론에 비해, 작업 간의 변화 정도가 항상 큰 환경에서는 최대 14%의 정확도 향상을 달성했고, 작업 간의 변화가 클 수도 있고 작을 수도 있는 환경에서는 최대 8%의 정확도 향상을 달성했다.
또 제안한 방법에서 유지하는 클러스터 개수가 실제 유사한 작업의 그룹 개수와 거의 같음을 확인했다. 온라인 클러스터링을 수행하는 비용이 매우 작아 대용량 데이터에도 쉽게 적용할 수 있다.
이재길 교수는 “연속 학습 분야의 새로운 지평을 열 만한 획기적인 방법이며 실용화 및 기술 이전이 이뤄지면 심층 학습 학계 및 산업계에 큰 파급효과를 낼 수 있을 것”이라고 말했다.
이번 연구결과는 국제학술대회 ‘국제머신러닝학회(ICML) 2024’에서 7월 발표됐다. 구본혁 기자
nbgkoo@heraldcorp.com
Copyright © 헤럴드경제. 무단전재 및 재배포 금지.
- 안산, 임시현 금메달 축하 댓글에…누리꾼 “낄끼빠빠” 악플 세례
- “그냥 모니터 때리고 바지에 x싸버리고 싶네”…파랗게 질린 장세에 개미들 패닉 [투자360]
- '미용실 먹튀' 논란 연예인 부부, 이번엔 사기 추가 폭로 나왔다
- “3배 올라도 없어서 못산다” 코로나 재유행 ‘난리’…진단키트 가격 폭등
- "손흥민 말고 김흥민"…클럽 루머 유포자 황당 변명
- 홍혜걸 70억 집·25억 그림…“의사는 돈 벌면 안 되나” 소신발언
- ‘삐약이’ 신유빈, 유종의 미 노린다…브라질 잡고 8강행[파리2024]
- "손흥민, 강남클럽서 3000만원 결제"…허위사실 유포한 업소에 법적 대응
- "SKY 마약동아리 집단성관계도 했다" 버닝썬 뺨 치는 충격 범행
- 김구라 아들 그리 "전 여친과 혼인신고서 작성" 깜짝 발언