앤드루 응 “AI 모델 성능 저하 우려 과장…단기적 위험 없어”

이경탁 기자 2024. 11. 3. 09:32
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

인공지능(AI)이 생성한 데이터를 다시 학습에 활용하면서 성능이 급격히 저하될 것이라는 '모델 붕괴' 우려에 대해 과장됐다는 주장이 나왔다.

생성 AI 기술 확산으로 AI 생성 콘텐츠가 폭증하면서, 웹 데이터를 학습하는 주요 AI 모델들이 성능 저하를 겪을 가능성이 제기돼 왔다.

모델 붕괴 우려는 영국 옥스퍼드대 연구진이 발표한 논문에서 AI가 반복적으로 기계 생성 데이터를 학습하면 결과 품질이 저하된다고 주장한 이후 확산된 바 있다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

앤드류 응 미국 스탠퍼드대 교수가 지난 5월 22일 서울 성북구 한국과학기술연구원(KIST)에서 열린 2024 인공지능(AI) 글로벌 포럼 개회식에서 기조연설하고 있다./뉴스1

인공지능(AI)이 생성한 데이터를 다시 학습에 활용하면서 성능이 급격히 저하될 것이라는 ‘모델 붕괴’ 우려에 대해 과장됐다는 주장이 나왔다.

AI 산업은 막대한 양의 데이터가 필요하지만, 인간이 만든 자료만으로는 수요를 충족하기 어려워 AI 생성 데이터를 활용하고 있다. 생성 AI 기술 확산으로 AI 생성 콘텐츠가 폭증하면서, 웹 데이터를 학습하는 주요 AI 모델들이 성능 저하를 겪을 가능성이 제기돼 왔다.

3일 스탠퍼드대 AI 석학 앤드루 응 교수는 뉴스레터 ‘더배치’에서 “모델 붕괴는 단기적 위험이 아니며, 적절한 데이터 혼합으로 충분히 예방할 수 있다”고 강조했다. 연구에 따르면 훈련 데이터에 인간 생성 데이터를 10%만 포함해도 성능 저하가 크게 감소하는 것으로 나타났다.

응 교수는 “AI 생성 데이터 비율을 세심히 관리하고, 워터마크나 분류 알고리즘 등을 통해 효율적으로 관리할 수 있다”고 설명했다. 이어 “AI 기술의 발전도 문제 해결에 긍정적 요인으로 작용하고 있다”고 덧붙였다.

모델 붕괴 우려는 영국 옥스퍼드대 연구진이 발표한 논문에서 AI가 반복적으로 기계 생성 데이터를 학습하면 결과 품질이 저하된다고 주장한 이후 확산된 바 있다.

- Copyright ⓒ 조선비즈 & Chosun.com -

Copyright © 조선비즈. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?