유석봉 전남대 교수팀, AI에 대한 적대적 공격 효과적 방어기술 개발

전남대학교는 유석봉 인공지능융합학과 교수팀이 인공지능(AI)에 대한 적대적 공격을 효과적으로 방어하는 기술인 '인텐스 퓨어(Intens Pure)'를 개발했다고 20일 밝혔다.

유 교수팀은 이미지에 가해진 적대적 공격량을 추정하고, 그에 따라 최적화된 강도로 이미지를 정화하는 시각지능 알고리즘을 제안했다.

연구팀이 개발한 '인텐스 퓨어'는 적대적 정화 기술을 통해 AI 모델의 강건성을 높이는 기술이다. 적대적 공격 강도에 따른 최적의 정제량이 존재함을 관찰해 ID 안정성과 속성 일관성을 바탕으로 적대적 공격량을 추정하고, 디퓨전 정제 강도를 조절하는데 사용한다.

정확도 및 복잡도 면에서 효과적인 정화를 위해 입력 이미지를 이산 코사인 변환 기반 2차 이미지로 재구성해 적대적 공격이 주로 가해지는 특정 주파수 영역에 초점을 맞춰 정화하는 2차 도메인 적응 디퓨전 모델을 새롭게 제안한 것이다. 이 기술은 입력 이미지에 가해질 수 있는 적대적 공격량을 정확히 추정하고 적응적으로 처리하는 데도 장점이 있다. 다양한 유형의 적대적 공격 및 데이터베이스 실험을 통해 개발된 기술이 최신 성능의 이미지 정화 방법을 능가하는 결과를 확보했다.

'적대적 공격'이란 눈에 띄지 않는 작은 변화만으로도 AI 시스템이 오도해 잘못된 판단을 내리게 만드는 공격을 말한다. AI 시대의 새로운 위협이다. 이에 따라 AI 시스템의 안전을 보장하기 위해선 적대적 방어 기술 개발이 필수적이다.

이번 연구는 이은기 전남대 인공지능융합학과 시각지능미디어연구실 석사과정, 이문석 석박사통합과정, 윤재현 석사과정 학생이 참여했고, 유석봉 교수가 교신저자로 참여했다.

연구논문은 승인률 10%대 AI 분야 탑 컨퍼런스인 'AI 국제합동회의(IJCAI)' 2024 국제 컨퍼런스에서 올해 8월 공식적으로 발표될 예정이다.

광주=김한식 기자 hskim@etnews.com

전자신문

사회

유석봉 전남대 교수팀, AI에 대한 적대적 공격 효과적 방어기술 개발