유석봉 전남대 교수팀, AI에 대한 적대적 공격 효과적 방어기술 개발

김한식 2024. 5. 20. 15:01
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

전남대학교는 유석봉 인공지능융합학과 교수팀이 인공지능(AI)에 대한 적대적 공격을 효과적으로 방어하는 기술인 '인텐스 퓨어(Intens Pure)'를 개발했다고 20일 밝혔다.

유 교수팀은 이미지에 가해진 적대적 공격량을 추정하고, 그에 따라 최적화된 강도로 이미지를 정화하는 시각지능 알고리즘을 제안했다.

다양한 유형의 적대적 공격 및 데이터베이스 실험을 통해 개발된 기술이 최신 성능의 이미지 정화 방법을 능가하는 결과를 확보했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

유석봉 전남대 교수팀 논문 그래픽.

전남대학교는 유석봉 인공지능융합학과 교수팀이 인공지능(AI)에 대한 적대적 공격을 효과적으로 방어하는 기술인 '인텐스 퓨어(Intens Pure)'를 개발했다고 20일 밝혔다.

유 교수팀은 이미지에 가해진 적대적 공격량을 추정하고, 그에 따라 최적화된 강도로 이미지를 정화하는 시각지능 알고리즘을 제안했다.

연구팀이 개발한 '인텐스 퓨어'는 적대적 정화 기술을 통해 AI 모델의 강건성을 높이는 기술이다. 적대적 공격 강도에 따른 최적의 정제량이 존재함을 관찰해 ID 안정성과 속성 일관성을 바탕으로 적대적 공격량을 추정하고, 디퓨전 정제 강도를 조절하는데 사용한다.

정확도 및 복잡도 면에서 효과적인 정화를 위해 입력 이미지를 이산 코사인 변환 기반 2차 이미지로 재구성해 적대적 공격이 주로 가해지는 특정 주파수 영역에 초점을 맞춰 정화하는 2차 도메인 적응 디퓨전 모델을 새롭게 제안한 것이다. 이 기술은 입력 이미지에 가해질 수 있는 적대적 공격량을 정확히 추정하고 적응적으로 처리하는 데도 장점이 있다. 다양한 유형의 적대적 공격 및 데이터베이스 실험을 통해 개발된 기술이 최신 성능의 이미지 정화 방법을 능가하는 결과를 확보했다.

'적대적 공격'이란 눈에 띄지 않는 작은 변화만으로도 AI 시스템이 오도해 잘못된 판단을 내리게 만드는 공격을 말한다. AI 시대의 새로운 위협이다. 이에 따라 AI 시스템의 안전을 보장하기 위해선 적대적 방어 기술 개발이 필수적이다.

이번 연구는 이은기 전남대 인공지능융합학과 시각지능미디어연구실 석사과정, 이문석 석박사통합과정, 윤재현 석사과정 학생이 참여했고, 유석봉 교수가 교신저자로 참여했다.

연구논문은 승인률 10%대 AI 분야 탑 컨퍼런스인 'AI 국제합동회의(IJCAI)' 2024 국제 컨퍼런스에서 올해 8월 공식적으로 발표될 예정이다.

광주=김한식 기자 hskim@etnews.com

Copyright © 전자신문. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?