UNIST "AI 개인정보 침해…연합학습 기술로 막는다"

김용태 2024. 8. 1. 14:48
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

울산과학기술원(UNIST)은 사용자의 개인정보를 보호하면서도 인공지능(AI) 성능을 높일 수 있는 기술을 개발했다고 1일 밝혔다.

UNIST에 따르면 인공지능대학원 윤성환 교수팀은 '연합학습'(Federated Learning)을 활용한 'FedGF'(Federated Learning for Global Flatness) 기술을 만들었다.

이에 연구팀은 연합학습에서 사용자가 학습하는 로컬 모델뿐만 아니라 글로벌 모델의 일반화 성능을 높일 수 있는 방법을 개발했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

다양한 데이터 분포서 높은 성능…"IT·의료 분야서 역할"
UNIST 윤성환 교수팀 [울산과학기술원 제공. 재판매 및 DB 금지]

(울산=연합뉴스) 김용태 기자 = 울산과학기술원(UNIST)은 사용자의 개인정보를 보호하면서도 인공지능(AI) 성능을 높일 수 있는 기술을 개발했다고 1일 밝혔다.

UNIST에 따르면 인공지능대학원 윤성환 교수팀은 '연합학습'(Federated Learning)을 활용한 'FedGF'(Federated Learning for Global Flatness) 기술을 만들었다.

딥러닝 모델을 학습하기 위해서는 데이터를 중앙 서버에 모으는데, 이 과정에서 사용자가 가진 데이터를 활용하게 된다.

이때 사용자의 개인정보를 침해할 우려가 있다

이를 해결하기 위해 등장한 연합학습 기술은 사용자가 가진 데이터를 중앙 서버로 보내는 것이 아니라 사용자 본인의 데이터를 활용해 딥러닝 모델을 학습하고, 학습된 모델을 중앙 서버에 보내는 것이다.

이때 중앙 서버는 각 사용자의 데이터를 확인할 수 없기 때문에 개인정보가 보호될 수 있다.

그러나 실제 환경에서는 각 사용자의 데이터 이질성으로 딥러닝 모델 성능에 악영향을 주고 있다.

이에 연구팀은 연합학습에서 사용자가 학습하는 로컬 모델뿐만 아니라 글로벌 모델의 일반화 성능을 높일 수 있는 방법을 개발했다.

다양한 사용자 데이터 분포 상황에서도 일관되게 높은 성능을 낼 수 있도록 한 것이다.

일반화 성능은 딥러닝 모델을 학습시킨 데이터 분포가 변했을 때 모델의 성능이 얼마나 차이 나는지 확인할 수 있는 지표다.

연구팀은 FedGF가 기존 방법보다 적은 통신 자원으로도 완전한 학습이 가능해 와이파이와 같은 무선 통신을 사용하는 모바일 장치에 특히 유리하다고 설명했다.

윤성환 교수는 "연합학습 기술은 AI로 인한 개인정보 침해 문제 해결의 핵심적인 발판이 될 것"이라고 말했다.

제1저자 이태환 연구원은 "기업은 FedGF 기술로 개인정보 침해 없이 높은 성능의 AI 모델을 얻을 수 있다"며 "IT, 의료, 자율주행 등 다양한 분야에서 주요 역할을 할 것"이라고 덧붙였다.

연구 결과는 국제 학술대회 'ICML'(International Conference on Machine Learning)에 7월 20일 온라인으로 게재됐다.

연구는 과학기술정보통신부 지원 정보보호 국제공동연구 및 정보통신방송혁신인재양성사업을 통해 이뤄졌다.

yongtae@yna.co.kr

▶제보는 카톡 okjebo

Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지

이 기사에 대해 어떻게 생각하시나요?