큐빅(CUBIG), 차등정보보호 기법 기반의 합성데이터 솔루션 제시

최용석 동아닷컴 기자 2024. 7. 10. 14:30
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

AI 데이터 전문 기업 큐빅(CUBIG, 대표 배호 정민찬)이 민감한 데이터를 안전하게 보호할 수 있는 대안으로 차등정보보호(Differential Privacy) 기법을 적용한 합성데이터 솔루션을 제시했다고 밝혔다.

큐빅 배호 대표는 "현재 합성데이터의 가장 큰 문제점은 원본만큼 성능이 올라오면 보안이 취약해지고, 성능이 낮으면 AI 학습이나 분석에 사용이 불가하다는 점"이라며 "단순한 합성데이터 생성으로는 모든 보안 요소가 충족될 수 없다. 특히 개인정보나 민감한 내용을 포함한 데이터일수록 차등정보보호를 만족하는 형태로 생성되어야 안전하다"고 말했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

사진 출처= ICLR 2024
AI 데이터 전문 기업 큐빅(CUBIG, 대표 배호 정민찬)이 민감한 데이터를 안전하게 보호할 수 있는 대안으로 차등정보보호(Differential Privacy) 기법을 적용한 합성데이터 솔루션을 제시했다고 밝혔다.

큐빅 관계자는 "현재 합성데이터의 가장 큰 문제점은 원본만큼 성능이 올라오면 보안이 취약해지고, 성능이 낮으면 AI 학습이나 분석에 사용이 불가하다는 점”이라며 “데이터가 생성될 때부터 안전한 보안 알고리즘을 함께 적용해 성능을 높이는 것이 필요하다"고 설명했다.

이에 큐빅은 차등정보보호 기법을 적용한 보안 합성데이터 솔루션을 자체 개발했다. 차등정보보호 기법을 기반으로 개발된 큐빅의 합성데이터 솔루션은 성능과 보안성에서 모두 SOTA(State-of-the-Art) 수준을 유지한다. 또한 큐빅의 차등정보보호는 한번 적용되면 이후에도 안전성을 유지한다는 특징을 지닌다.

사진 출처=USENIX Security 23
특히 보안 강화에 있어 법적 위험을 제거하며, 합성데이터로 원본 데이터를 유추할 수 있는 가능성을 최소화한다. 이는 기존 합성데이터의 보안 취약점을 보완하며 데이터 재식별 공격과 재구성 공격에 대한 높은 저항성을 제공한다고 회사 측은 밝혔다.

큐빅 배호 대표는 "현재 합성데이터의 가장 큰 문제점은 원본만큼 성능이 올라오면 보안이 취약해지고, 성능이 낮으면 AI 학습이나 분석에 사용이 불가하다는 점”이라며 “단순한 합성데이터 생성으로는 모든 보안 요소가 충족될 수 없다. 특히 개인정보나 민감한 내용을 포함한 데이터일수록 차등정보보호를 만족하는 형태로 생성되어야 안전하다"고 말했다.

이어 배 대표는 “차등정보보호 기법을 적용한 합성데이터 솔루션을 개발을 계기로 앞으로 국내외 합성 데이터 기술의 선두주자로서 사용자의 프라이버시와 민감정보 보안을 최우선 목표로 하여 글로벌 사업을 확장해 나가겠다"고 덧붙였다.

최용석 동아닷컴 기자 duck8@donga.com

Copyright © 동아일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?