큐빅, 차등정보보호 기법 기반 합성데이터 솔루션 개발

안충기 2024. 7. 15. 16:18
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

합성데이터의 한계(사진 출처: USENIX Security 23)

AI 데이터 전문 기업 '큐빅(CUBIG, 대표 배호, 정민찬)'이 민감한 데이터를 안전하게 보호할 수 있는 대안으로써 차등정보보호(Differential Privacy) 기법을 적용한 합성데이터(재현데이터, synthetic data) 솔루션을 자체 개발했다고 밝혔다.

큐빅 관계자는 “기존의 합성데이터는 심각한 보안 취약점을 갖고 있고 보안 조치가 취해지지 않은 합성데이터 솔루션을 사용할 경우 심각한 보안 위험을 야기할 수 있다”며 “규빅의 솔루션에 적용한 차등정보보호 보안 기법은 미국 인구통계국 및 여러 글로벌 빅테크 기업들이 사용하고 있는 안전한 보안 알고리즘 기법으로, 민감한 데이터를 분석하거나 학습할 때 노이즈를 추가해 모든 공격으로부터 샘플 단위의 민감 정보를 안전하게 보호한다”고 밝혔다.

차등정보보호 기법을 기반으로 개발된 큐빅의 합성데이터 솔루션은 성능과 보안성에서 모두 SOTA(State-of-the-Art) 수준을 유지한다. 또한 큐빅의 차등정보보호는 한 번 적용되면 이후에도 안전성을 유지한다는 특징이 있다.

특히 보안 강화에 있어 법적 위험을 제거하며, 합성데이터로 원본 데이터를 유추할 수 있는 가능성을 최소화한다. 이는 기존 합성데이터의 보안 취약점을 보완하며 데이터 재식별 공격과 재구성 공격에 대한 높은 저항성을 제공한다고 회사 측은 전했다.

고양이(사진 출처: ICLR 2024)?

큐빅 배호 대표는 "현재 합성데이터의 가장 큰 문제점은 원본만큼 성능이 올라오면 보안이 취약해지고, 성능이 낮으면 AI 학습이나 분석에 사용이 불가하다는 점”이라며 “단순한 합성데이터 생성으로는 모든 보안 요소가 충족될 수 없고, 특히 개인정보나 민감한 내용을 포함한 데이터일수록 차등정보보호를 만족하는 형태로 생성돼야 안전하다"고 말했다.

이어 배 대표는 “차등정보보호 기법을 적용한 합성데이터 솔루션을 개발을 계기로 앞으로 국내외 합성 데이터 기술의 선두주자로서 사용자의 프라이버시와 민감정보 보안을 최우선 목표로 하여 글로벌 사업을 확장해 나가겠다"고 덧붙였다.

안충기 기자 newnew9@joongang.co.kr

Copyright © 중앙일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?