"우리 AI, 뭘로 공부하나"...'데이터 기근' 해결할 이 기술

김태현 기자 2024. 9. 18. 17:01
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

AI(인공지능) 시대 데이터 기근을 해결할 해법으로 합성 데이터가 주목 받는다.

생성형 AI 교육을 위한 가상의 데이터다.

예를 들어 30대 여성의 폐암 합성 데이터를 만들 때 병원에서 직접 30대 여성의 폐암 CT(컴퓨터단층촬영) 사진을 받지 않고, 30대 여성의 폐암 위치나 모양 등 특성만을 취합한다.

큐빅 기술력에 가장 관심을 보이는 분야는 데이터 보안이 중요한 금융기관과 대기업 등이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[우리금융그룹 디노랩×유니콘팩토리 '디노스 피알데이']정민찬 큐빅 대표

[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

AI(인공지능) 시대 데이터 기근을 해결할 해법으로 합성 데이터가 주목 받는다. 생성형 AI 교육을 위한 가상의 데이터다. 부족한 학습 데이터를 채우는 역할이다.

그러나 한계도 있다. 원본 데이터와의 관계에서 오는 딜레마 때문이다. 원본 데이터를 정확도를 높이자니 정보 유출이 우려된다. 그렇다고 정보 유출을 막기 위해 원본 데이터를 수정하다 보면 학습 정확도가 떨어진다.

큐빅은 차등정보보호 기술로 합성 데이터가 갖는 한계를 극복했다. 차등정보보호 기술은 원본 데이터 일부만 가려 활용하는 기존 비식별화 기술과는 근본적으로 다른 방식이다. 원본 데이터에 직접 접근하지 않고, 원본 데이터의 특성만으로 합성 데이터를 생성한다.

예를 들어 30대 여성의 폐암 합성 데이터를 만들 때 병원에서 직접 30대 여성의 폐암 CT(컴퓨터단층촬영) 사진을 받지 않고, 30대 여성의 폐암 위치나 모양 등 특성만을 취합한다.

큐빅 기술력에 가장 관심을 보이는 분야는 데이터 보안이 중요한 금융기관과 대기업 등이다. 네어비클라우드와 실증사업(PoC)을 완료했으며 현재는 공군과도 PoC를 진행하고 있다.

큐빅의 기술력 인정한 우리금융그룹(우리금융지주)은 자사 스타트업 액셀러레이팅 프로그램 '디노랩(Digital Innovation Lab)' 서울 5기 기업으로 선정됐다.

우리금융그룹이 바라본 큐빅의 성장 잠재력은 무엇일까. 머니투데이 '유니콘팩토리'가 '디노스 피알데이(Dinno's PR DAY) 2024'에 참석한 정민찬 큐빅 대표를 직접 만나 들어봤다.

정민찬(오른쪽) 큐빅 대표 /사진=머니투데이DB

[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']

김태현 기자 thkim124@mt.co.kr

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?