AI 시대 '데이터 기근' 해결할 K-신기술…빅테크·통신사 '러브콜'

김태현 기자 2024. 9. 3. 12:01
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

"2026~2032년 AI(인공지능)을 교육시킬 데이터가 모두 고갈될 것이다."

생성형 AI 모델 간 경쟁이 치열해지면서 AI를 교육시킬 데이터가 빠르게 소진되고 있다.

생성형 AI 모델이 정교해질 수록 교육에 활용되는 데이터 수는 기하급수적으로 늘어난다.

생성형 AI 교육을 위한 가상의 데이터다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[우리금융그룹 디노랩×유니콘팩토리 '디노스 피알데이']차등정보보호 기술 개발한 큐빅

[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

기존 합성 데이터와 큐빅의 차등정보보호 기술을 활용한 합성데이터(맨 오른쪽) /사진제공=큐빅

"2026~2032년 AI(인공지능)을 교육시킬 데이터가 모두 고갈될 것이다."

미국 민간 연구단체 에포크 AI(EPOCH AI)는 최근 발표한 보고서를 통해 이같이 밝혔다. 생성형 AI 모델 간 경쟁이 치열해지면서 AI를 교육시킬 데이터가 빠르게 소진되고 있다. 생성형 AI 모델이 정교해질 수록 교육에 활용되는 데이터 수는 기하급수적으로 늘어난다. 이른바 '데이터 기근'이다.

데이터 기근을 해결할 해법으로 합성 데이터가 주목 받는다. 생성형 AI 교육을 위한 가상의 데이터다. 부족한 학습 데이터를 채우는 역할이다. 그러나 한계도 있다. 원본 데이터와의 관계에서 오는 딜레마 때문이다. 원본 데이터를 최대한 살려 학습 정확도를 높이자니 정보 유출이 우려된다. 그렇다고 정보 유출을 막기 위해 원본 데이터를 수정하다 보면 학습 정확도가 떨어진다.

큐빅은 차등정보보호 기술로 합성 데이터가 갖는 한계를 극복했다. 정민찬 큐빅 대표는 "원본 데이터의 일부만 가려 활용하는 기존 비식별화 기술과는 근본적으로 다른 방식"이라며 "합성 데이터 해킹 등으로 원본 데이터가 유출될 수 있는 위험성을 완전히 차단할 수 있다"고 말했다.

차등정보보호 기술은 원천적으로 원본 데이터와의 접촉을 차단한다. 정 대표는 "기존 합성 데이터 생성 업체들의 경우 고객에게 직접 원본 데이터를 받아서 합성 데이터를 만들어 준다"며 "큐빅은 차등정보보호 기술을 활용해 원본을 직접 보지 않고, 합성 데이터를 생성한다"고 말했다.

큐빅의 차등정보보호 기술은 원본 데이터를 보는 대신 원본 데이터가 갖고 있는 특성을 활용한다. 예를 들어 30대 여성의 폐암 합성 데이터를 만들 때 병원에서 직접 30대 여성의 폐암 CT(컴퓨터단층촬영) 사진을 받지 않고, 30대 여성의 폐암 위치나 모양 등 특성만을 취합한다.

정 대표는 "이렇게 취합한 특성을 토대로 데이터셋을 만들어 고객에게 전달하면 고객은 데이터셋과 원본을 비교해 최대한 비슷한 합성 데이터를 선택, 생성형 AI를 교육하게 된다"며 "원본 데이터는 고객의 서버에 그대로 보존되기 때문에 원본 유출 위험도 차단된다"고 말했다.

기술력을 인정 받은 큐빅은 많은 파트너들과 협업 중이다. 네이버클라우드와 합성 데이터 솔루션 관련 실증사업(PoC)을 완료했다. 공군, {SK텔레콤)과는 현재 PoC를 진행 중이다.

여러 파트너 중에서도 큐빅의 차등정보보호 기술에 관심을 많이 보이는 건 금융기관이다. 고객의 민감한 개인정보 유출 없이도 생성형 AI를 교육시킬 합성 데이터를 확보할 수 있기 때문이다.

올해 7월 큐빅은 우리금융그룹이 운영하는 스타트업 액셀러레이팅 프로그램 '디노랩'(Digital Innovation Lab) 서울 5기에 선정됐다. 그룹 계열사와 협업을 비롯해 경영 컨설팅, 투자유치 연계 등 다양한 지원을 받을 수 있게 됐다. 우리금융그룹 AI팀과 협력을 진행 중이다.

큐빅은 3일 우리금융그룹(우리금융지주) 디노랩·머니투데이 유니콘팩토리가 서울 우리은행 본점에서 공동 개최한 '디노스 피알데이(Dinno's PR DAY) 2024'에도 참여한다. 큐빅의 공동창업자인 정 대표는 이번 행사에서 그간의 사업 성과와 스케일업 전략에 대한 구상을 발표한다.

[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']

김태현 기자 thkim124@mt.co.kr

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?