[#Let's 스타트업] CNAI, 세상에 없던 데이터 합성해 인공지능 학습

이덕주 2022. 9. 18. 17:12
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

"2030년에는 인공지능(AI) 학습에서 합성데이터 사용 비율이 실제 데이터 사용 규모를 넘어설 것입니다."

최근 기자와 인터뷰한 이원섭 CNAI 대표(사진)는 이렇게 말했다. 합성데이터는 실제 데이터가 아닌 AI 학습에 쓰기 위한 목적으로 만들어진 가상 데이터다. 이 대표는 "AI의 세 가지 요소를 데이터, 모델, 시스템이라고 한다면 기업들이 가장 구하기가 어렵고 비용이 많이 드는 것이 데이터"라면서 "데이터가 차지하는 비율이 80% 정도 되는 것으로 분석된다"고 설명했다. AI를 학습시키는 데 쓰이는 데이터 양이 많을수록 AI를 활용한 소프트웨어의 정확도가 높아지지만 데이터를 구하는 것 자체가 비용이 많이 든다. '21세기판 인형 눈 붙이기'라고 하는 데이터 라벨링에 인건비가 높아도 사람이 쓰이는 이유이기도 하다. 이 대표는 "합성데이터를 사용하면 데이터를 모으는 시간과 비용을 줄일 수 있다"면서 "해외에서도 합성데이터 시장이 커지면서 많은 기업이 등장하고 있다"고 설명했다. 'AI.리베리'라는 미국의 합성데이터 스타트업은 2021년 메타(옛 페이스북)에 인수되기도 했다.

합성데이터는 '가짜' 데이터가 아니다. 실제 데이터를 기반해 합성데이터가 만들어지기 때문이다. 예를 들어 빨간색 차량의 측면 사진을 실제 데이터로 가지고 있다면 합성데이터는 이 사진의 색을 바꾸거나 전면·후면 사진으로 바꿔서 만들어낸다.

그는 "합성데이터는 현재 가장 활발하게 적용되고 있는 자율주행이나 로보틱스 분야 외 일반 소매판매 시장, 스마트시티, 국방 영역 등에서 활용 사례가 늘어날 것"이라면서 "다양한 파트너들과 국내외 프로젝트 수행을 통해 합성데이터가 적용 가능한 사업영역을 발굴하는 일에 집중하고 있다"고 밝혔다.

글로벌 정보기술(IT) 시장조사기관 가트너에 따르면 현재 전 세계 합성데이터 시장이 매년 23%씩 성장하고 있으며, 2024년이면 261억달러(약 35조8700억원)에 달할 것으로 전망했다. CNAI는 한국에서 시작해 글로벌 합성데이터 기업으로 성장하는 것이 목표다. 이 대표는 과거 삼성전자에서 개발자로 일했으며, 김보형 최고기술책임자(CTO)도 삼성전자 출신이다. CNAI는 지난 4월 50억원 규모 프리시리즈A 투자를 싱가포르 '센타우리펀드'와 IMM인베스트먼트 등으로부터 유치했다.

[이덕주 기자]

[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?